網(wǎng)頁信息收集器是一款綠色小巧,功能實(shí)用的
網(wǎng)頁信息采集軟件。Internet上有著極其龐大的資源信息,各行各業(yè)的信息無所不有,網(wǎng)頁信息收集器可以很方便的針對(duì)某個(gè)網(wǎng)站的信息內(nèi)容進(jìn)行收集。如某個(gè)論壇的所有注冊(cè)會(huì)員的E-MAIL列表、某個(gè)行業(yè)網(wǎng)站的企業(yè)名錄、某個(gè)下載網(wǎng)站上所有軟件列表等等。操作簡(jiǎn)單方便,更容易為普通用戶所掌握,有需求的用戶不妨下載體驗(yàn)!

功能特色
1、執(zhí)行任務(wù)
根據(jù)已建立的任務(wù)信息保存、提取網(wǎng)頁,也可通過“雙擊”某項(xiàng)任務(wù)啟動(dòng)此功能

2、新建、復(fù)制、修改、刪除任務(wù)
新建、復(fù)制、修改、刪除任務(wù)信息

3、默認(rèn)選項(xiàng)
設(shè)置默認(rèn)工作路徑(默認(rèn)為當(dāng)前程序目錄下的WorkDir文件夾)
設(shè)置默認(rèn)提取測(cè)試數(shù) (默認(rèn)為10)
設(shè)置默認(rèn)文本分隔符 (默認(rèn)為 *)

4、新建、編輯任務(wù)信息
任務(wù)名稱:在默認(rèn)的工作文件夾下生成以此命名的文件夾。
登錄地址:針對(duì)某些需要登錄才能查看其網(wǎng)頁內(nèi)容的網(wǎng)站,填寫登錄頁面地址。在執(zhí)行任務(wù)時(shí),軟件會(huì)打開此登錄頁面讓您登錄該網(wǎng)站
序數(shù)格式類型網(wǎng)頁、非序數(shù)格式類型網(wǎng):
這里的序數(shù)格式、非序數(shù)格式主要是指提取地址是否僅僅是數(shù)字的變化。例如類似于:
①http://xxx.com/1.html 和 http://xxx.com/2.html 就屬于序數(shù)格式
②http://xxx.com/abc.html 和 http://xxx.com/def.html 則屬于非序數(shù)格式
列表地址:在類型為“非序數(shù)格式類型網(wǎng)”時(shí),第一頁列表的鏈接地址
提取地址:由實(shí)際保存的網(wǎng)頁地址共同部分 + * 號(hào)組成。
例如要提取:
①http://xxx.com/1.html 和 http://xxx.com/2.html 則提取地址為 http://xxx.com/*.html
②http://abc.xxx.com/abc.html 和 http://test.xxx.com/def.html 則提取地址為 http://*.xxx.com/*.html
翻頁地址:為列表網(wǎng)頁上的“下一頁”鏈接地址,將其中變化的部分用 * 號(hào)代替。
頁數(shù)起始:要開始提取的頁數(shù)
頁數(shù)截止:要停止提取的頁數(shù)
當(dāng)前頁數(shù):當(dāng)前已經(jīng)提取到的頁數(shù)
已保存網(wǎng)頁數(shù):已經(jīng)保存的網(wǎng)頁數(shù)
任務(wù)詳細(xì)描述:該任務(wù)的詳細(xì)描述信息
網(wǎng)友評(píng)論