係統之家 - 係統光盤下載網站!

  • 軟件介紹
  • 軟件教程
  • 人氣下載
  • 下載地址
  • 網友評論

  火車采集器是一款功能非常強大的數據采集器,它完美支持采集所有編碼格式的網頁,程序還可以自動識別網頁編碼,還支持目前所有主流和非主流的CMS,BBS等網站程序,通過係統的發布模塊能實現采集器和網站程序間的完美結合。

火車采集器

功能介紹

  1、通用性強

  無論新聞、論壇、視頻、黃頁、圖片、下載類網站,隻要通過瀏覽器能看到的結構化的內容,通過指定匹配規則,都能采集到您所需要的內容。

  2、穩定、高效

  五年磨一劍,軟件不斷更新進步,采集速度快,性能穩定,占用資源少。

  3、擴展性強、適用範圍廣

  自定義web發布,自定義主流的數據庫的保存和發布,自定義本地php及。net外部編程接口處理數據,讓數據都能為你所用。

  4、支持所有網站編碼

  完美支持采集所有編碼格式的網頁,程序還可以自動識別網頁編碼。

  5、多種發布方式

  支持目前所有主流和非主流的CMS,BBS等網站程序,通過係統的發布模塊能實現采集器和網站程序間的完美結合。

  6、全自動

  無人值守工作,配置好程序後,程序將依據您的設置自動運行,完全無需人工幹預。

  7、本地編輯

  本地可視化編輯已采集的數據。

  8、采集測試

  這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結果並測試發布。

  9、管理方便

  使用站點+任務方式管理采集節點,任務支持批量操作,再多的數據管理也很輕鬆。

軟件特色

  1、規則自定義

  通過采集規則的定義,可以搜索所有網站采集幾乎任何類型的信息。

  2、多任務,多線程

  可以同時進行多個信息采集任務,每個任務可以使用多個線程。

  3、所見即所得

  任務采集過程所見即所得,過程中遍曆的鏈接信息、采集信息、錯誤信息等都會及時的反映在軟件界麵中。

  4、數據保存

  數據邊采集邊自動保存到關係數據庫中,並且數據結構能夠自動適應,軟件可以根據采集規則自動創建數據庫,以及其中的表和字段,也可以通過導庫方式靈活的將數據保存到客戶已有的數據庫結構中。

  5、斷點續采

  信息采集任務可以在停止後從斷點開始繼續采集,從此你用不再擔心你的采集任務意外中斷了。

  6、網站登錄

  支持網站Cookie,支持網站可視化登錄,即使登錄時需要驗證碼的網站也能采集。

  7、計劃任務

  通過這個功能可以讓你的采集任務定時、定量或者一直循環執行。

  8、采集範圍限製

  可以根據采集的深度和網址的標識來限製采集的範圍。

  9、文件下載

  可以將采集到的二進製文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結果數據庫中。

  10、結果替換

  可以將采集的結果根據規則替換成你定義的內容。

  11、條件保存

  可以根據某個條件來決定那些信息保存,那些信息過濾。

  12、過濾重複內容

  軟件可根據用戶設置和實際情況對重複內容和重複網址自動刪除重複內容。

  13、特殊鏈接識別

  運用此功能可以將用JavaScript動態生成的鏈接或其他更古怪的連接識別出來。

  14、數據發布

  可以通過自定義接口,將已采集的結果數據發布到任意的內容管理係統和指定數據庫中。現在已支持的目標發布媒體包括:數據庫(access, sql server,my sql,oracle) ,靜態htm文件。

  15、預留編程接口

  定義多個編程接口,用戶可以在事件中利用PHP,C#語言進行編程,擴充采集功能。

更新日誌

  1、★ 列表頁新增“地址處理”功能。

  內容替換/排重

  可以對網址中內容進行替換,且替換完成後,重複的網址會自動去重。

  純正則替換

  可以使用正則表達式進行匹配,和內容替換功能類似。

  字符編碼處理

  網址中有需要轉碼的內容,比如采到的鏈接裏有 & 可以進行解碼。

  2、★新增“請求失敗數”的預警條件設置。

  3、★下載圖片命名,新增[記錄自增Id]格式。

  記錄自增ID:同一個內容頁中,多個標簽設置記錄自增ID,那麽多個標簽都是從1開始自增,再次測試運行又會重新開始從1自增,更換個內容頁測試運行,也是從1開始自增。

  自增ID:設置自增ID是采集器啟動後運行,開始一個自增ID,從1開始自增,之後就是自增。重啟采集器後,又會重新開始自增ID,從1開始自增。

  4、★修複圖片下載誤判斷問題★。

  5、★修複計劃任務中“每天調度”,起始運行時間配置未生效的問題。

  6、★ 修複PHP插件,對於循環記錄的處理報錯的問題。

  7、★修複拚音首字母對於一些錯誤字符的判斷問題。

  8、★任務批量編輯,修複“發布”中“多網站亂序發布”未能複製的問題。

  9、★修改“循環添加新記錄”配置後,修複數據格式選擇錯誤的問題。

  10、★修複循環記錄中列表頁標簽被多次處理的問題。

  11、★修複對於一些302跳轉地址,無法正確跳轉的問題。

  12、★修複一些網址無法正確請求的問題。

人氣下載

更多+

最新軟件

專題推薦

火車采集器正在下載,用戶還下載了

關閉

火車采集器正在下載,用戶還下載了

關閉