HOME 首頁(yè)
SERVICE 服務(wù)產(chǎn)品
XINMEITI 新媒體代運(yùn)營(yíng)
CASE 服務(wù)案例
NEWS 熱點(diǎn)資訊
ABOUT 關(guān)于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    網(wǎng)頁(yè)文字抓取工具(網(wǎng)頁(yè)文字抓取工具手機(jī)版)

    發(fā)布時(shí)間:2023-03-11 14:51:12     稿源: 創(chuàng)意嶺    閱讀: 178        問(wèn)大家

    大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于網(wǎng)頁(yè)文字抓取工具的問(wèn)題,以下是小編對(duì)此問(wèn)題的歸納整理,讓我們一起來(lái)看看吧。

    創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,相關(guān)業(yè)務(wù)請(qǐng)撥打電話:175-8598-2043,或添加微信:1454722008

    本文目錄:

    網(wǎng)頁(yè)文字抓取工具(網(wǎng)頁(yè)文字抓取工具手機(jī)版)

    一、找一中文軟件工具:可以保存復(fù)制多個(gè)網(wǎng)頁(yè)信息,一次粘貼到WORD文檔

    軟件太多了:

    1. WebZip 7.03 中文語(yǔ)言包

    WebZip 把一個(gè)網(wǎng)站下載并壓縮到一個(gè)單獨(dú)的 ZIP 文件中,可以幫您將某個(gè)站臺(tái)全部或部份之資料以ZIP格式壓縮起來(lái),可供你日后快速瀏覽這個(gè)網(wǎng)站。且新一版的功能包括可排定時(shí)間來(lái)下載,亦加強(qiáng)相當(dāng)漂亮的立體界面及傳輸?shù)那€圖。

    2. 網(wǎng)站全額下載器 2002

    “網(wǎng)站全額下載器”是一個(gè)離線瀏覽的最佳工具。只要幾分鐘就可以將一個(gè)網(wǎng)站全部下載。包括網(wǎng)站內(nèi)的圖片、文字、程序、軟件.....等。所以這也是研究別人網(wǎng)站的最好幫手。

    3. WebZip 7.0.3

    WebZip 把一個(gè)網(wǎng)站下載并壓縮到一個(gè)單獨(dú)的 ZIP 文件中,可以幫您將某個(gè)站臺(tái)全部或部份之資料以ZIP格式壓縮起來(lái),可供你日后快速瀏覽這個(gè)網(wǎng)站。且新一版的功能包括可排定時(shí)間來(lái)下載,亦加強(qiáng)相當(dāng)漂亮的立體界面及傳輸?shù)那€圖。

    4. 離線瀏覽助理Webdup 0.93 Beta

    Webdup能夠把您想要瀏覽的信息(如網(wǎng)頁(yè)和圖片等)預(yù)先下載下來(lái),保存在本地硬盤(pán),使您可以從本地進(jìn)行離線瀏覽,這樣不僅可以大大減少上網(wǎng)時(shí)間,降低上網(wǎng)費(fèi)用,還可以加快瀏覽速度;并且將來(lái)無(wú)須上網(wǎng)就可以很方便地查閱這些信息。不僅如此, Webdup更提供了備份歷次下載記錄和比較完善的管理功能,使您能夠方便地分類保存和管理有價(jià)值的下載信息。 Webdup的當(dāng)前版本實(shí)現(xiàn)了以下功能:1.支持HTTP和FTP下載,并支持HTTP和Socks5代理服務(wù)器;2.支持多線程下載;3.支持?jǐn)帱c(diǎn)續(xù)傳;4.可按URL和文件后綴名設(shè)置過(guò)濾,只下載所需文件;5.自動(dòng)識(shí)別下載過(guò)的文件是否更新過(guò),減少重復(fù)下載;6.可設(shè)置定時(shí)下載和定時(shí)停止;7.支持自動(dòng)撥號(hào)和自動(dòng)掛斷;8.可導(dǎo)出和導(dǎo)入項(xiàng)目文件,方便用戶交換網(wǎng)上資源;9.提供與瀏覽器(IE)的整合,方便快速地創(chuàng)建項(xiàng)目;10.支持項(xiàng)目和類別的拖拽操作,方便用戶分類管理項(xiàng)目;11.能自動(dòng)識(shí)別操作系統(tǒng)的語(yǔ)言,按需顯示中文或英文。

    5. WebZip 7.0.0.1025 漢化版

    WebZip 是把一個(gè)網(wǎng)站下載并壓縮到一個(gè)單獨(dú)的 ZIP 文件中,可以幫您將某個(gè)網(wǎng)站全部或部份資料以ZIP格式壓縮起來(lái),可供你日后快速瀏覽這個(gè)網(wǎng)站。且新一版的功能包括可預(yù)定時(shí)間來(lái)下載,亦加強(qiáng)相當(dāng)漂亮的立體界面及傳輸?shù)那€圖。 此版本是直接漢化程序文件,不同于漢化語(yǔ)言文件,漢化較徹底,但仍然有極個(gè)別字符沒(méi)能徹底漢化,但不影響使用。因?yàn)槭菨h化的程序文件,在漢化中對(duì)程序界面做了大量?jī)?yōu)化和美化工作。安裝中可選擇安裝中文版本或英文版本,并可以選擇是否注冊(cè)軟件。

    6. 木馬專殺大師 2.6

    本軟件采用了先進(jìn)的程序行為智能判斷技術(shù)。軟件通過(guò)分析每個(gè)程序的機(jī)理來(lái)判斷木馬,不需要木馬的特征碼,可查殺未知木馬。實(shí)時(shí)掃描內(nèi)存中的每個(gè)程序,一旦發(fā)現(xiàn)木馬,即時(shí)查殺。強(qiáng)力保障您的計(jì)算機(jī)、網(wǎng)絡(luò)游戲帳號(hào)、QQ和郵箱帳號(hào)等不被木馬侵害。 目前查殺病毒木馬的軟件基本都是采用了特征碼查殺技術(shù),也就是說(shuō)用戶要不斷的下載和更新病毒木馬庫(kù)才能查殺最新的木馬。這種方法的弊端很明顯,因?yàn)槊刻於加行碌哪抉R出現(xiàn),一旦木馬庫(kù)更新不及時(shí),用戶就面臨著危險(xiǎn)。而且軟件的廠商也肯定不能把所有的病毒木馬庫(kù)找全。所以很多用戶雖然安裝了這些安全軟件,帳號(hào)還是經(jīng)常被木馬竊取。因此一款好的木馬查殺軟件必不可少。

    7. Teleport Pro 1.40

    Teleport Pro所能做的,不僅僅是離線瀏覽某個(gè)網(wǎng)頁(yè)(讓你離線快速瀏覽某個(gè)網(wǎng)頁(yè)的內(nèi)容當(dāng)然是它的一項(xiàng)重要功能),它可以從Internet的任何地方抓回你想要的任何文件,它可以在你指定的時(shí)間自動(dòng)登錄到你指定的網(wǎng)站下載你指定的內(nèi)容,你還可以用它來(lái)創(chuàng)建某個(gè)網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。

    8. Weblinky 1.12簡(jiǎn)體中文版

    WebSlinky可以把站點(diǎn)拷貝到你的計(jì)算機(jī)里,你可以在方便的時(shí)候離線讀取,不必等待下載的時(shí)間。此程序提供了一個(gè)簡(jiǎn)單的界面,使你能夠進(jìn)入你希望緩存到計(jì)算機(jī)中的站點(diǎn)地址(URL)中去。它還提供了WebSlinky保存站點(diǎn)文件的本地文件夾的路徑和名字以及用戶名和口令(如果站點(diǎn)要求).Name:CZY Code:1010107261

    9. 網(wǎng)絡(luò)蜘蛛 1.0

    網(wǎng)絡(luò)蜘蛛是一個(gè)自動(dòng)搜索 HTML 頁(yè)面并下載指定文件的軟件。最初設(shè)計(jì)它是為了下載網(wǎng)站上的圖片,想想看,面對(duì)那些動(dòng)輒擁有數(shù)百幅圖片的網(wǎng)站,你是否有耐心和時(shí)間一一點(diǎn)擊查看和下載?而且在目前上網(wǎng)費(fèi)用如此高昂的年代,在網(wǎng)站上慢慢地手工瀏覽和下載圖片是不是太過(guò)奢侈了一點(diǎn)?如果你是一個(gè)圖片收集愛(ài)好者得話,建議你試一試網(wǎng)絡(luò)蜘蛛這個(gè)軟件。它可以從你指定的地址開(kāi)始,自動(dòng)搜索網(wǎng)站并下載圖片或其它軟件。聽(tīng)起來(lái)似乎有點(diǎn)象離線瀏覽器或網(wǎng)站下載軟件是嗎?其實(shí)它們還是有些差別的,網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)目標(biāo)主要是針對(duì)圖片等一些比較零碎的、尺寸不是很大的文件的下載,并高度強(qiáng)調(diào)自動(dòng)化工作和高可靠性。

    10. WebCHM 2.07.7507

    WebCHM(原WebSeizer測(cè)試版)是中國(guó)最強(qiáng)大的多線程離線瀏覽軟件,專業(yè)的下載大型網(wǎng)站的工具。可以下載整個(gè)網(wǎng)站所有的文件,也可以只下載同一個(gè)目錄的文件,還可以下載指定的層次。主要特色是可以下載超大型的網(wǎng)站(容量>10GB,文件數(shù)目>100萬(wàn)的網(wǎng)站),并且內(nèi)置了CHM壓縮引擎,可以靈活方便地將下載的網(wǎng)頁(yè)制作成CHM壓縮文檔。下載大型網(wǎng)站時(shí),可以邊下載邊壓縮到CHM文檔,以節(jié)省空間;下載幾百篇文章的小說(shuō)時(shí),可以下載后再制作成可以在PDA上閱讀的CHM格式的電子書(shū)。支持?jǐn)帱c(diǎn)續(xù)傳、在線升級(jí)、分類管理等功能,操作方便,體貼用戶。

    11. Offline Explorer 4.1.2347

    相當(dāng)方便使用的離線瀏覽工具,可排定抓取時(shí)間、設(shè)定Proxy,也可選擇抓取的項(xiàng)目及大小,可自設(shè)下載的存放位置、及存放的空間限制。它內(nèi)置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來(lái)瀏覽、且更可直接以全瀏覽窗切換來(lái)作網(wǎng)上瀏覽,另它對(duì)于抓取的網(wǎng)站更有MAP的提供、可更清楚整個(gè)網(wǎng)站的連結(jié)及目錄結(jié)構(gòu)。

    12. BlackWidow 5.00 Beta 19

    一個(gè)非常簡(jiǎn)單易用的離線瀏覽器,它能列出你指定的站點(diǎn)的全部文件,你可以選擇需要的文件下載。

    13. HTTrack 3.40

    一個(gè)相當(dāng)容易使用的脫機(jī)閱覽軟件,能將網(wǎng)站傳送到計(jì)算機(jī)目錄里,并且會(huì)將所有相關(guān)鏈結(jié)重新組織,以方便更順利的脫機(jī)瀏覽。

    14. Aeria Leech 4.3.3

    Leech是一個(gè)不錯(cuò)的離線瀏覽器,能夠多線程下載多個(gè)文件。系統(tǒng)要求:IE4.0或更高版本。

    15. CopyWebsite 2.43

    離線瀏覽工具,僅僅需要輸入需要下載網(wǎng)站的URL,所有的網(wǎng)頁(yè)就可以被下載,包括圖像和zip文件。

    16. 網(wǎng)頁(yè)抓手(FileCatch) 1.07

    網(wǎng)頁(yè)抓手(FileCatch)是設(shè)計(jì)來(lái)取代IE的另存為菜單的軟件,能夠嵌入到IE的右鍵菜單中后臺(tái)形式保存網(wǎng)頁(yè),不打斷瀏覽;此外,F(xiàn)ileCatch僅僅保存網(wǎng)頁(yè)而不包括圖象,解決了一存一大堆的現(xiàn)象;FileCatch提供了自動(dòng)生成一定意義名稱的功能,使你不需要為命名煩惱;FileCatch通過(guò)智能補(bǔ)完相對(duì)地址到網(wǎng)頁(yè)中,解決了保存的網(wǎng)頁(yè)超鏈接丟失的現(xiàn)象;FileCatch能夠?qū)⒕W(wǎng)頁(yè)依耐的CSS嵌入保存到html文件中,保持網(wǎng)頁(yè)的美觀,逼進(jìn)在線的效果;FileCatch支持對(duì)智能選項(xiàng)和代理服務(wù)器,使你方便的使用定制;FileCatch是免費(fèi)軟件,你可以自由的使用。

    17. Offline Explorer Pro 4.1.2348

    相當(dāng)方便使用的離線瀏覽工具,可排定抓取時(shí)間、設(shè)定Proxy,也可選擇抓取的項(xiàng)目及大小,可自設(shè)下載的存放位置、及存放的空間限制。它內(nèi)置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來(lái)瀏覽、且更可直接以全瀏覽窗切換來(lái)作網(wǎng)上瀏覽,另它對(duì)于抓取的網(wǎng)站更有MAP的提供、可更清楚整個(gè)網(wǎng)站的連結(jié)及目錄結(jié)構(gòu)。

    18. Teleport Ultra 1.40 簡(jiǎn)體中文版

    Teleport Ultra 所能做的,不僅僅是離線瀏覽某個(gè)網(wǎng)頁(yè) (讓你離線快速瀏覽某個(gè)網(wǎng)頁(yè)的內(nèi)容當(dāng)然是它的一項(xiàng)重要功能),它可以從 Internet 的任何地方抓回你想要的任何文件,它可以在你指定的時(shí)間自動(dòng)登錄到你指定的網(wǎng)站下載你指定的內(nèi)容,你還可以用它來(lái)創(chuàng)建某個(gè)網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。如果你也和我一樣,曾想把整個(gè)網(wǎng)頁(yè)抓回來(lái)慢慢欣賞,如果你也曾像我一樣,費(fèi)盡千辛萬(wàn)苦只為了重復(fù)抓取同一網(wǎng)站的文件而做一些機(jī)械性的動(dòng)作,Teleport Ultra 簡(jiǎn)直是我們的救星!它可以迅速、確實(shí)地將整個(gè)網(wǎng)站復(fù)制在你的硬盤(pán)中,為您節(jié)省大筆的上網(wǎng)費(fèi)用與時(shí)間。Teleport Ultra 是著名的離線瀏覽軟件 Teleport Pro 版本的增強(qiáng)版!

    19. Teleport Ultra 1.40

    Teleport Ultra所能做的,不僅僅是離線瀏覽某個(gè)網(wǎng)頁(yè)(讓你離線快速瀏覽某個(gè)網(wǎng)頁(yè)的內(nèi)容當(dāng)然是它的一項(xiàng)重要功能),它可以從Internet的任何地方抓回你想要的任何文件,它可以在你指定的時(shí)間自動(dòng)登錄到你指定的網(wǎng)站下載你指定的內(nèi)容,你還可以用它來(lái)創(chuàng)建某個(gè)網(wǎng)站的完整的鏡象,作為創(chuàng)建你自己的網(wǎng)站的參考。如果你也和我一樣,曾想把整個(gè)網(wǎng)頁(yè)捉回慢慢欣賞,如果你也曾像我一樣費(fèi)盡千辛萬(wàn)苦,只為了重復(fù)捉取同一網(wǎng)站的檔案而做一些機(jī)械性的動(dòng)作Teleport Ultra 簡(jiǎn)直是我們的救星!它可迅速、確實(shí)地將整個(gè)網(wǎng)站復(fù)制在你的硬碟中,為您節(jié)省大筆的連線費(fèi)用與時(shí)間。Teleport Ultra 是著名的離線瀏覽軟件Teleport Pro版本的增強(qiáng)版!更新記錄:1.新增了一項(xiàng)功能,使得該軟件的Ultra, VLX, Exec, Exec/VLX版可以打開(kāi)比較小的項(xiàng)目2.新增了可以在UNC卷上運(yùn)行項(xiàng)目的功能3.在Exec和Exec/VLX版本中新增了API命令4.更新了所有版本的文檔5.改進(jìn)了腳本,可以處理更多的腳本命令6.改進(jìn)了規(guī)則引擎7.修正了會(huì)取回一些不需要的URL的bug8.重新設(shè)置了Ultra版的試用期

    20. Offline Explorer Enterprise 4.1.2348

    相當(dāng)方便使用的離線瀏覽工具,可排定抓取時(shí)間、設(shè)定Proxy,也可選擇抓取的項(xiàng)目及大小,可自設(shè)下載的存放位置、及存放的空間限制。它內(nèi)置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來(lái)瀏覽、且更可直接以全瀏覽窗切換來(lái)作網(wǎng)上瀏覽,另它對(duì)于抓取的網(wǎng)站更有MAP的提供、可更清楚整個(gè)網(wǎng)站的連結(jié)及目錄結(jié)構(gòu)。

    21. WebCopier 4.3

    是一個(gè)強(qiáng)大的離線瀏覽器,可以同時(shí)對(duì)100個(gè)文件進(jìn)行下載。支持代理服務(wù)器。內(nèi)置了強(qiáng)大的搜索功能。

    22. Offline Explorer Pro 2.2 漢化版

    相當(dāng)方便使用的離線瀏覽工具,可排定抓取時(shí)間、設(shè)定Proxy,也可選擇抓取的項(xiàng)目及大小,可自設(shè)下載的存放位置、及存放的空間限制。它內(nèi)置瀏覽程序、可直接瀏覽或是使用自己喜歡的瀏覽器來(lái)瀏覽、且更可直接以全瀏覽窗切換來(lái)作網(wǎng)上瀏覽,另它對(duì)于抓取的網(wǎng)站更有MAP的提供、可更清楚整個(gè)網(wǎng)站的連結(jié)及目錄結(jié)構(gòu)。

    23. Grab-a-Site 5.0

    這是一個(gè)離線瀏覽工具。你可以把喜歡的網(wǎng)站抓到本地硬盤(pán)上細(xì)細(xì)的欣賞甚至包括那些有密碼保護(hù)的站點(diǎn)。還有過(guò)濾指定站點(diǎn)的功能。

    24. Black Widows 4.37

    可以讓您建立Web站臺(tái)的整個(gè)目錄結(jié)構(gòu)并將之儲(chǔ)存以便日后利用,當(dāng)您下載文件時(shí),依您的選擇進(jìn)行建立下一個(gè)網(wǎng)站結(jié)構(gòu)。您可以選擇下載整個(gè)或部份的文件,也提供續(xù)傳功能讓您下載中斷時(shí)使用。

    25. HTTrack Website Copier for Windows 3.40 Beta 4

    HTTrack是一個(gè)免費(fèi)并易于使用的線下瀏覽器工具,它能夠讓你從互聯(lián)網(wǎng)上下載整個(gè)網(wǎng)站進(jìn)行線下瀏覽。瀏覽線下站點(diǎn)和線上并沒(méi)有什么不同。HTTrack同樣可以進(jìn)行線下線上站點(diǎn)同步,支持?jǐn)帱c(diǎn)續(xù)傳。HTTrack是一個(gè)可全面配置并包括全面的幫助系統(tǒng)的工具。

    26. WebCopier 官方中文語(yǔ)言包

    是一個(gè)強(qiáng)大的離線瀏覽器,可以同時(shí)對(duì)100個(gè)文件進(jìn)行下載。支持代理服務(wù)器。內(nèi)置了強(qiáng)大的搜索功能。

    27. BackStreet Browser 3.1

    BackStreet Browser是個(gè)離線瀏覽的好幫手。它的特性是,同時(shí)多個(gè)執(zhí)行緒對(duì)目的網(wǎng)站做存取,充分利用頻寬,不必受到網(wǎng)絡(luò)traffic狀況的延遲而拖長(zhǎng)等待的時(shí)間。對(duì)于不想花費(fèi)時(shí)間在無(wú)謂的等待的人,BackStreetBrowser是不錯(cuò)的選擇。

    28. SuperBot 4.5

    SuperBot幫您將整個(gè)網(wǎng)站搬回家SuperBot是個(gè)全自動(dòng)的離線瀏覽軟件,您不需要做太多的設(shè)定,便可以將自己想看的網(wǎng)站給整個(gè)搬回家!SuperBot與一般的離線瀏覽軟件最大的不同處在于它的操作使用相當(dāng)簡(jiǎn)單,您只要設(shè)定好想要下載的網(wǎng)站路徑以及下載網(wǎng)頁(yè)存放的路徑,SuperBot便可以自動(dòng)為您進(jìn)行網(wǎng)頁(yè)下載的工作了,不過(guò)這坪要注意的是,如果您想要下載存放的網(wǎng)站相當(dāng)大的話,您可能要花相當(dāng)長(zhǎng)的時(shí)間等待。

    29. SuperHTTP 1.0

    SuperHTTP是一套離線瀏覽軟件,可以將整個(gè)網(wǎng)站按照目錄結(jié)構(gòu)順序、超連結(jié)等,完整下載到硬盤(pán)離線瀏覽,也可以選擇只下載圖形文件或者其他文件,包括html、txt、pdf、doc、jpg、bmp、gif、png、mpg、mp2、mp3、avi、wav、mid、exe、zip等等,只需在設(shè)定中打勾或取消即可,不用一個(gè)一個(gè)輸入文件類型,允許同時(shí)下載多個(gè)網(wǎng)站,以及顯示下載進(jìn)度功能。此外也提供搜尋引擎功能,可輸入關(guān)鍵字搜尋所下載的網(wǎng)站來(lái)找出所要的文件或資訊。

    30. MemoWeb 3.3.05

    離線網(wǎng)絡(luò)瀏覽器,以供使用者方便快速的直接在電腦中瀏覽這些網(wǎng)頁(yè)。你可以選擇是下載整個(gè)站點(diǎn)的所有的文件,還是下載首頁(yè),或者是某一個(gè)部分。同時(shí)它還支持下載多媒體文件,例如圖片,聲音,和視頻動(dòng)畫(huà)。支持長(zhǎng)文件名,斷點(diǎn)續(xù)傳,支持代理服務(wù)器。

    31. eCatch 3.0

    簡(jiǎn)單實(shí)用的離線瀏覽器。由使用者設(shè)定所要觀看的網(wǎng)址及連結(jié)的層數(shù),而直接抓取并建立一個(gè)「可瀏覽的連結(jié)網(wǎng)頁(yè)」到使用者的電腦中,以供使用者方便快速的直接在電腦中瀏覽這些網(wǎng)頁(yè),可以監(jiān)視及下載數(shù)以千計(jì)的網(wǎng)頁(yè)以供離線觀看??勺杂喗M態(tài)抓取網(wǎng)頁(yè)中的特殊文件,像是多媒體文件及自解壓縮文件等。

    32. WebStripper 2.62

    是一個(gè)離線瀏覽器,可以快速、準(zhǔn)確地將站點(diǎn)下載到你的硬盤(pán)中。它的使用非常簡(jiǎn)單,而且還提供了多個(gè)過(guò)濾條件,比如:圖像文件的大小等,另外,它還可以提取新的或是升級(jí)的頁(yè)面。

    33. DISCo Pump 3.1

    這是一個(gè)離線瀏覽器,具有交互性的界面,獨(dú)一無(wú)二的文件樹(shù)、瀏覽向?qū)D、頁(yè)面圖標(biāo)、預(yù)覽選項(xiàng)。通過(guò)它你可以速度地將網(wǎng)頁(yè)保存到本地,然后離線慢慢進(jìn)行瀏覽。

    34. GetBot 3.04

    GetBot儲(chǔ)存網(wǎng)頁(yè)、抓文件兩相宜用GetBot可以很快的將網(wǎng)頁(yè)中所有的MP3文件或者圖形文件。你只要將網(wǎng)址貼進(jìn)GetBot位址列中,GetBot就會(huì)完整的顯示出該網(wǎng)站的所有網(wǎng)頁(yè)以及文件。然后你只要選取要下載的網(wǎng)頁(yè)以及文件,按下get鈕,GetBot就會(huì)幫你將所有文件抓回來(lái)了。而且GetBot也有續(xù)傳的功能,不怕抓文件抓到一半斷線。GetBot的使用算是很方便,甚至不需要安裝,直接就可以執(zhí)行。

    35. 帖子離線瀏覽器 1.2

    1.非常靈活:帖子左邊的分類名稱和roomid是根據(jù)xml文件動(dòng)態(tài)給出的,您可以隨便更改該文件從而顯示不同的內(nèi)容,正因?yàn)檫@樣,所以他可以適應(yīng)CSDN的任何改版。2.良好的兼容性:除了CSDN帖子外,通過(guò)修改xml配置文件可以適應(yīng)任何的離線帖子和從網(wǎng)上收集的文章,同時(shí)導(dǎo)入選項(xiàng)也是xml個(gè)數(shù)的,非常方便擴(kuò)充。3.綠色軟件,不寫(xiě)注冊(cè)表。4.強(qiáng)大的查找功能,可以查找任何一個(gè)論壇或子論壇,而且可以遞歸。

    36. 精華瀏覽器(MixBrowser) 1.7 簡(jiǎn)體中文版

    精華瀏覽器是一款精致的離線瀏覽軟件,她可以幫你保存網(wǎng)頁(yè)、圖片和flash動(dòng)畫(huà),并以網(wǎng)頁(yè)的形式瀏覽整理它們,輕松擁有自己的精華區(qū)。有了她你就可以保留那些對(duì)自己工作和生活有益的文章、原創(chuàng),精美的圖片和有趣的flash動(dòng)畫(huà)在身邊,使自己從疲勞的搜索再搜索,或“我記得在哪看過(guò)一篇文章”的遺憾中解脫出來(lái),只需鼠標(biāo)一點(diǎn)即刻保存。作為瀏覽器,她更擁有鼠標(biāo)動(dòng)作、安全瀏覽和集成搜索、關(guān)鍵字加亮等特色功能,讓你的瀏覽更輕松、更舒適。

    37. Power Siphon 1.9.6.0

    這是個(gè)高效能的網(wǎng)絡(luò)蜘蛛人,讓你下載網(wǎng)站,或任何明確的網(wǎng)頁(yè)。并儲(chǔ)存到硬盤(pán)以便瀏覽使用。簡(jiǎn)單的提供網(wǎng)頁(yè)的URL或任何其它開(kāi)啟的頁(yè)面來(lái)下載整個(gè)網(wǎng)頁(yè),你可以實(shí)時(shí)觀看下載進(jìn)度,并且從硬盤(pán)中存取所有離線頁(yè)面。此程序還提供了一個(gè)壓縮已下載網(wǎng)頁(yè)成為單一執(zhí)行檔案。嵌入的觀看器讓你看你已下載成功的頁(yè)面,還包含滾動(dòng)顯示模式。

    38. WebCopy 99 1.7

    是一個(gè)可以直接將WEB 網(wǎng)頁(yè)拷貝儲(chǔ)存的軟件,包括可以拷貝整個(gè)網(wǎng)頁(yè)、文字、圖像、聲音及電子郵件等等,這樣即可離線觀看網(wǎng)頁(yè)。

    39. 網(wǎng)絡(luò)獵手 2.5

    這是一個(gè)很好的網(wǎng)上資料收集工具,在瀏覽器中,你可以通過(guò)右鍵菜單很方便的收集資料,你可以部分選取保存,也可以全部整頁(yè)的保存,而且保存下來(lái)的頁(yè)面更原來(lái)的一樣。并且支持拖拉保存,使你可以將沒(méi)有右鍵菜單的頁(yè)面很好的進(jìn)行保存。而且還提供了頁(yè)面上一些文檔鏈接(**.zip)的下載功能.下載下來(lái)的頁(yè)面可以進(jìn)行分類保存和編輯,并最終可以生成eBook(CHM)和HTML文件。

    40. Flash Favorite 1.4.8.5.8

    FlashFavori 允許你瀏覽下載到 Internet 臨時(shí)目錄中或當(dāng)前打開(kāi)的網(wǎng)頁(yè)尚的 FLASH 文件。

    41. NewsVampire 1.4

    本軟件的主要功能是將眾多網(wǎng)站服務(wù)器上的網(wǎng)頁(yè)快速下載到本地機(jī)硬盤(pán)上以供離線瀏覽。其特點(diǎn)是采用了多線程循環(huán)下載技術(shù),可自動(dòng)將數(shù)百個(gè)網(wǎng)頁(yè)連同圖片自動(dòng)快速下載并存盤(pán);用戶可以一邊下載,一邊瀏覽已經(jīng)下載的網(wǎng)頁(yè),從而最大限度地利用網(wǎng)絡(luò)資源。全中文顯示,支持HTTP代理服務(wù)器。

    42. CatchTheWeb Express 1.2

    CatchTheWeb Express不但是個(gè)網(wǎng)頁(yè)瀏覽器,而且它還可以讓使用者將網(wǎng)頁(yè)從Internet抓取到電腦之中,然后重新組織安排各個(gè)網(wǎng)頁(yè)的順序、添加注解,而讓這些網(wǎng)頁(yè)具有如展示簡(jiǎn)報(bào)般的用途。只能一次抓取一個(gè)單一網(wǎng)頁(yè),所以單單在抓取網(wǎng)頁(yè)的功能方面,并沒(méi)有離線瀏覽程序那么好用,但是對(duì)于網(wǎng)頁(yè)資訊的利用方面,卻是一個(gè)不錯(cuò)的簡(jiǎn)報(bào)輔助軟件。

    43. QuadSucker Web 3.1

    QuadSucker Web 是一個(gè)功能強(qiáng)大的離線瀏覽工具,它可以幫助你完整的將指定的網(wǎng)站中的所有文件和圖片,壓縮包,多媒體視頻或者音頻文件統(tǒng)統(tǒng)下載下來(lái),完全自動(dòng)化操作,不需要人為的干預(yù)就可以輕松完成所有的下載工作 ..

    44. Website Extractor 9.30

    該軟件可以下載某個(gè)網(wǎng)站中符合您指定條件,如關(guān)鍵字、文件類型、大小等的文件。

    45. JOC Web Spider 3.72

    離線瀏覽器, 支持 VBScript & JavaScript。

    46. ImageSiteGrabber Pro 2.4.1

    可以讓您直接指定要抓取的網(wǎng)頁(yè)以及網(wǎng)站位置,然后就可以輕輕松松的將這些圖形文件影像給全部帶回家。提供自動(dòng)更名的功能。

    47. Offline Commander 2.2

    Offline Commander是一個(gè)網(wǎng)頁(yè)抓取工具,支持FILE、HTTP、HTTPS、FTP協(xié)議和Proxy,還可以對(duì)抓取回來(lái)的網(wǎng)頁(yè)資料做關(guān)鍵字、網(wǎng)址、標(biāo)題、內(nèi)文、文件大小、格式、文件修改日期等檢索設(shè)置。

    48. NetAttache Pro 2.61

    可以設(shè)定所要下載的網(wǎng)頁(yè)以及要下載的時(shí)間,NetAttache pro 會(huì)自動(dòng)的撥接連接到該網(wǎng)站,將你需要的網(wǎng)頁(yè)抓回來(lái),然后再自動(dòng)斷線.它會(huì)依照你所設(shè)定的網(wǎng)頁(yè)「層數(shù)」,將網(wǎng)頁(yè)文件抓取回來(lái).當(dāng)網(wǎng)路擁塞時(shí),它還會(huì)自動(dòng)重試 10 次,并且以每次同時(shí)抓取20個(gè)文件的超快速度來(lái)下載網(wǎng)頁(yè).在下載的文件類型方面,你可以選擇要不要下載影像文件、聲音文件、Java、ActiveX、Plugins等等,甚至你還可以依照副檔名,來(lái)設(shè)定所要下載的檔案文件。

    49. RafaBot 1.5

    Rafabot是一個(gè)可以協(xié)助你將某站臺(tái)復(fù)制到自己硬盤(pán)上的工具程序。它能以快速且多工的方式將一個(gè)大網(wǎng)站內(nèi)的資料復(fù)制到硬盤(pán)上。你可以對(duì)它直接指定起始URL位址甚至是網(wǎng)頁(yè)搜尋引擎的搜尋結(jié)果,也可以指定外部連結(jié)讓Rafabot程序去為你將整個(gè)站臺(tái)復(fù)制下來(lái)。就算你所想復(fù)制的資料范圍超過(guò)原本網(wǎng)頁(yè)的范圍而延伸到其他的網(wǎng)頁(yè)去,Rafabot一樣可以將這種狀況處理的很好。在網(wǎng)頁(yè)復(fù)制下來(lái)后,你可以用多種條件去過(guò)濾你所找到的資料,讓你從一大堆下載下來(lái)的網(wǎng)頁(yè)資料中快速找到你所想要的資料。網(wǎng)頁(yè)一但下載到你的硬盤(pán)后,你就可以在不連接Internet的情況下去讀取這些網(wǎng)頁(yè)資料了。

    50. HMView 4.04

    不錯(cuò)的離線瀏覽器.像是網(wǎng)頁(yè)中的Form, Frame, Image Maps等都可以被完整的抓回來(lái).

    51. NewsLook 2.01 build0320

    新聞離線瀏覽器,是一個(gè)能將互聯(lián)網(wǎng)上的新聞內(nèi)容快速下載到本地硬盤(pán)上,并可進(jìn)行離線瀏覽的軟件.它不僅具有下載速度快,操作簡(jiǎn)便,節(jié)省上網(wǎng)時(shí)間等特點(diǎn),還具有個(gè)性化的新聞?dòng)嗛喓头奖愕男侣勈詹毓芾砉δ?她可根據(jù)個(gè)人的興趣愛(ài)好需要,訂閱自己喜歡的新聞下載類型,并可設(shè)立相應(yīng)的新聞收藏夾,用于管理新聞.而且它還是免費(fèi)軟件,無(wú)需注冊(cè)繳費(fèi)。

    52. WebCopier Pro 4.3

    是一個(gè)強(qiáng)大的離線瀏覽器,可以同時(shí)對(duì)100個(gè)文件進(jìn)行下載。支持代理服務(wù)器。內(nèi)置了強(qiáng)大的搜索功能。

    53. WebRecorder 2.0a

    專為下載大文件、網(wǎng)站的一部分或者是整個(gè)網(wǎng)站而設(shè)計(jì)的,它支持?jǐn)帱c(diǎn)續(xù)傳、時(shí)間調(diào)度等。

    54. Personal Internet Engine 3.0.6

    離線瀏覽器,可以下載指定網(wǎng)站,并用樹(shù)型結(jié)構(gòu)進(jìn)行顯示,支持進(jìn)行查找。

    55. SurfSaver Pro 2.3

    可以專門(mén)用來(lái)存取一張網(wǎng)頁(yè),并且簡(jiǎn)單易用。它可以完好無(wú)損地保存網(wǎng)頁(yè),無(wú)論是圖片、文字、超級(jí)鏈接以及Frame等等的都可儲(chǔ)存在名為*.ask的文件中,所以一張網(wǎng)頁(yè)就是一個(gè)文件。與眾不同的是,Surfaver支持全文搜索,支持布爾方式和模糊查詢,并且你還可以為你所需要保存的網(wǎng)頁(yè)加上標(biāo)題、注釋和索引,也可把該網(wǎng)頁(yè)E-mail給你的朋友,當(dāng)然前提是他也必須用該軟件來(lái)閱讀。

    56. SurfOffline 1.4.1

    操作簡(jiǎn)單的網(wǎng)頁(yè)離線瀏覽工具 - SurfOffline,使用它的精靈引導(dǎo),輸入您所要下載的網(wǎng)站網(wǎng)址,告訴它您所要下載的深度,這個(gè)站臺(tái)就會(huì)下載回來(lái)在您的計(jì)算機(jī)中,下次要瀏覽時(shí),不用聯(lián)機(jī),開(kāi)啟您所儲(chǔ)存的項(xiàng)目,便可以離線瀏覽,唯一的缺點(diǎn):不支持 Flash。

    57. WebMirror 1.40

    WebMirror 可以將網(wǎng)站快速下載到本地,以供脫機(jī)瀏覽。它可以提供頁(yè)面大小和時(shí)間的信息。

    58. Site-Thief 1.8.0

    一款可以將整個(gè)網(wǎng)站內(nèi)容都下載下來(lái)的工具,為用戶提供了下載某個(gè)網(wǎng)站的選定部分或全部?jī)?nèi)容的能力,并將下載的內(nèi)容儲(chǔ)存在本地硬盤(pán),從而可以離線使用.

    59. HTML Converter 2.0

    該軟件可以把 IE4、IE5、Netscape 或 Opera 的 Cache 轉(zhuǎn)換為離線的、可以瀏覽的網(wǎng)頁(yè)。

    60. HyperMaker HTML Viewer 3000.27

    與HyperMaker HTML配套使用的HTML文本查看工具。

    61. Power Siphon 1.9.1 Build 24

    這是個(gè)高效能的網(wǎng)絡(luò)蜘蛛人,讓你下載網(wǎng)站,或任何明確的網(wǎng)頁(yè)。并儲(chǔ)存到硬盤(pán)以便瀏覽使用。簡(jiǎn)單的提供網(wǎng)頁(yè)的URL或任何其它開(kāi)啟的頁(yè)面來(lái)下載整個(gè)網(wǎng)頁(yè),你可以實(shí)時(shí)觀看下載進(jìn)度,并且從硬盤(pán)中存取所有離線頁(yè)面。此程序還提供了一個(gè)壓縮已下載網(wǎng)頁(yè)成為單一執(zhí)行檔案。嵌入的觀看器讓你看你已下載成功的頁(yè)面,還包含滾動(dòng)顯示模式。

    62. WebCapture 1.0

    一款 Internet 網(wǎng)絡(luò)工具??捎糜跒g覽網(wǎng)頁(yè)、生成鏡像網(wǎng)站、下載文件、管理internet鏈接等等。可將整個(gè)網(wǎng)站備份到本地硬盤(pán)的工具,也可根據(jù)需要將網(wǎng)絡(luò)鏈接改為指向備份后的本地文件,這樣可以離線時(shí)瀏覽備份后的網(wǎng)站。還可以將要發(fā)布的整個(gè)網(wǎng)站整合到一個(gè)可執(zhí)行文件,這樣就可以在一個(gè)整合的瀏覽器里瀏覽你的網(wǎng)頁(yè)。

    63. WebSlinky 1.13 Build 105

    WebSlinky 是一款非常小巧的離線瀏覽的軟件,簡(jiǎn)單易用,它可以將你訪問(wèn)站點(diǎn)的結(jié)構(gòu)復(fù)制到你的計(jì)算機(jī)上。

    64. Zip Up The Web Lite 2.0.1

    可以把整個(gè)網(wǎng)頁(yè)完整的儲(chǔ)存起來(lái),含圖及文字部分,又能把抓下來(lái)的文件儲(chǔ)存成exe檔,也就是把抓取回來(lái)的網(wǎng)頁(yè)壓縮成一個(gè)exe執(zhí)行檔。所以他比其他的類似軟件更容易傳遞,也比較容易使用。

    65. WebVCR 2.16

    如同家中的VCR般的離線瀏覽程序,它有一個(gè)強(qiáng)大的程序向?qū)绾武浿颇P(guān)看的網(wǎng)頁(yè)內(nèi)容,它并可讓您同時(shí)使用多個(gè)網(wǎng)站的錄制,完全不受限制。它支援IE2.0及Netscape 2.0以上版本的瀏覽器。

    66. Website Extractor 9.30 漢化版

    該軟件可以下載某個(gè)網(wǎng)站中符合您指定條件,如關(guān)鍵字、文件類型、大小等的文件。 Website Extractor 幫你把整個(gè)網(wǎng)站搬搬搬…搬回家! 需要離線瀏覽時(shí),你會(huì)怎么做?打開(kāi) IE,選「儲(chǔ)存完整網(wǎng)頁(yè)」的功能?若是需要一個(gè)有一千頁(yè)的網(wǎng)站呢??jī)?chǔ)存一千次嗎?Website Extractor 可以讓你輸入一次網(wǎng)頁(yè) URL,就等著所有的網(wǎng)頁(yè)通通下載到硬盤(pán)中吧! 推薦人評(píng)價(jià) ========== Website Extractor 讓你下載整個(gè)網(wǎng)站或是連結(jié)。你可以設(shè)定下載的條件,免得下載過(guò)多的文件: · 包含/不包含特定的關(guān)鍵詞 · 指定網(wǎng)域、目錄 · 文件大小、型式、名稱 · 要不要下載圖片等等。 Website Extractor 可以讓你同時(shí)下載最多 100 個(gè)文件,大幅節(jié)省上網(wǎng)的時(shí)間、費(fèi)用。因?yàn)榫€路品質(zhì)不好有文件傳不下來(lái)嗎?Website Extractor 提供續(xù)傳的功能讓你把沒(méi)抓到的文件補(bǔ)回來(lái)。 最棒的是,Website Extractor 是完全免費(fèi)的,沒(méi)有討厭的廣告在旁邊煩你! ---------------------------------------------------------------- 漢化說(shuō)明 ======== 該軟件原本帶有多語(yǔ)言支持,但經(jīng)測(cè)試,發(fā)現(xiàn)該功能很不完善,而且遺漏了幾個(gè)標(biāo)準(zhǔn)資源的字符串,故本人發(fā)布的為直接修改資源的版本。無(wú)需原版。 漢化版相對(duì)于原版所作的更改: · 漢化文件:webextra.exe、DDOMAIN.TXT、default.txt; · 在 README.TXT 中添加漢化自述; · 刪除了所有的語(yǔ)言文件; · 去除了主程序菜單中的語(yǔ)言選項(xiàng); · 添加 XP 主題支持文件 webextra.exe.manifest,一定程度上美化了 XP 系統(tǒng)中的顯示。 P.S. 大家都說(shuō)這個(gè)軟件是免費(fèi)版,可實(shí)際上經(jīng)本人研究,該軟件乃共享軟件泄漏之官方注冊(cè)版也。不過(guò)不管怎樣,好?/ca>

    二、如何批量抓取網(wǎng)頁(yè)文字

    如果你想要批量的抓取網(wǎng)頁(yè)文字,那么首先把當(dāng)前的頁(yè)面所有的元素全部都放在一個(gè)數(shù)組當(dāng)中,然后遍歷這個(gè)數(shù)組這個(gè)數(shù)組當(dāng)中,所有的 context屬性全部都設(shè)置為另外一個(gè)數(shù)組的內(nèi)容,這樣把另外一個(gè)數(shù)組相連接就是所有的文字。

    三、python怎么抓取網(wǎng)頁(yè)中DIV的文字

    1、編寫(xiě)爬蟲(chóng)思路:

    確定下載目標(biāo),找到網(wǎng)頁(yè),找到網(wǎng)頁(yè)中需要的內(nèi)容。對(duì)數(shù)據(jù)進(jìn)行處理。保存數(shù)據(jù)。

    2、知識(shí)點(diǎn)說(shuō)明:

    1)確定網(wǎng)絡(luò)中需要的信息,打開(kāi)網(wǎng)頁(yè)后使用F12打開(kāi)開(kāi)發(fā)者模式。

    在Network中可以看到很多信息,我們?cè)陧?yè)面上看到的文字信息都保存在一個(gè)html文件中。點(diǎn)擊文件后可以看到response,文字信息都包含在response中。

    對(duì)于需要輸入的信息,可以使用ctrl+f,進(jìn)行搜索。查看信息前后包含哪些特定字段。

    對(duì)于超鏈接的提取,可以使用最左邊的箭頭點(diǎn)擊超鏈接,這時(shí)Elements會(huì)打開(kāi)有該條超鏈接的信息,從中判斷需要提取的信息。從下載小說(shuō)來(lái)看,在目錄頁(yè)提取出小說(shuō)的鏈接和章節(jié)名。

    2)注意編碼格式

    輸入字符集一定要設(shè)置成utf-8。頁(yè)面大多為GBK字符集。不設(shè)置會(huì)亂碼。

    四、如何用python實(shí)現(xiàn)在爬取到某網(wǎng)頁(yè)搜索框中,并輸入文字后,自動(dòng)搜索信息并抓取

    網(wǎng)絡(luò)爬蟲(chóng)只能根據(jù)你指定的url爬取網(wǎng)頁(yè)的html代碼,至于你想要包含指定內(nèi)容的網(wǎng)頁(yè)的話,只能先爬取下來(lái)網(wǎng)頁(yè),然后在對(duì)頁(yè)面內(nèi)容進(jìn)行匹配(正則,也有開(kāi)源工具)找到你想要的內(nèi)容就可以了!順便說(shuō)一句網(wǎng)絡(luò)爬蟲(chóng)不能根據(jù)關(guān)鍵字來(lái)爬取網(wǎng)頁(yè)!

    以上就是關(guān)于網(wǎng)頁(yè)文字抓取工具相關(guān)問(wèn)題的回答。希望能幫到你,如有更多相關(guān)問(wèn)題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。


    推薦閱讀:

    如何自己建立一個(gè)網(wǎng)頁(yè)(如何自己建立一個(gè)網(wǎng)頁(yè)文檔)

    網(wǎng)頁(yè)一鍵生成(網(wǎng)頁(yè)一鍵生成小程序)

    html網(wǎng)頁(yè)制作(html網(wǎng)頁(yè)制作代碼大全)

    手繪室內(nèi)設(shè)計(jì)圖(室內(nèi)設(shè)計(jì)圖手繪)

    廣告公司業(yè)務(wù)流程(廣告公司業(yè)務(wù)流程模板)

    問(wèn)大家

    韶關(guān)效果好的網(wǎng)頁(yè)美工設(shè)計(jì)目前需要多少錢(qián)?各位同志們幫回復(fù)下

    邳州比較好的網(wǎng)頁(yè)美工設(shè)計(jì)費(fèi)用多少錢(qián)?在座的筒子們幫忙回一下

    南京可靠的網(wǎng)頁(yè)美工設(shè)計(jì)正常多少錢(qián)?朋友們問(wèn)一下

    汕頭值得選擇的網(wǎng)頁(yè)美工設(shè)計(jì)價(jià)格預(yù)估多少?在座的好基友們急急急

    泰興人性化的網(wǎng)頁(yè)美工設(shè)計(jì)大概是多少錢(qián)?在座的老鄉(xiāng)們幫回答下

    福安著名的網(wǎng)頁(yè)美工設(shè)計(jì)負(fù)責(zé)人手機(jī)號(hào)有么?各位老司機(jī)們跪求解答

    電商設(shè)計(jì),網(wǎng)頁(yè)設(shè)計(jì),影視后期,哪個(gè)好,工資待遇高,門(mén)檻低點(diǎn)?

    工作幾年了,想改行做網(wǎng)頁(yè)設(shè)計(jì),現(xiàn)在零基礎(chǔ),打算邊工作邊自學(xué),大概多久可以入門(mén)呢?

    昆山值得推薦的網(wǎng)頁(yè)美工設(shè)計(jì)哪家口碑好?在座的筒子們幫忙回一下

    宿遷口碑好的網(wǎng)頁(yè)美工設(shè)計(jì)公司號(hào)碼有么?在座的筒子們幫忙回一下

    濟(jì)南哪家婚姻介紹所比較好?最真實(shí)可靠的?口碑好的?

    有緣網(wǎng)婚戀交友征婚靠譜?在濟(jì)南,征婚交友網(wǎng)站哪個(gè)好?

    濟(jì)南比較正規(guī)的單身男女找朋友婚介平臺(tái)、白領(lǐng)婚戀相親哪家好?