試用 購買(mǎi)
留言論壇
當前頁(yè)面:熊貓智能采集軟件> 留言論壇

http://www.zdic.net/z/jbs/這種網(wǎng)頁(yè)怎么采集

作者: mnbvcxzasdfghj | 閱讀: 37277/3   2015/7/1 18:25:37
 
非HTML結尾,試了好幾個(gè)在線(xiàn)詞典網(wǎng)站都不能采集,當然前提是我需要整本工具書(shū),
并且希望一次采集完,用下一級頁(yè)面分析最終也釆不全。
http://cd.diyifanwen.com/
http://www.zdic.net/z/
http://zidian.teachercn.com/
http://wyw.hwxnet.com/
http://dict.baidu.com/s?wd=%E7%94%B5%E9%A5%AD%E9%94%85
任意講解一個(gè)就好
謝謝!


2 樓: 管理員 2015/7/2 16:29:01
 
你標題中提到的頁(yè)面,里面的鏈接,是用JS文件二次加載的。所以你用常規的方法不容易采集。這個(gè)需要用中介方式生成該JS文件地址并進(jìn)行批量訪(fǎng)問(wèn)?傊,這比較麻煩。


可以變通一下,比如從該網(wǎng)站中提供的“筆畫(huà)”索引進(jìn)入,再遍歷。也可以采集全部字。http://zidian.teachercn.com/  頁(yè)面左邊的筆畫(huà)數作為一級鏈接入口進(jìn)行采集:

 
  

然后,在第一個(gè)內容頁(yè)頁(yè)面中,按如下設置:

 
  

即可訪(fǎng)問(wèn)該二級標題列表頁(yè)面中所列的所有字,然后點(diǎn)擊“分析該鏈接指向的頁(yè)面”按鈕,進(jìn)入最終的內容頁(yè)面,按需要進(jìn)行采集設置即可。


最終采集結果截圖如下:

 
  


這樣,利用熊貓的“面向對象”采集功能。能夠一次性全部采集網(wǎng)站中所有的字的明細資料。


3 樓: 2015/7/4 7:50:00
 
非常感謝您的耐心解答,我試過(guò)了這確實(shí)有用

4 樓: 2015/7/4 7:50:03
 
非常感謝您的耐心解答,我試過(guò)了這確實(shí)有用


友情鏈接: 建筑結構軟件 中國制造業(yè)博覽 飛翔下載 好特下載 當下軟件園 微信采集軟件 六度軟件下載 ZOL應用下載

Copyright @ 2011 t6bz.cn All Rights Reserved 上海齊索信息科技有限公司 滬ICP備16048952號-4

国产精品天干天干在线观看_人人妻人人澡人人爽欧美一区_久久亚洲精品AB无码播放_欧美多人混交免费观看