試用 購買(mǎi)
留言論壇
當前頁(yè)面:熊貓智能采集軟件> 留言論壇

天涯論壇的采集

作者: 1234qwe1 | 閱讀: 112588/6   2015/12/20 11:51:46
 
天涯論壇列表頁(yè)http://bbs.tianya.cn/ 下的翻頁(yè)要怎么設置,它是javacript,
而且自定義頁(yè)面內容模板檢查分析正確,但運行時(shí)報錯 內容頁(yè)面分析失。篽ttp://bbs.tianya.cn/list-stocks-1.shtml ,程序退出,為什么會(huì )這樣,


2 樓: 管理員 2015/12/21 12:37:56
 
你的方法很不對。需要再看看演示視頻。

用該http://bbs.tianya.cn/ 頁(yè)面作為采集入口的“標題列表頁(yè)”,是不合適的。應該點(diǎn)擊該頁(yè)面內翻頁(yè)鏈接后面的“更多”按鈕,打開(kāi)真正的標題列表頁(yè):http://bbs.tianya.cn/hotArticle.jsp


你提到的這個(gè)http://bbs.tianya.cn/list-stocks-1.shtml  頁(yè)面,不是合適的“內容頁(yè)”。本身是一個(gè)標題列表頁(yè)。除非需要用多標題列表頁(yè)面嵌套訪(fǎng)問(wèn)的方式,否則需要調整。


你提到的分析過(guò)程程序退出,我用該網(wǎng)址作為內容頁(yè)面模板網(wǎng)址進(jìn)行測試分析了一下,沒(méi)有崩潰,只是分析過(guò)程耗時(shí)較長(cháng)。

3 樓: 2015/12/21 19:24:48
 
謝謝回復,多標題列表頁(yè)面嵌套訪(fǎng)問(wèn)的方式是要怎么設置的,我是要把整個(gè)天涯的內容都采集到,內容頁(yè)面模板是不是得有多個(gè),并且那個(gè)重定范圍是怎么設置,看了教程找不到修改的地方

4 樓: 2015/12/21 19:30:27
 
從這個(gè)頁(yè)面開(kāi)始http://bbs.tianya.cn/hotArticle.jsp,要采集的內容是要經(jīng)過(guò)多個(gè)列表頁(yè)才能得到,這得一個(gè)一個(gè)配置模板嗎,要怎么嵌套?謝謝

5 樓: 2015/12/21 21:57:48
 
天涯每個(gè)帖子下面的回復有100樓,難道要建立100多個(gè)表嗎,怎么循環(huán)設置,問(wèn)的問(wèn)題好像想有點(diǎn)多,希望指教一下

6 樓: 管理員 2015/12/22 14:08:04
 
兩種辦法,先說(shuō)前面提到的“多層標題列表頁(yè)嵌套訪(fǎng)問(wèn)”的方式的實(shí)現:

1、第一步,用天涯論壇首頁(yè)或任意欄目作為采集入口頁(yè)面,選擇內容頁(yè)中如下選擇: 
  
2、用任意欄目作為內容頁(yè)面模板,進(jìn)入該模板設置頁(yè)面,選擇任一內容頁(yè)面列表內容后,勾選“該鏈接為指向下級子頁(yè)面的鏈接”,并勾選“具有多個(gè)重復子項”,如圖:
 
  

3、然后點(diǎn)擊“分析該鏈接指向的頁(yè)面”按鈕。進(jìn)入內容頁(yè)面的采集設置,就可以了。有兩層列表頁(yè)嵌套。
4、第二層列表頁(yè)的翻頁(yè)設置,如下圖:

 


7 樓: 管理員 2015/12/22 14:12:33
 
這種列表頁(yè)嵌套訪(fǎng)問(wèn)的方式,并不推薦使用。推薦使用第二種更直觀(guān)的方式實(shí)現多欄目的合并采集,如下圖:

 
  
只需要將欄目頁(yè)面的url關(guān)鍵詞用翻頁(yè)參數進(jìn)行替換,即可。參數賦值方式選擇“參數列表”,并輸入每個(gè)欄目的關(guān)鍵詞,逗號分隔。

如果是想監控天涯論壇。一般推薦使用天涯的關(guān)鍵詞搜索功能進(jìn)行論壇監視。也可以借助第三方搜索引擎的站內查詢(xún)語(yǔ)法進(jìn)行監測,如:

site:tianya.cn 輿情




友情鏈接: 建筑結構軟件 中國制造業(yè)博覽 飛翔下載 好特下載 當下軟件園 ecshop采集 六度軟件下載 ZOL應用下載

Copyright @ 2011 t6bz.cn All Rights Reserved 上海齊索信息科技有限公司 滬ICP備16048952號-4

国产精品天干天干在线观看_人人妻人人澡人人爽欧美一区_久久亚洲精品AB无码播放_欧美多人混交免费观看