織夢(mèng)采集規則(dede采集圖文教程并附采集規則,史上最全!)
優(yōu)采云 發(fā)布時(shí)間: 2020-07-24 08:04
這部份就是設置列表開(kāi)始和結束。我們右鍵單擊查看源文件,找到列表開(kāi)始的位置和結束的位置。
列表開(kāi)始位置:
列表結束位置:
填完以后我們點(diǎn)擊保存而且測試,結果卻不是我們想要的結果,為什么呢?因為dede采集模塊會(huì )手動(dòng)采集標簽,而我們采集區域里有其他的鏈接。這時(shí)候我們就無(wú)計可施了嗎?
當然不是,這時(shí)候我們要對區域網(wǎng)址進(jìn)行再度篩選,我們仔細看一下源代碼,就不難發(fā)覺(jué),文章的url都是靜態(tài)的,所有的url都包含了html。所以我們在對網(wǎng)址進(jìn)行再度篩選的框里填上必須包含html。在測試一下,大功告成!最后我們點(diǎn)擊步入下一步設置。
5、網(wǎng)頁(yè)內容獲取規則
進(jìn)入這一步以后雖然也沒(méi)哪些難度了。前面的設置基本上不用動(dòng)。dede采集模塊會(huì )手動(dòng)采集標題、關(guān)鍵詞和頁(yè)面描述。需要我們設置的是頁(yè)面內容。我們以為例。還是右鍵單擊查看源文件。同樣的方面找到內容開(kāi)始和結束的區域。
內容開(kāi)始部份:
內容結束部份:
然后在文章內容匹配規則:里填上
[內容]
就搞定了。什么?你還想除去文章內容中帶的鏈接? 唉,這么做就不仗義了。不過(guò)這也是一個(gè)比較常用的方法我也介紹一下吧。
去掉鏈接是有方法的哦。我們點(diǎn)擊一側的常用規則。彈出一個(gè)對話(huà)框,讓你選擇須要過(guò)濾的內容。如果你點(diǎn)擊超鏈接會(huì )出現一下規則:{dede:trim replace=”}]*>.*{/dede:trim}。這樣設置會(huì )把鏈接和帶的文字都過(guò)濾掉,這樣會(huì )導致文章內容不通順。還用前面的事例:如果用{dede:trim replace=”}]*>.*{/dede:trim}這個(gè)規則,采集的內容會(huì )是:前幾天寫(xiě)了一篇的文章,詳細解釋了一下哪些是百度推廣帳戶(hù)通順度織夢(mèng)采集規則教程,包括調整百度推廣帳戶(hù)通順度的操作方法。所以我們要修改過(guò)濾規則織夢(mèng)采集規則織夢(mèng)采集規則,可以寫(xiě)成這樣{dede:trim replace=”}]*>{/dede:trim}{dede:trim replace=”}{/dede:trim},這樣就可以只把鏈接除去能夠保留鏈接英文字。
6、采集并發(fā)布
后面的操作就比較簡(jiǎn)單了織夢(mèng)采集規則教程,保存以后就開(kāi)始采集,等采集完畢后把玩法功略完的內容導出到對應的欄目里就可以了。



