亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久

使用優(yōu)采云采集器采集文章的使用

優(yōu)采云 發(fā)布時(shí)間: 2020-08-03 15:02

  任務(wù):

  采集某一個(gè)指定頁(yè)面的文章包括(標題、圖片、描述、內容)導入到自己網(wǎng)站數據庫對應欄目(欄目id為57),數據庫數組分別(title,thumb,descrption,content)。

  頁(yè)面上面第一張圖作為文章縮略圖,這邊一個(gè)獲取縮略圖名稱(chēng)并添加上對應網(wǎng)站路徑裝入數據庫thumb數組,另一個(gè)是下載下本地,統一上傳到指定文件夾,(當然看軟件可以直接ftp,目前還沒(méi)弄,后期弄了會(huì )補充)

  1、新建分組--新建任務(wù)

  

  2、添加網(wǎng)址+ 編輯獲取網(wǎng)址的規則

  

  選擇范圍在 ul 里面的 li 里面的鏈接,注意排除重復地址,可以點(diǎn)擊下邊測試網(wǎng)址采集獲取。

  

  可以見(jiàn)到有采集到的文章鏈接了。

  

  3、采集內容規則

  我那邊須要采集下面圖上展示數據(catid是欄目id,可以將采集到的數據裝入對應欄目,設置固定值就好)

  

  著(zhù)重說(shuō)下內容和圖片的采集,標題和描述同理內容采集

  

  內容采集:

  打開(kāi)一個(gè)采集的文章頁(yè)面,查看源代碼(禁了右鍵的f11 或者在網(wǎng)址后面加上 view-source:一樣可以查看):

  選中文章開(kāi)頭一個(gè)位置,截取一段在ctrl+f 搜下是否惟一一段,若是就可以放到位置右圖1處網(wǎng)站程序自帶的采集器采集文章,結尾同開(kāi)頭一樣。

  我截取內容不想上面還帶有鏈接圖片可以數據處理,添加--html標簽排除--選好確定--確定

  

  還有須要下載頁(yè)面圖片,勾選和填寫(xiě)下邊選項

  

  圖片采集:

 ?。?)選中范圍和內容一樣(文章內圖片)

 ?。?)數據處理選 提取第一張圖片 內容是:

 ?。?)只要aa.jpg,正則過(guò)濾,獲取內容:aa.jpg

  

 ?。?)數據庫儲存有前綴,添加上, upload/xxxxx/

  

  找一個(gè)頁(yè)面測試一下,可以看見(jiàn)對應項目都獲取到了。

  

  4、發(fā)布內容設置,這里以形式三發(fā)布到數據庫為反例網(wǎng)站程序自帶的采集器采集文章,編輯后回到那邊勾選剛定義的模塊就好:

  

  5、我需要保存圖片到本地,要設置下保存文件的路徑(ftp后續會(huì )試著(zhù)使用)。

  

  6、保存,查看剛新建的任務(wù),右鍵 開(kāi)始任務(wù)運行,這邊就可以看見(jiàn)文字和圖片都下載出來(lái)了,數據庫上面也可以見(jiàn)到了。

0 個(gè)評論

要回復文章請先登錄注冊


官方客服QQ群

微信人工客服

QQ人工客服


線(xiàn)

亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久