亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久

微信公眾號文章采集的入口歷史消息頁(yè)信息獲取方法

優(yōu)采云 發(fā)布時(shí)間: 2021-01-22 12:26

  微信公眾號文章采集的入口歷史消息頁(yè)信息獲取方法

  我解釋了如何在微信公眾號文章采集的進(jìn)入歷史消息頁(yè)面上獲取信息。有需要的朋友可以參考此內容。

  采集 WeChat文章和采集 網(wǎng)站具有相同的內容,都需要從列表頁(yè)面開(kāi)始。而微信文章的列表頁(yè)面是官方賬戶(hù)中的觀(guān)看歷史信息頁(yè)面?;ヂ?lián)網(wǎng)上的其他一些微信采集器現在使用搜狗進(jìn)行搜索。盡管采集的方法簡(jiǎn)單得多,但內容并不完整。因此,我們仍然必須來(lái)自最標準,最全面的官方帳戶(hù)歷史記錄信息頁(yè)面采集。

  由于微信的限制,我們可以復制到的鏈接不完整,并且無(wú)法在瀏覽器中打開(kāi)內容。因此,我們需要使用anyproxy通過(guò)上一篇文章文章中介紹的方法來(lái)獲取完整的微信官方帳戶(hù)歷史記錄消息頁(yè)面的鏈接地址。

 ?。?BBoEMdPDBtOun1F%2F9ENSz&wx_header = 1

  如前一篇文章文章所述,biz參數是官方帳戶(hù)的ID,而uin是用戶(hù)的ID。目前,uin是所有官方帳戶(hù)中唯一的帳戶(hù)。另外兩個(gè)重要參數key和pass_ticket是微信客戶(hù)端上的補充參數。

  因此,在該地址過(guò)期之前,我們可以通過(guò)在瀏覽器中查看原創(chuàng )文本來(lái)獲取歷史消息的文章列表。如果我們想自動(dòng)分析內容,我們還可以使用尚未過(guò)期的密鑰來(lái)編寫(xiě)程序。例如,使用pass_ticket的鏈接地址提交它,然后通過(guò)php程序獲取文章列表。

  最近,一個(gè)朋友告訴我,他的采集目標是一個(gè)單一的正式帳戶(hù),我認為沒(méi)有必要使用上一篇文章文章中編寫(xiě)的批處理采集方法。因此,讓我們看一下歷史新聞頁(yè)面中如何獲取文章列表。通過(guò)分析文章列表,我們可以獲得該官方帳戶(hù)的所有內容鏈接地址,然后采集內容就可以了。

  如果在anyproxy Web界面中正確配置了證書(shū),則可以顯示https的內容。 Web界面的地址為:8002,其中localhost可以替換為您自己的IP地址或域名。從列表中找到以getmasssendmsg開(kāi)頭的記錄,然后單擊它,該記錄的詳細信息將顯示在右側:

  

  紅色框是完整的鏈接地址。將微信公眾平臺的域名拼接起來(lái)后,可以在瀏覽器中打開(kāi)。

  然后將頁(yè)面下拉至html內容的末尾,我們可以看到j(luò )son變量是歷史新聞的文章列表:

  

  我們復制msgList的變量值并使用json格式化工具對其進(jìn)行分析,我們可以看到j(luò )son具有以下結構:

  

{

"list": [

{

"app_msg_ext_info": {

"author": "",

"content": "",

"content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=1&sn=37da0d7208283bf90e9a4a536e0af0ea&chksm=8b882dbbbcffa4ad2f0b8a141cc988d16bace564274018e68e5c53ee6f354f8ad56c9b98bade&scene=4#wechat_redirect",

"copyright_stat": 100,

"cover": "http://mmbiz.qpic.cn/mmbiz/MofBAcBsJ6X0xGrQ2XK5yQjzwb2eswxkRNBTgLtcqGziaFqwibzvtZAHCDkMeJU1fGZHpjoeibanPJ8rziaq68Akkg/0?wx_fmt=jpeg",

"digest": "擦亮雙眼,遠離謠言。",

"fileid": 505283695,

"is_multi": 1,

"multi_app_msg_item_list": [

{

"author": "",

"content": "",

"content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=2&sn=449ef1a874a37fed2429e14f724b56ef&chksm=8b882dbbbcffa4ade48a7932cda4263687e34fca8ea3a5a6233d2589d448b9f6130d3890ce93&scene=4#wechat_redirect",

"copyright_stat": 100,

"cover": "http://mmbiz.qpic.cn/mmbiz_png/MofBAcBsJ6XyaIn0qEDSSicBUBZbMYHYrhibia89ZnksCsUiaia2TLI1fyqjclibGa1hw3icP6oXeSpaWMjiabaghHl7yw/0?wx_fmt=png",

"digest": "12月28日,廣州亞運城綜合體育館,內附購票入口~",

"fileid": 0,

"source_url": "http://wechat.show.wepiao.com/detail/ff764b0731b7465db03b56b998e1f2b8?detailReferrer=1&from=groupmessage&isappinstalled=0",

"title": "2017微信公開(kāi)課Pro版即將召開(kāi)"

},

...//循環(huán)被省略

],

"source_url": "",

"subtype": 9,

"title": "謠言熱榜 | 十一月朋友圈十大謠言"

},

"comm_msg_info": {

"content": "",

"datetime": 1480933315,

"fakeid": "3093134871",

"id": 1000000010,

"status": 2,

"type": 49 //類(lèi)型為49的時(shí)候是圖文消息

}

},

...//循環(huán)被省略

]

}

  對此json的簡(jiǎn)要分析(此處僅介紹一些重要信息,而其他信息則省略):

  

"list": [ //最外層的鍵名;只出現一次,所有內容都被它包含。

{//這個(gè)大闊號之內是一條多圖文或單圖文消息,通俗的說(shuō)就是一天的群發(fā)都在這里

"app_msg_ext_info":{//圖文消息的擴展信息

"content_url": "圖文消息的鏈接地址",

"cover": "封面圖片",

"digest": "??",

"is_multi": "是否多圖文,值為1和0",

"multi_app_msg_item_list": [//這里面包含的是從第二條開(kāi)始的圖文消息,如果is_multi=0,這里將為空

{

"content_url": "圖文消息的鏈接地址",

"cover": "封面圖片",

"digest": ""??"",

"source_url": "閱讀原文的地址",

"title": "子內容標題"

},

...//循環(huán)被省略

],

"source_url": "閱讀原文的地址",

"title": "頭條標題"

},

"comm_msg_info":{//圖文消息的基本信息

"datetime": '發(fā)布時(shí)間,值為unix時(shí)間戳',

"type": 49 //類(lèi)型為49的時(shí)候是圖文消息

}

},

...//循環(huán)被省略

]

  這里要提到的另一件事是,如果您想獲得更長(cháng)的消息內容歷史記錄,則需要在電話(huà)或*敏*感*詞*中下拉頁(yè)面。當您到達底部時(shí),微信會(huì )自動(dòng)讀取它。下一頁(yè)的內容。下一頁(yè)的鏈接地址和歷史消息頁(yè)的鏈接地址也是以getmasssendmsg開(kāi)頭的地址。但是內容只是json,沒(méi)有html。只需直接解析json。

  這時(shí),您可以使用上一篇文章文章中介紹的方法來(lái)使用anyproxy匹配msgList變量值并將其異步提交到服務(wù)器,然后使用php的json_decode將json解析為服務(wù)器。然后遍歷循環(huán)數組。我們可以獲取每篇文章的標題和鏈接地址文章。

  如果您只需要采集個(gè)官方帳戶(hù)的內容,則可以在每日批量發(fā)布后通過(guò)anyproxy獲得帶有key和pass_ticket的完整鏈接地址。然后自己制作一個(gè)程序,然后手動(dòng)將地址提交給您的程序。使用php等語(yǔ)言定期匹配msgList,然后解析json。這樣,無(wú)需修改anyproxy規則,也無(wú)需制作采集隊列和跳轉頁(yè)面。

0 個(gè)評論

要回復文章請先登錄注冊


官方客服QQ群

微信人工客服

QQ人工客服


線(xiàn)

亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久