微信抓取過(guò)程中的參數分析
優(yōu)采云 發(fā)布時(shí)間: 2020-08-08 17:17__ biz可被視為在微信公眾平臺上公開(kāi)宣布的公共賬戶(hù)的唯一ID
mid是圖形消息的ID
idx是發(fā)布的頭幾條消息(1表示標題位置消息)
sn是一個(gè)隨機加密的字符串(對于圖形消息來(lái)說(shuō)是唯一的,如果您想詢(xún)問(wèn)此sn的生成規則是什么或如何破解它,您基本上只能從微信公眾平臺開(kāi)發(fā)中獲得答案. 團隊)變相煮
三: 偽裝微信客戶(hù)端登錄并獲取歷史信息頁(yè)面. 4個(gè)最重要的參數是: __biz; uin =; key =; pass_ticket =;這四個(gè)參數. [有時(shí)需要手機]
四: 獲得general_msg_list后,分析每個(gè)字段
"list": [ //最外層的鍵名;只出現一次,所有內容都被它包含。
{//這個(gè)大闊號之內是一條多圖文或單圖文消息,通俗的說(shuō)就是一天的群發(fā)都在這里
"app_msg_ext_info":{//圖文消息的擴展信息
"content_url": "圖文消息的鏈接地址",
"cover": "封面圖片",
"digest": "摘要",
"is_multi": "是否多圖文,值為1和0",
"multi_app_msg_item_list": [//這里面包含的是從第二條開(kāi)始的圖文消息,如果is_multi=0,這里將為空
{
"content_url": "圖文消息的鏈接地址",
"cover": "封面圖片",
"digest": ""摘要"",
"source_url": "閱讀原文的地址",
"title": "子內容標題"
},
...//循環(huán)被省略
],
"source_url": "閱讀原文的地址",
"title": "頭條標題"
},
"comm_msg_info":{//圖文消息的基本信息
"datetime": '發(fā)布時(shí)間,值為unix時(shí)間戳',
"type": 49 //類(lèi)型為49的時(shí)候是圖文消息
}
},
...//循環(huán)被省略
]
五: 獲取程序的原型
創(chuàng )建表格:
1. 微信公眾號列表
CREATE TABLE `weixin` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`biz` varchar(255) DEFAULT '' COMMENT '公眾號唯一標識biz',
`collect` int(11) DEFAULT '1' COMMENT '記錄采集時(shí)間的時(shí)間戳',
PRIMARY KEY (`id`)
) ;
2,微信文章列表
CREATE TABLE `post` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`biz` varchar(255) CHARACTER SET utf8 NOT NULL COMMENT '文章對應的公眾號biz',
`field_id` int(11) NOT NULL COMMENT '微信定義的一個(gè)id,每條文章唯一',
`title` varchar(255) NOT NULL DEFAULT '' COMMENT '文章標題',
`title_encode` text CHARACTER SET utf8 NOT NULL COMMENT '文章編碼,防止文章出現emoji',
`digest` varchar(500) NOT NULL DEFAULT '' COMMENT '文章摘要',
`content_url` varchar(500) CHARACTER SET utf8 NOT NULL COMMENT '文章地址',
`source_url` varchar(500) CHARACTER SET utf8 NOT NULL COMMENT '閱讀原文地址',
`cover` varchar(500) CHARACTER SET utf8 NOT NULL COMMENT '封面圖片',
`is_multi` int(11) NOT NULL COMMENT '是否多圖文',
`is_top` int(11) NOT NULL COMMENT '是否頭條',
`datetime` int(11) NOT NULL COMMENT '文章時(shí)間戳',
`readNum` int(11) NOT NULL DEFAULT '1' COMMENT '文章閱讀量',
`likeNum` int(11) NOT NULL DEFAULT '0' COMMENT '文章點(diǎn)贊量',
PRIMARY KEY (`id`)
) ;
3. 采集團隊名單
CREATE TABLE `tmplist` (
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
`content_url` varchar(255) DEFAULT NULL COMMENT '文章地址',
`load` int(11) DEFAULT '0' COMMENT '讀取中標記',
PRIMARY KEY (`id`),
UNIQUE KEY `content_url` (`content_url`)
) ;
采集:
1,getMsgJson.php: 該程序負責接收已解析并存儲在數據庫中的歷史消息的json
<p>