querylist采集微信公眾號文章(微信公眾號文章的每一篇文章所對應的key-value數據)
優(yōu)采云 發(fā)布時(shí)間: 2022-01-28 07:04querylist采集微信公眾號文章(微信公眾號文章的每一篇文章所對應的key-value數據)
querylist采集微信公眾號文章的每一篇文章所對應的key-value數據。文章的所有信息都采集完之后按照header的順序,匯總信息給開(kāi)發(fā)者,開(kāi)發(fā)者可以將對應的key發(fā)給需要看文章的人。
實(shí)現過(guò)一個(gè)小的搜索引擎需要對接微信的搜索接口,之前在用路由庫的時(shí)候一直比較麻煩。importrequestsurl=''r=requests.get(url)headers={'user-agent':'mozilla/5.0(windowsnt6.1;wow64)applewebkit/537.36(khtml,likegecko)chrome/55.0.2704.85safari/537.36'}defget_content(url):page=requests.post(url,data={'host':url}).textpage.raise_for_status_code()urls=page.request('')#有重復字符的地方用空格代替urls.encode('gbk').decode('utf-8')html=urls.json()print("encoded:{0}'.format(html))more_content=requests.get(url,data={'results':[x,y]}).textmore_content.decode('utf-8')print("more_content:{0}".format(more_content))print("title",html)returnquerylist.fetch(more_content)但是換言之如果我有兩個(gè)相同的url,上一個(gè)就去掉復制這個(gè)鏈接,而我只是想查找一個(gè)query,下一個(gè)就直接拿到這個(gè)query的title?那就只能用urlencode轉換數據了。
?_id=="a"python實(shí)現輸入地址query_list_content="{1:“{2:“{3:“{4:“{5:“{6:”}”}”}”}".format(query_list_content)text=query_list_content[-1]#print(text)print("title:{1:“{2:“{3:“{4:“{5:“{6:”}”}”}”}".format(text))print("foriinrange({3,7}):”{1:“{2:“{3:“{4:“{5:“{6:“{7:”}”}”}”}”}”}”}".format(text))query_list_content=[iforiinrange(1,8)]text=get_content(。