亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久

搜狗搜索爬取微信公眾號文章信息,逆向加密解密

優(yōu)采云 發(fā)布時(shí)間: 2021-03-21 06:10

  

搜狗搜索爬取微信公眾號文章信息,逆向加密解密

  微信公眾號文章 采集簡(jiǎn)訊-搜狗APP將近一天文章

  前言

  注: 本文主講一個(gè)分析思路,僅用于技術(shù)交流分享,有興趣可以一起交流 q:1095087360。

  前段時(shí)間,由于需要,在微信官方帳戶(hù)上指定了采集微信文章 關(guān)鍵詞,我在互聯(lián)網(wǎng)上找到了一些信息,但也賺了很多錢(qián)?;旧现挥袃煞N來(lái)源,一種是微信APP,一種是搜狗。但是,微信客戶(hù)端關(guān)鍵詞的搜索功能相當于沒(méi)有(數量相對較?。?,然后以搜狗開(kāi)始,搜狗的啟動(dòng)相對簡(jiǎn)單,可以看一下文章,使用搜狗搜索來(lái)抓取微信官方帳戶(hù)文章信息。

  無(wú)需自動(dòng)抓取即可改進(jìn)前代解決方案,這將更加高效且易于實(shí)現。

  我嘗試實(shí)現,采集得到了數據,但是實(shí)時(shí)率相對較低。 采集的許多文章來(lái)自幾天前或幾個(gè)月前,我檢查了Sogou APP上的微信文章可以搜索到最后一天的數據,因此幾乎是今天的文章

  分析

  

  直接上傳數據包捕獲工具:

  獲取接口之一作為數據接口:

  

  可以發(fā)現請求主體和數據獲取接口的相應主體是加密的。

  反編譯的jar以找到加密方法:

  通過(guò)界面搜索,很容易發(fā)現此請求的加密和解密以相同的方法出現。先加密然后請求數據,然后在獲取數據后解密數據。

  public static synchronized String mxxxx(String str, String str2, String str3, int i) 搜索到的方法

ScEncryptWall.encrypt(str, str2, str3) 加密請求

請求數據:body()

ScEncryptWall.decrypt(body()) 解密

  我不會(huì )(不)發(fā)布(敢于)屏幕截圖(發(fā)布)。

  使用frida鉤子驗證找到的方法:

  hook crypto()方法

   你會(huì )發(fā)現 str= "http://app.weixin.s*g***.com/api/searchapp"

str2="type=2&ie=utf8&page=1&query="+查找的關(guān)鍵詞+"&select_count=20&usip=&tsn=1"

str3=""

  獲取加密參數k,v,u,r,g,p參數

  hook delete()方法

  獲取

  

  有我們想要的數據標題,鏈接。

  接下來(lái)是反向加密和解密方法。

  通過(guò)搜索,發(fā)現它是本機方法。 SCoreTools的so和.so文件在lib \ armeabi目錄中被調用,下一步是分析so并轉到工件ida

  

  找到加解密的入口,接下來(lái)是一個(gè)漫長(cháng)的探索過(guò)程,基本上是分析C語(yǔ)言的計算過(guò)程,可以百度相關(guān)文件,這是主要思想。

  

  最后,當我們得到一段這樣的代碼時(shí),基本上該路由將起作用,并且解密也是如此。

  實(shí)現

  算法出爐時(shí)就實(shí)現了:

  

  獲取數據并分析了鏈接之后,我發(fā)現它仍然是重定向地址。經(jīng)過(guò)簡(jiǎn)單分析,我可以在微信末尾獲得鏈接。然后,我還根據搜狗微信的官方帳戶(hù)(一天采集超過(guò)一百萬(wàn))進(jìn)行了爬網(wǎng),“文本想法”當天采集已獲得了數百萬(wàn)個(gè)數據。

  摘要

  文章主要討論了一個(gè)分析概念,這可能有點(diǎn)粗糙,但是您仍然可以自己從整個(gè)過(guò)程中學(xué)到很多東西。

0 個(gè)評論

要回復文章請先登錄注冊


官方客服QQ群

微信人工客服

QQ人工客服


線(xiàn)

亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久