亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久

phpQuery采集微信公眾號文章亂碼

優(yōu)采云 發(fā)布時(shí)間: 2020-05-13 08:21

  終于找到解決方案了微信文章采集 php,這是一個(gè)值得慶賀的事情....

  原來(lái)是因為陌陌在源碼中加入了防采集代碼<!--headTrap<body></body><head></head><html></html>-->,把文章源碼中的這一段除去就可以了!

  具體代碼如下:

  public function getCon(){

header('Content-type: text/html; charset=utf-8');

import('Vendor.QL.QueryList');

$w_url=$_POST['wurl']; //接收到的文章地址

// 測試文章地址

// $w_url='http://mp.weixin.qq.com/s?__biz=MzA5NzQ5OTMxMA==&mid=2650621512&idx=1&sn=2059946e820805c0d62a450aa3af62be&chksm=88960789bfe18e9f47417eb45cd8efe458af9e93fea3e8e4e242ea2376fd3e4c69f5218293cb&scene=0#wechat_redirect';

// echo "<script>alert('".$w_url."');</script>";

$html = file_get_contents($w_url); //獲取文章源碼并保存到參數中

// echo "<script>alert('".$html."');</script>";

$html = str_replace("<!--headTrap<body></body><head></head><html></html>-->", "", $html); //去除微信中的抓取干擾代碼

// die($w_url);<br /><br />// var_dump($html);

$data = \QueryList::Query($html,array(

//采集規則庫

//'規則名' =&gt; array('jQuery選擇器','要采集的屬性'),

'titleTag' =&gt; array('title','text'),

// 'title' =&gt; array('#activity-name','text'),

'content' =&gt; array('body','text'),

// 'image' =&gt; array('img','src'),

//微信規則

'contentWx' =&gt; array('#js_content','text'),

// 'imageWx' =&gt; array('img','data-src'),

// 'conText' =&gt; array('.rich_media_content&gt;p','text'),

))-&gt;data;

foreach ($data as $k =&gt; $v) {

$data[$k]['imageWx'] = $this-&gt;cut_str($v['imageWx'],'?',0);

}

//打印結果

// print_r($data);

$this-&gt;assign('conD',$data);

$this-&gt;display();<br /><br /> }

  Chrome瀏覽器保存微信公眾號文章中的圖片

  用chrome瀏覽器打開(kāi)微信公眾號文章中時(shí),另存為圖片時(shí)保存的是640.webp,不是圖片本身,用IE則沒(méi)有此問(wèn)題.大部分chrome插件也難以保存圖片. 經(jīng)過(guò)多番嘗試,找到一款插件可以批量保存陌陌公 ...

  pc端引入微信公眾號文章

  最近做了一個(gè)小需求,結果坑非常多..... 需求是這樣的,要給公司內部做一個(gè)微信公眾號廣告投票系統,整個(gè)項目就不多贅言了,有個(gè)小功能,要求是這樣的: 點(diǎn)擊某條記錄后的“投票”按鈕,在當前頁(yè)面彈出彈窗顯 ...

  使用Python爬取微信公眾號文章并保存為PDF文件&amp;lpar;解決圖片不顯示的問(wèn)題&amp;rpar;

  前言 第一次寫(xiě)博客,主要內容是爬取微信公眾號的文章,將文章以PDF格式保存在本地. 爬取微信公眾號文章(使用wechatsogou) 1.安裝 pip install wechatsogou --up ...

  【技巧】如何使用客戶(hù)端發(fā)布BLOG&amp;plus;如何快速發(fā)布微信公眾號文章

  [技巧]如何使用客戶(hù)端發(fā)布BLOG+怎樣快速發(fā)布微信公眾號文章 1 BLOG文檔*敏*感*詞* 2 前言部份 2.1 導讀和注意事項 各位技術(shù)愛(ài)好者,看完本文后,你可以把握如下的技能,也 ...

  用Markdown寫(xiě)微信公眾號文章

  目前微信公眾號的編輯器是不支持Markdown句型的,那如何辦呢? 有一款叫Markdown Here的插件可以解決這個(gè)問(wèn)題(支持Chrome.Firefox.Safari). 官方網(wǎng)站:http:/ ...

  小技巧微信文章采集 php,把Markdown文本發(fā)布到微信公眾號文章

  估計很多人都是這樣,平常工作在github,等到有成果要發(fā)布,又要寫(xiě)微信公眾號. github用Markdown,微信公眾號,至少截至今早,還是沿襲富文本的形式.不是說(shuō)富文本不好,但每次悉心撰寫(xiě)的內容 ...

  破解陌陌防盜鏈&amp;amp&amp;semi;微信公眾號文章爬取方案

  破解陌陌圖文防盜鏈: 圖片解除防盜鏈: ...

  微信公眾號文章轉語(yǔ)音tts

  微信公眾號上面的文章在走路或則駕車(chē)時(shí)侯不方便瀏覽,希望能降低一個(gè)文字轉語(yǔ)音功能,那么問(wèn)題來(lái)了,到底哪家文字轉語(yǔ)音技術(shù)強呢? 經(jīng)過(guò)驗證,目前發(fā)覺(jué)最好用的還是balabolka ,國內的哪些“錄音啦”,試 ...

  你所不知道的 Kindle - 閱讀微信公眾號文章

  Kindle 是一款十分優(yōu)秀的閱讀設備,它為我們提供了十分舒服的閱讀體驗,并且配合強悍的亞馬遜圖書(shū)資源,應該是目前最好的閱讀設備之一.Kindle 在已有的成就下還仍然在努力提高用戶(hù)體驗.為中國用戶(hù)開(kāi) ...

  go語(yǔ)言的命令行庫

  命令行應用一般太小,程序猿們也不喜歡為它編撰注釋.所以一些額外的工作,如解析參數有個(gè)合理的庫來(lái)幫忙做就好了. 這個(gè)項目因而而生.安裝:go g ...

  2014多校第一場(chǎng)A題 &amp;vert;&amp;vert; HDU 4861 Couple doubi

  題目鏈接 題意 : 有K個(gè)球,給你一個(gè)數P,可以求出K個(gè)值,(i=1,2,...,k) : 1^i+2^i+...+(p-1)^i (mod p).然后女朋友先取,再xp取,都希望贏(yíng),如果女朋友能贏(yíng)輸 ...

  chromedriver禁用圖片,禁用js,切換UA

  selenium 模擬chrome瀏覽器,此時(shí)就是一個(gè)真實(shí)的瀏覽器,一個(gè)瀏覽器該加載的該渲染的它都加載都渲染,所以爬取網(wǎng)頁(yè)的速率太慢.如果可以不加載圖片等操作,網(wǎng)頁(yè)加載速率都會(huì )快不少,代碼中列舉了了禁 ...

  反射 學(xué)習筆記之Class類(lèi)的使用

  1 java世界中萬(wàn)事萬(wàn)物皆對象,除了2個(gè)特殊情況 int float等這種基本數據類(lèi)型,(但是也都有Integer和Float等封裝類(lèi)做了填補) java staic定義的,它不是屬于對象的,而是 ...

  oracle INS-13001 環(huán)境不滿(mǎn)足最低要求

  使用windows10等系統安裝oracle 11g等版本的數據庫時(shí),經(jīng)常會(huì )發(fā)覺(jué)開(kāi)始安裝時(shí)彈出[INS-13001 環(huán)境不滿(mǎn)足最低要求]的提示,此時(shí)可以點(diǎn)擊[是]繼續安裝. 也可以點(diǎn)擊[否]結束安裝, ...

  【C&amp;sol;C&amp;plus;&amp;plus;】查找(一):靜態(tài)查找表

  {靜態(tài)查找表 + 動(dòng)態(tài)查找表} 所謂動(dòng)態(tài),就是,找的時(shí)侯沒(méi)有則添加,或者能刪掉 關(guān)鍵字:primary key:用來(lái)表示查找表中的一條記錄 {主關(guān)鍵字 + 次關(guān)鍵字} 主關(guān)鍵字是惟一的,用來(lái)惟一的標示 ...

  水仙花在python3在pycharm的實(shí)現

  ---恢復內容開(kāi)始--- #方法一:#-*- coding: utf-8-*-while True: num = input("請輸入一個(gè)三位數") num = int(num) ...

  POJ 1089

  #include &lt;iostream&gt; #include &lt;algorithm&gt; #define MAXN 50005 using namespace std; struct ...

  170629、springboot編程之Druid數據源和監控配置二

  上篇是一種配置方法,雖然我們創(chuàng )建了servlet.filter并且沒(méi)有任務(wù)編碼,看著(zhù)是不是太不爽.ok,接下來(lái)說(shuō)一下簡(jiǎn)介的配置方法,使用代碼注冊Servlet,也是我個(gè)人比較推薦的! 1.創(chuàng )建Drui ...

  百度地圖API 顯示區域邊界及地名定位

  百度地圖API 顯示區域邊界及地名定位 這個(gè)定位一共用了兩個(gè)方式組成 一個(gè)是定位勾畫(huà)區域邊界線(xiàn),另一個(gè)是地名定位 原理: 當用戶(hù)輸入市.市.縣.區這些大地名時(shí),我們要定位用戶(hù)輸入的這個(gè)位置,并顯示輪廓 ...

0 個(gè)評論

要回復文章請先登錄注冊


官方客服QQ群

微信人工客服

QQ人工客服


線(xiàn)

亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久