采集亂碼解決方案
優(yōu)采云 發(fā)布時(shí)間: 2020-05-26 08:00
出現亂碼的問(wèn)題好多,解決方式也不盡相同,要視具體情況而定采集過(guò)來(lái)的文章亂碼,以下幾種亂碼解決方案僅供參考。
Query方式:
QueryList::Query(采集的目標頁(yè)面,采集規則[,區域選擇器][,輸出編碼][,輸入編碼][,是否移除頭部])
1.設置輸入輸出編碼
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312')->data;
2.設置輸入輸出編碼,并設置最后一個(gè)參數為true假如設置輸入輸出參數始終未能解決亂碼采集過(guò)來(lái)的文章亂碼,那就設置最后一個(gè)參數為true(移除背部)
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;



