參數
采集亂碼解決方案
采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 462 次瀏覽 ? 2020-05-26 08:00
出現亂碼的問(wèn)題好多,解決方式也不盡相同,要視具體情況而定采集過(guò)來(lái)的文章亂碼,以下幾種亂碼解決方案僅供參考。
Query方式:
QueryList::Query(采集的目標頁(yè)面,采集規則[,區域選擇器][,輸出編碼][,輸入編碼][,是否移除頭部])
1.設置輸入輸出編碼
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312')->data;
2.設置輸入輸出編碼,并設置最后一個(gè)參數為true假如設置輸入輸出參數始終未能解決亂碼采集過(guò)來(lái)的文章亂碼,那就設置最后一個(gè)參數為true(移除背部)
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data; 查看全部

出現亂碼的問(wèn)題好多,解決方式也不盡相同,要視具體情況而定采集過(guò)來(lái)的文章亂碼,以下幾種亂碼解決方案僅供參考。
Query方式:
QueryList::Query(采集的目標頁(yè)面,采集規則[,區域選擇器][,輸出編碼][,輸入編碼][,是否移除頭部])
1.設置輸入輸出編碼
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312')->data;
2.設置輸入輸出編碼,并設置最后一個(gè)參數為true假如設置輸入輸出參數始終未能解決亂碼采集過(guò)來(lái)的文章亂碼,那就設置最后一個(gè)參數為true(移除背部)
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;
內容替換支持[參數],標簽.doc
采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 345 次瀏覽 ? 2020-04-27 11:03
查看此教程建議視圖:因為包含好多圖片,其他視圖造成圖片查看不全。內容替換例如我們想要把標題上面的“網(wǎng)購火車(chē)票”,換為“網(wǎng)購火車(chē)頭采集器”,我們就可以用采集器的替換功能如下圖:編輯規則,在數據處理==》添加==》內容替換,“將字符串”空白框里寫(xiě)要替換的字符串;“替換為”空白框里寫(xiě)替換后的字符串。設置好了,點(diǎn)擊“確定”按鈕,替換可以有多個(gè)替換,需要一個(gè)一個(gè)添加替換,不能寫(xiě)在一起替換。如上圖操作火車(chē)頭采集教程,測試結果如下:看早已替換成功了。這個(gè)是最基本的替換了。內容替換支持參數下邊在說(shuō)一種常用的替換,這個(gè)不單純的是把字符串1替換成字符串2,是要從字符串1中獲取到部份字符再重新組合成新的字符串。如下圖:我們把src上面的圖片地址給拿出來(lái),設置如下圖我們來(lái)測試下采集結果:是不是替換成我們想要的了??偨Y,就是在“將字符串”空白框里火車(chē)頭采集教程,用[參數]代替我們須要的字符,這個(gè)可以是多個(gè),然后在“替換為”空白框上面,使用[參數1][參數2]...[參數n]按照次序來(lái)取代上面的[參數]。內容替換支持標簽在這個(gè)替換功能還可以使用標簽如下圖:我們要把標題加到內容的上面去,替換那兒這樣寫(xiě):“將字符串”空白框上面直接用[參數],就是獲取全部的內容。測試的結果如下:已經(jīng)把標題標簽采集到的結果添加到內容上面去了。替換這個(gè)塊功能太靈活,能解決好多問(wèn)題,當然須要你能舉一反三,不要死腦筋能夠發(fā)揮它的好處。 查看全部
查看此教程建議視圖:因為包含好多圖片,其他視圖造成圖片查看不全。內容替換例如我們想要把標題上面的“網(wǎng)購火車(chē)票”,換為“網(wǎng)購火車(chē)頭采集器”,我們就可以用采集器的替換功能如下圖:編輯規則,在數據處理==》添加==》內容替換,“將字符串”空白框里寫(xiě)要替換的字符串;“替換為”空白框里寫(xiě)替換后的字符串。設置好了,點(diǎn)擊“確定”按鈕,替換可以有多個(gè)替換,需要一個(gè)一個(gè)添加替換,不能寫(xiě)在一起替換。如上圖操作火車(chē)頭采集教程,測試結果如下:看早已替換成功了。這個(gè)是最基本的替換了。內容替換支持參數下邊在說(shuō)一種常用的替換,這個(gè)不單純的是把字符串1替換成字符串2,是要從字符串1中獲取到部份字符再重新組合成新的字符串。如下圖:我們把src上面的圖片地址給拿出來(lái),設置如下圖我們來(lái)測試下采集結果:是不是替換成我們想要的了??偨Y,就是在“將字符串”空白框里火車(chē)頭采集教程,用[參數]代替我們須要的字符,這個(gè)可以是多個(gè),然后在“替換為”空白框上面,使用[參數1][參數2]...[參數n]按照次序來(lái)取代上面的[參數]。內容替換支持標簽在這個(gè)替換功能還可以使用標簽如下圖:我們要把標題加到內容的上面去,替換那兒這樣寫(xiě):“將字符串”空白框上面直接用[參數],就是獲取全部的內容。測試的結果如下:已經(jīng)把標題標簽采集到的結果添加到內容上面去了。替換這個(gè)塊功能太靈活,能解決好多問(wèn)題,當然須要你能舉一反三,不要死腦筋能夠發(fā)揮它的好處。
采集亂碼解決方案
采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 462 次瀏覽 ? 2020-05-26 08:00
出現亂碼的問(wèn)題好多,解決方式也不盡相同,要視具體情況而定采集過(guò)來(lái)的文章亂碼,以下幾種亂碼解決方案僅供參考。
Query方式:
QueryList::Query(采集的目標頁(yè)面,采集規則[,區域選擇器][,輸出編碼][,輸入編碼][,是否移除頭部])
1.設置輸入輸出編碼
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312')->data;
2.設置輸入輸出編碼,并設置最后一個(gè)參數為true假如設置輸入輸出參數始終未能解決亂碼采集過(guò)來(lái)的文章亂碼,那就設置最后一個(gè)參數為true(移除背部)
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data; 查看全部

出現亂碼的問(wèn)題好多,解決方式也不盡相同,要視具體情況而定采集過(guò)來(lái)的文章亂碼,以下幾種亂碼解決方案僅供參考。
Query方式:
QueryList::Query(采集的目標頁(yè)面,采集規則[,區域選擇器][,輸出編碼][,輸入編碼][,是否移除頭部])
1.設置輸入輸出編碼
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312')->data;
2.設置輸入輸出編碼,并設置最后一個(gè)參數為true假如設置輸入輸出參數始終未能解決亂碼采集過(guò)來(lái)的文章亂碼,那就設置最后一個(gè)參數為true(移除背部)
$html =<<<STR
<div>
<p>這是內容</p>
</div>
STR;
$rule = array(
'content' => array('div>p:last','text')
);
$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;
內容替換支持[參數],標簽.doc
采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 345 次瀏覽 ? 2020-04-27 11:03
查看此教程建議視圖:因為包含好多圖片,其他視圖造成圖片查看不全。內容替換例如我們想要把標題上面的“網(wǎng)購火車(chē)票”,換為“網(wǎng)購火車(chē)頭采集器”,我們就可以用采集器的替換功能如下圖:編輯規則,在數據處理==》添加==》內容替換,“將字符串”空白框里寫(xiě)要替換的字符串;“替換為”空白框里寫(xiě)替換后的字符串。設置好了,點(diǎn)擊“確定”按鈕,替換可以有多個(gè)替換,需要一個(gè)一個(gè)添加替換,不能寫(xiě)在一起替換。如上圖操作火車(chē)頭采集教程,測試結果如下:看早已替換成功了。這個(gè)是最基本的替換了。內容替換支持參數下邊在說(shuō)一種常用的替換,這個(gè)不單純的是把字符串1替換成字符串2,是要從字符串1中獲取到部份字符再重新組合成新的字符串。如下圖:我們把src上面的圖片地址給拿出來(lái),設置如下圖我們來(lái)測試下采集結果:是不是替換成我們想要的了??偨Y,就是在“將字符串”空白框里火車(chē)頭采集教程,用[參數]代替我們須要的字符,這個(gè)可以是多個(gè),然后在“替換為”空白框上面,使用[參數1][參數2]...[參數n]按照次序來(lái)取代上面的[參數]。內容替換支持標簽在這個(gè)替換功能還可以使用標簽如下圖:我們要把標題加到內容的上面去,替換那兒這樣寫(xiě):“將字符串”空白框上面直接用[參數],就是獲取全部的內容。測試的結果如下:已經(jīng)把標題標簽采集到的結果添加到內容上面去了。替換這個(gè)塊功能太靈活,能解決好多問(wèn)題,當然須要你能舉一反三,不要死腦筋能夠發(fā)揮它的好處。 查看全部
查看此教程建議視圖:因為包含好多圖片,其他視圖造成圖片查看不全。內容替換例如我們想要把標題上面的“網(wǎng)購火車(chē)票”,換為“網(wǎng)購火車(chē)頭采集器”,我們就可以用采集器的替換功能如下圖:編輯規則,在數據處理==》添加==》內容替換,“將字符串”空白框里寫(xiě)要替換的字符串;“替換為”空白框里寫(xiě)替換后的字符串。設置好了,點(diǎn)擊“確定”按鈕,替換可以有多個(gè)替換,需要一個(gè)一個(gè)添加替換,不能寫(xiě)在一起替換。如上圖操作火車(chē)頭采集教程,測試結果如下:看早已替換成功了。這個(gè)是最基本的替換了。內容替換支持參數下邊在說(shuō)一種常用的替換,這個(gè)不單純的是把字符串1替換成字符串2,是要從字符串1中獲取到部份字符再重新組合成新的字符串。如下圖:我們把src上面的圖片地址給拿出來(lái),設置如下圖我們來(lái)測試下采集結果:是不是替換成我們想要的了??偨Y,就是在“將字符串”空白框里火車(chē)頭采集教程,用[參數]代替我們須要的字符,這個(gè)可以是多個(gè),然后在“替換為”空白框上面,使用[參數1][參數2]...[參數n]按照次序來(lái)取代上面的[參數]。內容替換支持標簽在這個(gè)替換功能還可以使用標簽如下圖:我們要把標題加到內容的上面去,替換那兒這樣寫(xiě):“將字符串”空白框上面直接用[參數],就是獲取全部的內容。測試的結果如下:已經(jīng)把標題標簽采集到的結果添加到內容上面去了。替換這個(gè)塊功能太靈活,能解決好多問(wèn)題,當然須要你能舉一反三,不要死腦筋能夠發(fā)揮它的好處。


