數據分析(一)數據采集(優(yōu)采云采集器)
優(yōu)采云 發(fā)布時(shí)間: 2022-06-22 04:31這是一個(gè)免費在線(xiàn)生成詞云圖的網(wǎng)站,且支持圖片下載,很方便
3.采集數據的網(wǎng)站鏈家二手房官網(wǎng):
這是我經(jīng)過(guò)篩選后的網(wǎng)址,直接打開(kāi)就行
three進(jìn)入正題~~~微詞云操作
1.打開(kāi)微詞云,點(diǎn)擊"開(kāi)始創(chuàng )建"
2.選擇形狀、內容
step1.點(diǎn)擊形狀,選擇自己想要的圖形;
step2.點(diǎn)擊內容,打開(kāi)導入下拉框,選擇大文本分詞導入
three進(jìn)入正題~~~優(yōu)采云采集器采集數據
下面說(shuō)一下微詞云上的內容從哪里怎么來(lái)的。(PS:再次提醒下我們今天的目標:采集上海市徐匯區二手房各區域的單價(jià)以及房子的特點(diǎn)信息。然后根據區域信息做一個(gè)詞云圖,進(jìn)行可視化展示。)
1.打開(kāi)優(yōu)采云采集器,開(kāi)始采集
2.地址輸入鏈家二手房,搜索"徐匯區"的網(wǎng)址,然后點(diǎn)擊立即創(chuàng )建
?。ㄉ蠄D紅框里的按鈕,可以篩選字段,清空內容,任意添加想采集的字段,這里不贅述,可自行研究)
3.開(kāi)始采集
此處我們就采集150條數據,點(diǎn)擊停止,然后導出數據
以下為導出數據部分截圖:
到此為止,優(yōu)采云采集器采集數據基本完成。
對了,補充一下,在自動(dòng)采集時(shí)可能會(huì )出現廣告,紅包彈框之類(lèi)的,可以采取下面的方法:
4.采集結果數據處理
step1.下面處理下要到微詞云里面展示的字段,我們選擇positionInfo列,將其復制到另一個(gè)sheet頁(yè)
step2.選擇數據》分列,下一步
step3.根據內容選擇分隔符號,將數據分離
step4.選擇C列復制到word里面,然后從word復制到微詞云的文章輸入里。即可完成。以下是我做的一個(gè)圖:
大家可以嘗試下,今天就到這里。這是最初級的數據采集和展示,要想采集更多數據,需要用到python,等學(xué)完python再來(lái)更新吧。









