新聞采集什么平臺什么深度值新聞就用什么方式?
優(yōu)采云 發(fā)布時(shí)間: 2021-03-14 09:01新聞采集什么平臺什么深度值新聞就用什么方式?
querylist采集微信公眾號文章索引至querylist數據庫,數據存儲格式采用字典,不支持sql,讀寫(xiě)頻率大約在50%以下,讀寫(xiě)次數不固定;reportlist采集微信公眾號文章索引至reportlist數據庫,數據格式與querylist數據庫相同,但數據存儲格式為基于哈希表(key-value數據結構)存儲,與querylist數據庫存儲方式相同,但數據讀寫(xiě)頻率大約在50%以下,讀寫(xiě)次數不固定;。
做新聞的話(huà)只需要兩者都要關(guān)注即可,新聞聯(lián)播的話(huà)srs采集肯定沒(méi)問(wèn)題了。其他新聞一般采集什么平臺什么深度值新聞就用什么方式,根據需要各家數據采集平臺可能會(huì )有不同。另外你指的市場(chǎng)上的平臺應該是綜合新聞客戶(hù)端之類(lèi)的,建議使用專(zhuān)注數據存儲的基于hash表的,這個(gè)只要數據量不大,根本不用關(guān)心語(yǔ)義方面的問(wèn)題。
數據庫我了解的不多,如果你指的是手機app里邊的數據那類(lèi),不建議上querylist,各種尺度都得管。reportlist就不用理會(huì )了,
app里面的數據,基本沒(méi)戲。一般是要軟件,就是我們用的autofocus。通?,F在都是用java的,基本都是有程序實(shí)現的。一般你需要掌握java的基本語(yǔ)法。
那個(gè)reportlist要嵌入到app里去,好大個(gè),而且還要注意安全性。不過(guò)如果你不是開(kāi)發(fā)類(lèi)的產(chǎn)品的話(huà),一般互聯(lián)網(wǎng)公司會(huì )采用reportlist來(lái)采集數據,如果想采用它的話(huà),則需要有一定的開(kāi)發(fā)能力。