querylist采集微信公眾號文章( 一種微信公眾號是否有敏感詞匯的檢測方法及裝置)
優(yōu)采云 發(fā)布時(shí)間: 2022-02-10 22:22querylist采集微信公眾號文章(
一種微信公眾號是否有敏感詞匯的檢測方法及裝置)
本發(fā)明屬于微信公眾號廣告投放領(lǐng)域,具體涉及一種微信公眾號是否存在敏感詞的檢測方法及裝置。
背景技術(shù):
微信公眾平臺主要面向名人、政府、媒體、企業(yè)等機構發(fā)起的合作推廣業(yè)務(wù)。在這里,品牌可以通過(guò)渠道推廣到線(xiàn)上平臺。微信公眾號廣告是一種常見(jiàn)的廣告推廣方式。
但微信公眾號是否帶有政治色彩是企業(yè)在投放廣告時(shí)需要考慮的,以免出現不必要的問(wèn)題,影響企業(yè)的投資回報。投資回報是指應該通過(guò)投資獲得回報的價(jià)值,即企業(yè)從一項投資活動(dòng)中獲得的經(jīng)濟回報,需要能夠判斷微信公眾號是否有敏感詞的技術(shù)。
技術(shù)實(shí)施要素:
本發(fā)明提供一種檢測微信公眾號是否有敏感詞的方法及裝置,旨在解決無(wú)法判斷微信公眾號是否有敏感詞的問(wèn)題。
本發(fā)明是這樣實(shí)現的,一種檢測微信公眾號是否有敏感詞的方法,包括以下步驟:
s1、提取微信公眾號歷史文章數據,手動(dòng)標注文章是否有敏感詞;
s2、清洗文章數據,訓練word2vec模型作為訓練數據,分割文章詞得到embedding,最后訓練雙向bilstm深度學(xué)習模型;
s3、獲取微信公眾號預設數量的待預測歷史文章數據,清洗數據,獲取embedding,使用訓練好的雙向bilstm深度學(xué)習模型進(jìn)行預測,每< @文章是否有敏感詞匯的預測結果;
<p>s4、根據預設個(gè)數文章中有??敏感詞的文章個(gè)數,計算出有敏感詞的文章個(gè)數占所有