搜索引擎優(yōu)化創(chuàng )始人(關(guān)于李彥宏超鏈分析專(zhuān)利的一些常識,你知道嗎?)
優(yōu)采云 發(fā)布時(shí)間: 2021-10-25 05:03搜索引擎優(yōu)化創(chuàng )始人(關(guān)于李彥宏超鏈分析專(zhuān)利的一些常識,你知道嗎?)
我第一次知道李彥宏的超鏈接分析專(zhuān)利是在洪博的博客上看到的一篇文章:文章:超鏈分析和PageRank的專(zhuān)利問(wèn)題,也是第一次知道百度總裁李彥宏已經(jīng)申請了并獲得超鏈接分析專(zhuān)利。, 這個(gè)專(zhuān)利申請文件可以在美國專(zhuān)利局網(wǎng)站看到。李彥宏的專(zhuān)利申請是在谷歌申請自己的PageRank專(zhuān)利之前。
由于這兩項專(zhuān)利都與研究網(wǎng)頁(yè)相關(guān)聯(lián),而且這兩項專(zhuān)利的發(fā)明者是兩大搜索引擎的創(chuàng )始人,所以很多人并不清楚這兩項技術(shù)專(zhuān)利的區別。甚至有人覺(jué)得這兩項專(zhuān)利有相似之處或涉嫌抄襲,涉及到兩家公司的核心利益。我仔細閱讀了這兩個(gè)專(zhuān)利的原文,談?wù)勎业目捶ā?/p>
我的理解是,這兩個(gè)專(zhuān)利是完全不同的。要解決的問(wèn)題和實(shí)現方法不同,但研究對象相同,都是頁(yè)面鏈接。
超鏈接分析要解決的是文件和搜索關(guān)鍵詞之間的相關(guān)性。李彥宏提出的方法是除了文件本身必須使用的關(guān)鍵詞之外,還要考慮反向鏈接中的關(guān)鍵詞因素。
具體來(lái)說(shuō),當一個(gè)文件被索引到數據庫中時(shí),它會(huì )與文件的超鏈接和每個(gè)超鏈接使用的錨文本(鏈接文本)一起記錄。而關(guān)鍵詞也會(huì )建立一個(gè)數據庫,每一個(gè)詞都會(huì )連同收錄這個(gè)詞的超鏈接和這些超鏈接指向的文檔一起記錄下來(lái)。
當搜索關(guān)鍵詞時(shí),以關(guān)鍵詞為鏈接文本的反向鏈接數量最多的文件或網(wǎng)頁(yè)將作為最相關(guān)的結果排在第一位。這是當今SEO的常識:鏈接錨文本會(huì )提高頁(yè)面和關(guān)鍵詞的相關(guān)性。
這是基本思想,當然還有其他變量需要考慮。例如,當搜索字符串收錄多個(gè)單詞時(shí),每個(gè)單詞都是搜索向量的一個(gè)維度。
該專(zhuān)利申請已經(jīng)提到了詞干提取技術(shù),并提到了不同語(yǔ)言文檔的相關(guān)性。
考慮搜索算法中的鏈接,主要是鏈接錨文本,是李彥宏的首創(chuàng )??赡苁枪雀璧膭?chuàng )始人在提出PR價(jià)值理論時(shí)受到了李彥宏的專(zhuān)利的啟發(fā)。他們聽(tīng)了李彥宏的演講,向李彥宏提問(wèn)。
谷歌的公關(guān)專(zhuān)利專(zhuān)注于應用超鏈接分析后無(wú)法解決的問(wèn)題。在谷歌的專(zhuān)利申請中,明確提到即使在考慮了文件鏈接和鏈接錨文本之后,搜索引擎仍然有一個(gè)重要的問(wèn)題需要解決,即來(lái)自不同文件的鏈接具有不同的權重值。
你不能指望來(lái)自白宮網(wǎng)站 的鏈接和來(lái)自非洲小鎮的學(xué)生個(gè)人網(wǎng)站 的鏈接具有相同的投票價(jià)值。而 Google PageRank 是衡量網(wǎng)頁(yè)重要性的一種方式。指向一個(gè)網(wǎng)頁(yè)的鏈接越多,這些鏈接本身的權重越高,所指向網(wǎng)頁(yè)的重要性和PageRank就越高。
Google 的專(zhuān)利申請展示了如何計算稱(chēng)為 PageRank 或簡(jiǎn)稱(chēng) PR 值的重要性指數。PR 的計算需要多次循環(huán)代換計算才能收斂到一個(gè)穩定值。通常,PR值收斂到一定精度,不需要計算最終值。
Google PR 與搜索詞無(wú)關(guān),或者與文件相關(guān)性無(wú)關(guān)。它只描述某個(gè)文件的重要性或狀態(tài)。
從目前所有搜索引擎的表現來(lái)看,可以肯定的是,這兩種技術(shù)在排名算法中都得到了應用,雖然名稱(chēng)可能有所不同。當然,現在的搜索算法比原來(lái)的復雜很多,超鏈接分析和PR值算法現在肯定也經(jīng)歷了很多修改。


