最近發(fā)布:關(guān)于seo優(yōu)化規則(百度搜索引擎的排名規則)
優(yōu)采云 發(fā)布時(shí)間: 2022-09-24 17:07最近發(fā)布:關(guān)于seo優(yōu)化規則(百度搜索引擎的排名規則)
SEO系統雖然操作強,但在很多操作中都有相應的強制要求,操作流程繁瑣。SEO不僅需要發(fā)兩篇文章來(lái)優(yōu)化搜索引擎排名,還需要掌握更多相關(guān)的SEO技巧。下面眾輝科技小編基于碩智庫產(chǎn)品帶大家來(lái)了解一下。
首先,如何掌握搜索引擎優(yōu)化的原則?
如何掌握搜索引擎優(yōu)化的原則?傳說(shuō)中的SEO核心技術(shù)?這可能是一種誤導性的思維。事實(shí)上,SEO優(yōu)化并不像預期的那么復雜??梢院?jiǎn)單地說(shuō),SEO離不開(kāi)實(shí)際社會(huì )的原則。搜索引擎也認為化學(xué)制造業(yè)是分散的,必須有人性化的考慮。網(wǎng)站運營(yíng)就像實(shí)體店運營(yíng)的真理。外鏈=傳單,車(chē)站=裝修。想想如何提高網(wǎng)站的知名度,如何留住用戶(hù)。實(shí)體店的加入類(lèi)似于新媒體的推廣。合理構思、網(wǎng)站層次結構、用戶(hù)需求和創(chuàng )新必須是SEO需要不斷探索的目標。
雖然在某種程度上,搜索引擎排名規則總是有一些缺點(diǎn),不能反映在任何地方,但隨著(zhù)不斷改進(jìn),各種算法,相信很多騷操作已經(jīng)下臺,但正負極總是存在,也是促進(jìn)搜索引擎公平進(jìn)步的方式之一。
人性化思維搜索引擎優(yōu)化需求,了解用戶(hù)想要什么,了解行業(yè)熱點(diǎn),分析自己的網(wǎng)站和同行對手,明確SEO目標和相應的操作步驟,比吃力不討好更直接。
SEO只是營(yíng)銷(xiāo)推廣的方式之一,只有營(yíng)銷(xiāo)模式,才能獲得更好的回報,做SEO優(yōu)化的基礎,是持續營(yíng)銷(xiāo)的基礎,也可以發(fā)展,盡可能少的垃圾信息,做一個(gè)有價(jià)值的網(wǎng)站尤為重要,只是手但粗心的推廣模式,就像開(kāi)店顧客看,買(mǎi)是你的一般感覺(jué),經(jīng)驗不好,想要一個(gè)好的轉變或一些困難。
其次,搜索引擎優(yōu)化的三個(gè)原則是什么?
SEO(搜索引擎優(yōu)化)是SEM(搜索引擎營(yíng)銷(xiāo))的一個(gè)非常重要的子類(lèi)別。廣義上,SEO是指遵循搜索引擎的搜索原則,合理規劃和部署網(wǎng)站結構、網(wǎng)頁(yè)內容和網(wǎng)站內外鏈接,以提高網(wǎng)站在搜索引擎中的搜索性能,從而增加客戶(hù)發(fā)現和訪(fǎng)問(wèn)網(wǎng)站的可能性。然而,許多人對SEO有偏見(jiàn),認為SEO只是一種干擾搜索引擎搜索結果的排名作弊技術(shù)。
考慮到上述SEO的定義,搜索引擎優(yōu)化應掌握搜索引擎的三個(gè)原則:搜索引擎采集原則、搜索引擎排名原則、搜索引擎減少原則。
第一、搜索引擎收錄原則。
搜索引擎蜘蛛(googlebot、baiduspider、yahoslurp)主要根據超文本鏈接索引。
1)外部鏈接引導索引;
2)直接向搜索引擎提交網(wǎng)站。
如果不包括在內,則需要檢查服務(wù)器、網(wǎng)站空間和域名是否被搜索引擎列入黑名單。
搜索引擎拒絕收錄*敏*感*詞*、*敏*感*詞*等非法網(wǎng)站。
第二、搜索引擎排名原則(網(wǎng)站內部因素+網(wǎng)站外部因素)
A.網(wǎng)站內部因素。
1.網(wǎng)站結構優(yōu)化:
*避免flash、框架、js等導航結構和動(dòng)態(tài)URL,提高索引效率;
*合理分配欄目布局和鏈接深度;
*站內相關(guān)內容的交叉連接;
2.網(wǎng)頁(yè)內容優(yōu)化:
*主題相關(guān)性、原創(chuàng )內容、更新頻率、關(guān)鍵詞提煉;
*網(wǎng)頁(yè)重要標簽(title、meta、h1、B、U、alt等);
*搜索引擎索引習慣(網(wǎng)站重構),內容信仰比;
3.關(guān)鍵詞優(yōu)化:
*關(guān)鍵詞選擇與分析(客戶(hù)角度考慮;競爭對手分析;關(guān)鍵詞分析工具);
*關(guān)鍵字密度和位置(標簽、url、頭部、內容、底部等);
*長(cháng)尾關(guān)鍵詞分布(內容寫(xiě)作);
B.網(wǎng)站外部因素。
1.有效外部鏈接的數量:需要考慮nofollow和外部鏈接分布。
2.外部鏈接質(zhì)量:PR、權威網(wǎng)站、網(wǎng)站質(zhì)量。
3.導入鏈接的頻率:不宜增長(cháng)過(guò)猛。
SEO排名經(jīng)驗:百度排名更傾向于權威、關(guān)鍵詞密度高、內容更新快的網(wǎng)站,關(guān)注主頁(yè),但對內容轉載監督不夠;谷歌更傾向于原創(chuàng )、外部鏈、公關(guān)頁(yè)面。
第三、搜索引擎降權原則(減少原則)
1.關(guān)鍵詞堆砌:只是為了提高關(guān)鍵詞密度。
2.虛假關(guān)鍵詞:不符合內容主題。
3.隱形文本/鏈接:背景色、字體小、DIV定位覆蓋、風(fēng)格隱藏等。
4.偷換網(wǎng)頁(yè):用新頁(yè)面代替專(zhuān)門(mén)排名好的頁(yè)面。
5.復制站點(diǎn)或內容:鏡像網(wǎng)站。
6.橋頁(yè)/門(mén)頁(yè):
7.隱形頁(yè)面:純粹是為了提高鏈接廣度或培養PR頁(yè)面。
8.垃圾鏈接:群發(fā)、工廠(chǎng)鏈接等。
9.鏈向作弊網(wǎng)頁(yè)(以上內容來(lái)自:中國供應商)
再次,搜索引擎需要堅持本質(zhì),SEO從業(yè)者向SEO+邁進(jìn)。
搜索引擎優(yōu)化的概念自搜索引擎出現以來(lái)就已經(jīng)存在了。隨著(zhù)20多年互聯(lián)網(wǎng)的發(fā)展,SEO(搜索引擎優(yōu)化)現在是一個(gè)熟悉的詞。但不得不說(shuō),到目前為止,仍有太多的人員、企業(yè)家、經(jīng)理,甚至從業(yè)者對SEO有錯誤的理解,認為SEO是內容,排名,添加大量的鏈接來(lái)提高頁(yè)面排名,甚至為了在短期內實(shí)現一些目的,使用一些所謂的聰明方法——也就是說(shuō),我們不熟悉黑帽SEO手段,所以這里只能說(shuō),這些理論實(shí)際上是荒謬的,但也相當偏執。
SEO人員的工作包括研究?jì)热莶呗?、?yè)面SEO優(yōu)化、數據分析等,可以毫不夸張地說(shuō),高級SEO人員必須是優(yōu)秀的戰略人才,但也必須是一個(gè)甚至多個(gè)領(lǐng)域的多方面人才。事實(shí)上,SEO很難做到,這在許多局外人眼中不理解,也很驚訝,因為有很多因素會(huì )影響SEO,這些因素隨著(zhù)搜索引擎結構化數據建設越來(lái)越智能,隨著(zhù)搜索引擎營(yíng)銷(xiāo)越來(lái)越成為公眾信息和決策因素權重的增加,影響因素會(huì )越來(lái)越多。
下面我就一個(gè)專(zhuān)業(yè)的SEO工作人員,需要思考的基本問(wèn)題做一些列舉:
1.SEO能否與公司的整體產(chǎn)品、市場(chǎng)和銷(xiāo)售策略相結合,是SEO在面對公司和品牌戰略時(shí)首先需要考慮和布局的一點(diǎn);
2.關(guān)鍵詞研究和定位(這個(gè)過(guò)程需要工具、耐心、直覺(jué)和豐富的營(yíng)銷(xiāo)經(jīng)驗);
3.漏斗優(yōu)化,漏斗模型理論是每個(gè)了解營(yíng)銷(xiāo)知識的人都會(huì )經(jīng)常談?wù)?,但現在,轉化率優(yōu)化是CRO數據,將直接或間接影響SEO效果和策略調整,邏輯和關(guān)系背后的局外人可以定性;
4.檢測和優(yōu)化用戶(hù)內容(網(wǎng)站停留時(shí)間、跳出率、用戶(hù)參與度等直接相關(guān)因素);
5.內容策略(內容策略在高級優(yōu)化中融入整體營(yíng)銷(xiāo)策略);
6.頁(yè)面優(yōu)化(頁(yè)面布局的每一個(gè)細節都是專(zhuān)業(yè)數據視角分析和深度用戶(hù)訪(fǎng)問(wèn)心理分析的結果);
7.讓網(wǎng)站對搜索引擎更友好(這已經(jīng)成為一個(gè)越來(lái)越復雜的過(guò)程,導致SEO越來(lái)越專(zhuān)業(yè)和技能,員工的綜合質(zhì)量要求越來(lái)越高,因為現在網(wǎng)站將使用更多的新興技術(shù),如頁(yè)面導航、Ajax爬行技術(shù)、響應技術(shù)、自適應技術(shù)等)
8.網(wǎng)站分析:用戶(hù)監控只是一個(gè)開(kāi)始?,F在有很多值得研究和考慮的事情,如網(wǎng)站管理工具、鏈接監控、品牌提及、社交媒體跟蹤等;
9.垂直搜索列表(如視頻、圖片、新聞、博客、購物信息搜索等。),只有科學(xué)的數據分析才是一個(gè)漫長(cháng)的過(guò)程;
10.討論可用性和用戶(hù)體驗(SEO在這個(gè)領(lǐng)域甚至比一些中級產(chǎn)品經(jīng)理更專(zhuān)業(yè),因為這對排名有重要影響);
11.形象定位與管理;
12.競爭對手調查,SEO從業(yè)者需要了解市場(chǎng)調研的基本方法;
13.社交媒體營(yíng)銷(xiāo):如今,SEO從業(yè)者不能忽視社交媒體,需要大量的戰略和戰術(shù)支持;
14.企業(yè)間聯(lián)合、平臺間整合布局、網(wǎng)絡(luò )安全、知識所有權、法律等。
以上只是一個(gè)真正的搜索引擎優(yōu)化專(zhuān)業(yè)人員需要和日常工作必須考慮的基礎,這些背后的要求將來(lái)自:技術(shù)、營(yíng)銷(xiāo)、市場(chǎng)、產(chǎn)品、消費者心理、數據等綜合參與和研究,搜索引擎優(yōu)化不容易做的原因之一是,真正的搜索引擎優(yōu)化人才的成長(cháng)和培養,需要一個(gè)漫長(cháng)的過(guò)程。
最后,搜索引擎需要堅持本質(zhì)
搜索引擎堅持本質(zhì)的根本原因是,當搜索引擎優(yōu)化人員理解搜索引擎的排名原則時(shí),你應該知道搜索引擎不是一種公共服務(wù),而是一種賺錢(qián)的商業(yè)手段。搜索引擎的市場(chǎng)份額可以給它帶來(lái)廣告效益。對于搜索引擎優(yōu)化人員來(lái)說(shuō),搜索引擎將不惜一切代價(jià)保持其市場(chǎng)份額,這意味著(zhù)搜索引擎將繼續做任何事情,以確保用戶(hù)搜索的結果是有價(jià)值的,并能夠有效地滿(mǎn)足其搜索需求。
基于上述觀(guān)點(diǎn),搜索引擎需要不斷進(jìn)化,因為實(shí)際上是一種商業(yè)行為,需要確保市場(chǎng)份額和利益,搜索引擎的基礎是為搜索者提供更準確的需求檢索結果,即隨著(zhù)技術(shù)的升級,搜索引擎算法也需要不斷人性化,內容必須合理、真實(shí)、有價(jià)值、有效,即搜索引擎的基礎。
最新版本:百度搜索引擎中邏輯與
百度蜘蛛爬取頻率原理及調整方法
Baiduspider根據上述網(wǎng)站設定的協(xié)議爬取網(wǎng)站頁(yè)面,但不可能對所有網(wǎng)站一視同仁。它將綜合考慮網(wǎng)站的實(shí)際情況確定抓取配額,每天定量抓取網(wǎng)站內容。也就是我們常說(shuō)的爬行頻率。那么百度搜索引擎是通過(guò)哪些指標來(lái)判斷一個(gè)網(wǎng)站的爬取頻率呢?主要有四個(gè)指標:
網(wǎng)站更新頻率:更新更頻繁,更新慢,直接影響百度蜘蛛的訪(fǎng)問(wèn)頻率網(wǎng)站更新質(zhì)量:更新頻率增加,只是為了吸引百度蜘蛛的關(guān)注。質(zhì)量要求很高。如果網(wǎng)站每天更新的大量?jì)热荼话俣戎┲肱袛酁榈唾|(zhì)量頁(yè)面,那還是沒(méi)有意義的。連通性:網(wǎng)站應該安全穩定,保持百度蜘蛛暢通,保持百度蜘蛛關(guān)閉不是好事。是百度搜索引擎對該網(wǎng)站的基本評分(絕不是外界所說(shuō)的百度權重),是百度內部非常機密的數據。網(wǎng)站評分從不單獨使用,并與其他因素和閾值一起影響網(wǎng)站的爬取和排名。
爬取的頻率間接決定了網(wǎng)站有多少頁(yè)面可能被數據庫收錄。如果這么重要的數值不符合站長(cháng)的期望,應該如何調整呢?百度站長(cháng)平臺提供了爬頻工具(),并完成了多次升級。除了提供爬取統計,該工具還提供了“頻率調整”功能。站長(cháng)要求百度蜘蛛根據實(shí)際情況增加或減少對百度站長(cháng)平臺的訪(fǎng)問(wèn)量。調整。百度蜘蛛爬取異常的原因
有一些網(wǎng)頁(yè)內容優(yōu)質(zhì),用戶(hù)可以正常訪(fǎng)問(wèn),但Baiduspider無(wú)法正常訪(fǎng)問(wèn)和爬取,導致搜索結果覆蓋不足,對百度搜索引擎和網(wǎng)站來(lái)說(shuō)都是一種損失。百度將這種情況視為損失。這被稱(chēng)為“抓取異?!?。對于大量?jì)热轃o(wú)法正常抓取的網(wǎng)站,百度搜索引擎會(huì )認為網(wǎng)站存在用戶(hù)體驗缺陷,在抓取方面降低網(wǎng)站的評價(jià)、索引和排序都會(huì )受到一定程度的負面影響,最終會(huì )影響到網(wǎng)站從百度獲得的流量。
下面向站長(cháng)介紹一些抓取異常的常見(jiàn)原因:
1.服務(wù)器連接異常
服務(wù)器連接異常有兩種情況:一種是網(wǎng)站不穩定,百度蜘蛛在嘗試連接你的網(wǎng)站服務(wù)器時(shí)暫時(shí)無(wú)法連接;另一個(gè)是百度蜘蛛一直無(wú)法連接到你網(wǎng)站的服務(wù)器。
服務(wù)器連接異常的原因通常是你的網(wǎng)站服務(wù)器太大,過(guò)載。還有可能是你的網(wǎng)站沒(méi)有正常運行,請檢查網(wǎng)站的web服務(wù)器(如apache、iis)是否安裝運行正常,用瀏覽器查看主頁(yè)面可以正常訪(fǎng)問(wèn)。您的 網(wǎng)站 和主機也可能阻止訪(fǎng)問(wèn)百度蜘蛛,您需要檢查您的 網(wǎng)站 和主機的防火墻。
2. 網(wǎng)絡(luò )運營(yíng)商異常
有兩種類(lèi)型的網(wǎng)絡(luò )運營(yíng)商:中國電信和中國聯(lián)通。百度蜘蛛無(wú)法通過(guò)中國電信或中國網(wǎng)通訪(fǎng)問(wèn)您的網(wǎng)站。如果出現這種情況,需要聯(lián)系網(wǎng)絡(luò )服務(wù)運營(yíng)商,或者購買(mǎi)雙線(xiàn)服務(wù)的空間或者購買(mǎi)cdn服務(wù)。
3.DNS 異常
當百度蜘蛛無(wú)法解析您的 網(wǎng)站 IP 時(shí),會(huì )出現 DNS 異常??赡苣愕木W(wǎng)站IP地址不對,或者你的域名服務(wù)商封殺了Baiduspider。請使用 WHOIS 或主機檢查您的 網(wǎng)站 IP 地址是否正確且可解析,如果不正確,請聯(lián)系您的域名注冊商更新您的 IP 地址。
4.IP 封鎖
IP封禁是指:限制網(wǎng)絡(luò )的出口IP地址,禁止該IP段內的用戶(hù)訪(fǎng)問(wèn)內容,這里特指封禁BaiduspiderIP。只有當你的網(wǎng)站不想讓Baiduspider訪(fǎng)問(wèn)時(shí)才需要這個(gè)設置,如果你想讓Baiduspider訪(fǎng)問(wèn)你的網(wǎng)站,請在相關(guān)設置中檢查BaiduspiderIP是否添加錯誤。也有可能是你網(wǎng)站所在的空間服務(wù)商封殺了百度IP。在這種情況下,您需要聯(lián)系服務(wù)提供商更改設置。
5.UA 禁令
UA是User-Agent,服務(wù)器通過(guò)UA識別訪(fǎng)問(wèn)者的身份。當網(wǎng)站返回異常頁(yè)面(如403、500)或跳轉到其他頁(yè)面進(jìn)行指定UA的訪(fǎng)問(wèn)時(shí),屬于UA禁令。當你的網(wǎng)站不想要百度蜘蛛時(shí)這個(gè)設置只有在訪(fǎng)問(wèn)時(shí)才需要,如果你想讓Baiduspider訪(fǎng)問(wèn)你的網(wǎng)站,請檢查useragent相關(guān)設置中是否有Baiduspider UA,并及時(shí)修改。
6.死鏈接
無(wú)效且無(wú)法向用戶(hù)提供任何有價(jià)值信息的頁(yè)面為死鏈接,包括協(xié)議死鏈接和內容死鏈接兩種形式:
協(xié)議死鏈接:通過(guò)頁(yè)面的TCP協(xié)議狀態(tài)/HTTP協(xié)議狀態(tài)明確表示的死鏈接,如404、403、503狀態(tài)等
內容死鏈接:服務(wù)器返回正常狀態(tài),但內容已更改為與原創(chuàng )內容無(wú)關(guān)的不存在、已刪除或需要權限等信息頁(yè)面。
對于死鏈接,我們建議網(wǎng)站使用協(xié)議死鏈接,通過(guò)百度站長(cháng)平臺-死鏈接工具提交給百度,這樣百度可以更快的找到死鏈接,減少死鏈接對用戶(hù)和搜索的負面影響引擎。 .
7.異常跳轉
將網(wǎng)絡(luò )請求重定向到另一個(gè)位置是一個(gè)跳轉。異常跳轉指以下幾種情況:
判斷新鏈接的重要性
好了,上面我們講了影響百度蜘蛛正常爬取的原因,下面說(shuō)一下百度蜘蛛的一些判斷原則。在建庫鏈接之前,百度蜘蛛會(huì )對頁(yè)面進(jìn)行初步的內容分析和鏈接分析,通過(guò)內容分析判斷頁(yè)面是否需要建索引庫,通過(guò)鏈接分析發(fā)現更多頁(yè)面,然后爬取更多頁(yè)面——分析——是否建立圖書(shū)館并發(fā)現新鏈接的過(guò)程。理論上,百度蜘蛛會(huì )把新頁(yè)面上所有能“看到”的鏈接都爬回來(lái),那么面對眾多的新鏈接,百度蜘蛛如何判斷哪個(gè)更重要呢??jì)蓚€(gè)方面:
一、對用戶(hù)的價(jià)值
獨特的內容,百度搜索引擎喜歡獨特的內容
主體突出,不要出現網(wǎng)頁(yè)主體內容不突出被搜索引擎誤判為空短頁(yè)不被抓取的情況
內容豐富
適當的廣告
二、鏈接的重要性
目錄層次結構 - 淺層優(yōu)先
鏈接在網(wǎng)站上的受歡迎程度
百度優(yōu)先建設重要庫的原則
百度蜘蛛抓取多少頁(yè)并不是最重要的,重要的是建了多少頁(yè)到索引庫中,也就是我們常說(shuō)的“建庫”。眾所周知,搜索引擎的索引庫是分層的。高質(zhì)量的網(wǎng)頁(yè)將分配到重要的索引庫,普通網(wǎng)頁(yè)將留在普通庫,較差的網(wǎng)頁(yè)將分配到低級庫作為補充資料。目前60%的檢索需求只需要調用重要的索引庫就可以滿(mǎn)足,這就解釋了為什么有些網(wǎng)站的收錄的大流量并不理想。
那么,哪些頁(yè)面可以進(jìn)入優(yōu)質(zhì)索引庫呢?其實(shí),總的原則是一個(gè):對用戶(hù)有價(jià)值。包括但不限于:
時(shí)間敏感且有價(jià)值的頁(yè)面:在這里,及時(shí)性和價(jià)值并列,兩者缺一不可。有些網(wǎng)站為了生成時(shí)間敏感的內容頁(yè)面做了很多采集的工作,導致一堆毫無(wú)價(jià)值的頁(yè)面,百度不想看到。優(yōu)質(zhì)內容的專(zhuān)題頁(yè):專(zhuān)題頁(yè)的內容不一定是完全的原創(chuàng ),也就是可以很好的融合各方的內容,或者加入一些新鮮的內容,比如意見(jiàn)、評論等,給予為用戶(hù)提供更豐富、更全面的內容。高價(jià)值的原創(chuàng )內容頁(yè)面:百度將原創(chuàng )定義為花費一定成本,積累大量經(jīng)驗后形成的文章。永遠不要再問(wèn)我們是否 偽原創(chuàng ) 是原創(chuàng )。重要的個(gè)人頁(yè)面:這里只是一個(gè)例子,科比在新浪微博上開(kāi)了一個(gè)賬號,即使他不經(jīng)常更新,對于百度來(lái)說(shuō)仍然是一個(gè)非常重要的頁(yè)面。哪些頁(yè)面不能被索引
上面提到的優(yōu)質(zhì)網(wǎng)頁(yè)都進(jìn)入了索引庫,所以其實(shí)網(wǎng)上的大部分網(wǎng)站都沒(méi)有被百度收錄列出來(lái)。不是百度沒(méi)找到,而是建庫前的篩選過(guò)程中被過(guò)濾掉了。那么第一個(gè)鏈接就過(guò)濾掉了什么樣的網(wǎng)頁(yè):
內容重復的網(wǎng)頁(yè):百度不需要收錄與互聯(lián)網(wǎng)上已有的內容。主要內容為空且短的網(wǎng)頁(yè)
部分內容使用了百度蜘蛛無(wú)法解析的技術(shù),如JS、AJAX等,雖然用戶(hù)可以看到豐富的內容,但還是會(huì )被搜索引擎拋棄
加載速度過(guò)慢的網(wǎng)頁(yè)也可能被視為空的短頁(yè)。請注意,廣告加載時(shí)間計入網(wǎng)頁(yè)的總加載時(shí)間。
許多主體不太突出的網(wǎng)頁(yè)即使被抓取回來(lái)也會(huì )被丟棄在這個(gè)鏈接中。部分作弊頁(yè)面搜索引擎索引系統概述
眾所周知,搜索引擎的主要工作流程包括:抓取、存儲、頁(yè)面分析、索引、檢索等主要流程。上一章我們主要介紹了一些爬取和存儲鏈接的內容。本章簡(jiǎn)要介紹了索引系統。
在以十億為單位的網(wǎng)絡(luò )圖書(shū)館中查找某些特定項目關(guān)鍵詞 就像大海撈針一樣。有可能在一定時(shí)間內完成搜索,但用戶(hù)等不起。從用戶(hù)體驗的角度來(lái)看,一定要做到毫秒級才能給用戶(hù)滿(mǎn)意的結果,否則用戶(hù)只能流失。如何滿(mǎn)足這個(gè)要求?
如果你能知道用戶(hù)正在尋找的關(guān)鍵詞(查詢(xún)被分割后)中出現了哪些頁(yè)面,那么用戶(hù)檢索的過(guò)程可以想象成一個(gè)收錄不同部分的頁(yè)面的集合。詢(xún)問(wèn)。切換、檢索的過(guò)程變成了頁(yè)面名稱(chēng)之間的比較和交集。這樣,以毫秒為單位的數十億單位的檢索成為可能。這就是所謂的倒排索引和交集檢索過(guò)程。構建倒排索引的基本流程如下:
頁(yè)面分析的過(guò)程實(shí)際上是對原創(chuàng )頁(yè)面的不同部分進(jìn)行識別和標記,例如:標題、關(guān)鍵詞、內容、鏈接、錨點(diǎn)、評論、其他非重要區域等;分詞的過(guò)程其實(shí)包括切分詞、同義詞轉換、同義詞替換等。以一個(gè)頁(yè)面的標題分詞為例,得到的數據會(huì )是:詞條文本、詞條、詞性、詞性等.;前面的準備工作完成后,下一步就是建立一個(gè)反向排列的索引,形成{termàdoc}。下圖是索引系統中的倒排索引過(guò)程。
倒排索引是搜索引擎實(shí)現毫秒級檢索的一個(gè)非常重要的部分。接下來(lái)要介紹索引系統建立倒排索引的重要過(guò)程——入庫和寫(xiě)入。
倒排索引的重要過(guò)程——存儲和寫(xiě)入
索引系統在倒排索引建立的最后還需要一個(gè)入庫和寫(xiě)庫的過(guò)程。為了提高效率,這個(gè)過(guò)程還需要在文件頭中保存所有的term和offset,并壓縮數據。這太技術(shù)性了,這里就不提了。這里簡(jiǎn)單介紹一下索引后的檢索系統。
檢索系統主要包括五個(gè)部分,如下圖所示:
影響搜索結果排名的因素
上面的內容好像有點(diǎn)深奧,因為涉及到很多技術(shù)細節,這里只能說(shuō)一下。那么再來(lái)說(shuō)說(shuō)大家最感興趣的排序問(wèn)題。用戶(hù)輸入關(guān)鍵詞進(jìn)行檢索。百度搜索引擎在排序過(guò)程中要做兩件事。一是從索引數據庫中提取相關(guān)網(wǎng)頁(yè),二是根據不同維度對提取的網(wǎng)頁(yè)進(jìn)行評分。綜合排序。 “不同的維度”包括:
低質(zhì)量網(wǎng)頁(yè)狙擊策略——石榴算法
我們理解網(wǎng)站的生存和發(fā)展需要資金支持,我們從不反對網(wǎng)站添加各種合法廣告。不要再問(wèn)我們“我們會(huì )網(wǎng)站添加X(jué)X聯(lián)盟廣告嗎?有的網(wǎng)站雖然在百度排名不錯,但在頁(yè)面上投放了大量不利于用戶(hù)體驗的廣告,嚴重影響了百度搜索引擎的用戶(hù)體驗。為此,百度質(zhì)量團隊于2013年5月17日發(fā)布公告:針對低質(zhì)量網(wǎng)頁(yè)推出石榴算法,旨在打擊存在大量不良廣告阻礙用戶(hù)正常瀏覽的頁(yè)面,尤其是當大量低質(zhì)量網(wǎng)頁(yè)優(yōu)質(zhì)廣告彈出,頁(yè)面混亂。垃圾頁(yè)面的主要內容。
如下網(wǎng)頁(yè)截圖所示,用戶(hù)需要很長(cháng)時(shí)間才能找到真正的下載地址,這是百度無(wú)法接受的。
百度質(zhì)量團隊希望站長(cháng)能從用戶(hù)的角度出發(fā),考慮長(cháng)遠發(fā)展,在不影響用戶(hù)體驗的情況下合理投放廣告,贏(yíng)得用戶(hù)的長(cháng)期青睞。 網(wǎng)站發(fā)展和成長(cháng)基礎。
外部鏈接的作用(2014版)
曾經(jīng),“內容為王,超鏈接為王”的說(shuō)法流傳多年。網(wǎng)頁(yè)的相關(guān)性和重要性通過(guò)超鏈接計算分數來(lái)體現。它確實(shí)是搜索引擎評估網(wǎng)頁(yè)的重要參考因素之一。它將直接參與搜索結果的排名計算。然而,隨著(zhù)越來(lái)越多的SEO人員了解這項技術(shù),超鏈接也逐漸失去了投票的意義。無(wú)論是谷歌還是百度,對超鏈接數據的依賴(lài)度越來(lái)越低。那么,超鏈目前的作用是什么?
吸引蜘蛛爬行:雖然百度在發(fā)現新的好網(wǎng)站方面下功夫,開(kāi)放多個(gè)數據提交入口,避開(kāi)社交發(fā)現渠道,但超鏈接仍然是發(fā)現收錄鏈接最重要的入口。
將相關(guān)信息傳遞給搜索引擎:除了通過(guò)TITLE、頁(yè)面關(guān)鍵詞、H標簽等來(lái)判斷網(wǎng)頁(yè)內容外,百度還會(huì )使用錨文本來(lái)進(jìn)行判斷。使用圖片作為點(diǎn)擊入口的超鏈接,也可以通過(guò)alt屬性和title標簽向百度傳達你的感受。
提升排名:百度搜索引擎雖然減少了對超鏈接的依賴(lài),但對超鏈接的認可度從未下降,對優(yōu)質(zhì)鏈接、正常鏈接、垃圾鏈接和作弊鏈接制定了更嚴格的標準。對于作弊鏈接,除了對鏈接進(jìn)行過(guò)濾和清理外,對鏈接的受益站點(diǎn)也進(jìn)行了一定的處罰。相應地,百度依然歡迎優(yōu)質(zhì)鏈接。
分享內容,獲得口碑:優(yōu)質(zhì)內容廣為傳播,網(wǎng)站這樣獲得的流量可能不多,但如果內容做的足夠好,也可以建立自己的品牌效應。嚴格來(lái)說(shuō),這不屬于超鏈接的作用。在百度眼里,網(wǎng)站的品牌遠比超鏈接重要。
斬斷買(mǎi)賣(mài)超鏈的利刃——路羅算法1.0&2.0
百度質(zhì)量團隊于2013年2月19日宣布推出luluo算法,再次強調買(mǎi)賣(mài)鏈接的行為:一方面,買(mǎi)賣(mài)鏈接的行為影響用戶(hù)體驗,干擾搜索引擎算法;鏈中介受益,真正勤奮好站的站長(cháng)們,在這個(gè)嚴酷的互聯(lián)網(wǎng)超鏈環(huán)境下,得不到應有的回報。因此,以下三類(lèi)網(wǎng)站會(huì )在清除買(mǎi)賣(mài)鏈接計算的基礎上不同程度地受到影響:
超鏈接中介:超鏈接應該是互聯(lián)網(wǎng)上比較優(yōu)質(zhì)的推薦。是普通用戶(hù)和網(wǎng)站之間對頁(yè)面內容和網(wǎng)站價(jià)值的肯定,但現在各種超鏈接作弊行為真正的肯定,卻成了一些人謀取利益的敲門(mén)磚。用戶(hù)無(wú)法根據鏈接的推薦找到自己需要的優(yōu)質(zhì)資源,嚴重干擾了搜索引擎對網(wǎng)站的評價(jià)。超鏈中介是在這個(gè)畸形的超鏈市場(chǎng)中形成的邪惡之花。我們有義務(wù)維護超鏈的純粹性,保護用戶(hù)的利益。我們也有責任引導站長(cháng)朋友們停止花費不必要的開(kāi)支。因此,超鏈中介會(huì )在我們的目標范圍內。
賣(mài)鏈接網(wǎng)站:一個(gè)網(wǎng)站賺錢(qián)的方式有很多,利用優(yōu)質(zhì)的原創(chuàng )內容來(lái)吸引固定用戶(hù),引入優(yōu)質(zhì)的廣告資源,甚至舉辦線(xiàn)下活動(dòng)。很高興看到 網(wǎng)站 的真正價(jià)值。但是,有些網(wǎng)站的內容基本上是采集來(lái)自網(wǎng)絡(luò ),靠賣(mài)超鏈位置來(lái)活的;一些機構網(wǎng)站或被鏈接中介租用出售鏈接位置,使得超鏈市場(chǎng)的泡沫越來(lái)越大。此調整也會(huì )影響此類(lèi)網(wǎng)站。
購買(mǎi)鏈接網(wǎng)站:百度一直保護和支持優(yōu)質(zhì)網(wǎng)站,這是從用戶(hù)需求和創(chuàng )業(yè)站長(cháng)的角度來(lái)看的必然結果。然而,一些站長(cháng)并沒(méi)有把精力花在提高網(wǎng)站的質(zhì)量上,而是選擇了?;ㄕ?,用金錢(qián)換超鏈接,欺騙搜索引擎,然后欺騙用戶(hù)。對于沒(méi)有太多資源和金錢(qián)來(lái)支付此類(lèi)費用的創(chuàng )業(yè)站長(cháng)來(lái)說(shuō),這也是一種無(wú)形的傷害。如果不加以遏制,劣幣將驅逐良幣,勢必導致更糟糕的互聯(lián)網(wǎng)環(huán)境。此類(lèi)網(wǎng)站本身也會(huì )受到此次調整的影響。
以上是百度質(zhì)量團隊首次推出綠羅算法時(shí)的具體情況,后來(lái)稱(chēng)為綠羅算法1.0。時(shí)隔5個(gè)月,百度質(zhì)量團隊再次推出璐璐算法2.0,對明顯提升進(jìn)行更寬更嚴處理軟文。
處罰對象主要是發(fā)布軟文的新聞網(wǎng)站,包括軟文交易平臺和軟文盈利網(wǎng)站。處罰包括:
對于軟文的交易平臺,將直接被屏蔽;對于軟文的發(fā)布站,將進(jìn)行不同程度的處理。比如一條新聞網(wǎng)站,有發(fā)布軟文的現象但情況不嚴重,搜索系統中的網(wǎng)站會(huì )被降級;如果大量使用子域發(fā)布軟文,則直接屏蔽子域,清空百度動(dòng)態(tài);即使為發(fā)布軟文創(chuàng )建了大量子域,整個(gè)主域也會(huì )被屏蔽。對于軟文受益站點(diǎn),如果一個(gè)網(wǎng)站的外鏈中有少量的軟文外鏈,則該外鏈會(huì )被過(guò)濾掉權重計算系統,而受益站點(diǎn)將在觀(guān)察一段時(shí)間后,根據情況進(jìn)一步處理;一個(gè)網(wǎng)站外鏈中有大量軟文外鏈,此時(shí)受益站點(diǎn)將被降級或直接屏蔽。結構化數據 - 幫助您的網(wǎng)站獲得更多點(diǎn)擊
網(wǎng)頁(yè)經(jīng)過(guò)爬取和建庫,參與排序計算,最終展現在搜索引擎用戶(hù)面前。目前百度搜索左側的結果展示形式有很多種,比如:鳳巢、品牌專(zhuān)區、自然結果等,如何讓一個(gè)自然結果獲得更多點(diǎn)擊是站長(cháng)考慮的重要部分。
目前自然結果分為兩類(lèi),如下圖所示。第一個(gè)是結構化的呈現,它有多種形式。目前覆蓋了80%的搜索需求,即80%的關(guān)鍵詞都會(huì )出現這種復雜的展示風(fēng)格;第二種是單段摘要展示,最原創(chuàng )的展示方式,只有一個(gè)標題,兩行摘要,部分鏈接。
顯然,結構化呈現可以清晰地向用戶(hù)傳達信息,直擊用戶(hù)需求痛點(diǎn),自然獲得更好的點(diǎn)擊量。目前結構化展示有幾種風(fēng)格:
圖片:擴大區域,方便用戶(hù)了解網(wǎng)頁(yè)內容,吸引點(diǎn)擊
那么站長(cháng)如何才能得到顯示的結果:






