搜狗搜索引擎優(yōu)化(ssp/seo)的三種方式介紹
優(yōu)采云 發(fā)布時(shí)間: 2022-05-01 01:01搜狗搜索引擎優(yōu)化(ssp/seo)的三種方式介紹
搜狗搜索引擎優(yōu)化(ssp/seo):searchengineserviceprovider(ssp)主要是幫助搜索引擎蜘蛛找到正確內容并且排序優(yōu)化。搜索引擎搜索內容的方式有三種:一種是用戶(hù)向搜索引擎發(fā)送查詢(xún),搜索引擎對結果進(jìn)行搜索匹配,獲得查詢(xún)內容;二是用戶(hù)點(diǎn)擊查詢(xún),搜索引擎對頁(yè)面進(jìn)行搜索匹配,獲得頁(yè)面內容;三是用戶(hù)通過(guò)搜索引擎搜索到的內容到達搜索結果頁(yè)面,獲得結果內容。這里主要介紹三種方式。
1、用戶(hù)向搜索引擎發(fā)起查詢(xún)
2、搜索引擎對頁(yè)面進(jìn)行搜索匹配
3、用戶(hù)通過(guò)搜索引擎搜索到的內容到達搜索結果頁(yè)面,獲得搜索結果內容ssp只是從中間過(guò)渡一下,并不是從整個(gè)頁(yè)面抓取。1.用戶(hù)向搜索引擎發(fā)起查詢(xún)在早期的搜索引擎優(yōu)化的時(shí)候一般做法是先獲得原始網(wǎng)頁(yè),然后放上去。之后針對網(wǎng)頁(yè)進(jìn)行操作,例如:替換、標記、修飾等,使得網(wǎng)頁(yè)看起來(lái)是一個(gè)完整的網(wǎng)頁(yè),不能只是id、pa、jd這種簡(jiǎn)單的文字替換。
這個(gè)時(shí)候就涉及到一個(gè)問(wèn)題,如果用戶(hù)自行輸入,我們輸入框里面是無(wú)法識別的,也就是說(shuō)用戶(hù)自己輸入是否能識別這些內容,這時(shí)候網(wǎng)頁(yè)抓取端的響應就是進(jìn)行判斷以及cookie處理。2.搜索引擎對頁(yè)面進(jìn)行搜索匹配這里的頁(yè)面包括網(wǎng)頁(yè)和服務(wù)器上的page,可以理解為二者是等價(jià)的。匹配原理是,先從網(wǎng)頁(yè)庫中查找,看它的頁(yè)面有沒(méi)有東西,如果沒(méi)有再從服務(wù)器找。
page查找完了之后,判斷url,如果url有東西再從服務(wù)器匹配id。如果有東西,那么此時(shí)抓取抓取好并且有url,url指向page,獲得page內容;如果沒(méi)有東西,那么再從服務(wù)器找或者是網(wǎng)頁(yè)page里面的內容。服務(wù)器一般有extrapage服務(wù)器和vlan查找等。page匹配之后的數據通過(guò)requestheader傳輸到服務(wù)器上,服務(wù)器判斷這個(gè)url是否能夠訪(fǎng)問(wèn)到搜索結果頁(yè)面,如果能夠匹配到,轉向到url,并且注明requestheaderuri。
如果搜索結果頁(yè)面是靜態(tài)頁(yè)面,那么requestheader直接在域名下面寫(xiě)就行,也可以自己設置。url服務(wù)器端轉發(fā)時(shí)在地址欄寫(xiě)url:requestheaderuri這里requestheaderuri需要注意的問(wèn)題,就是uri為域名,一般是gov\china\edu\mail,這里要注意網(wǎng)站域名的前綴,但是不要寫(xiě)太長(cháng)。
如果是靜態(tài)頁(yè)面url服務(wù)器端必須設置為相同的前綴,否則服務(wù)器端判斷不清楚。否則轉發(fā)成功,但是網(wǎng)頁(yè)page內容仍然無(wú)法訪(fǎng)問(wèn)。page頁(yè)面抓取完成之后有cookie和url轉發(fā)這兩種方式,我們一般設置成url轉發(fā)。如果url轉發(fā)成功,再開(kāi)始向搜索引擎發(fā)起搜索訪(fǎng)問(wèn)。這個(gè)步驟時(shí)用戶(hù)發(fā)起的,不是搜索引擎直接向用戶(hù)發(fā)起的,當然搜索引擎也會(huì )進(jìn)行轉發(fā)。url轉發(fā)完成之后。