<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    從搜索引擎的排序算法淺談做站的方向

    作者:草根香蕉皮 瀏覽:142 發(fā)布時(shí)間:2017-05-04
    分享 評(píng)論 0

    最近在思考有關(guān)搜索引擎排序的一些內(nèi)容,有一些不成熟的想法,拿出來(lái)分享討論。


      搜索引擎在頁(yè)面爬行,正文內(nèi)容提取,分詞建立倒排索引以后,將對(duì)檢索關(guān)鍵字進(jìn)行分詞,并提取出詞性為名詞,字符串等比較重要的詞到分詞索引庫(kù)取交集,即會(huì)得到一個(gè)包含具備基本相關(guān)度的頁(yè)面文件集合,之后將會(huì)進(jìn)入頁(yè)面排序部分。


      在頁(yè)面排序部分,有兩個(gè)部分是特別重要的,一個(gè)是頁(yè)面在搜索引擎里面的權(quán)重分?jǐn)?shù),還有一個(gè)是重要詞性的分詞出現(xiàn)在頁(yè)面的位置(標(biāo)題,有效正文的最開(kāi)始區(qū)域等),我認(rèn)為這兩個(gè)部分的分?jǐn)?shù)基本上決定了大體的排名位置,其中頁(yè)面的權(quán)重分?jǐn)?shù)所占的比例會(huì)更多(偏向于認(rèn)為是最大,并且比其他因素都大很多),檢索詞的其他詞性如形容詞,介詞等分詞的完整匹配出現(xiàn)會(huì)獲得一小部分的加分。


      頁(yè)面的權(quán)重分?jǐn)?shù)在不同的搜索引擎傾向會(huì)有明顯的不同,總體來(lái)說(shuō),都和鏈接關(guān)系密切相關(guān),鏈接關(guān)系分為相關(guān)性有效鏈接(導(dǎo)出鏈接的網(wǎng)站內(nèi)容,錨文本,目標(biāo)網(wǎng)站高度相關(guān))和高信任度鏈接(來(lái)自大網(wǎng)站,gov,edu等高PR值網(wǎng)站),這兩種鏈接具體可以參考Hilltop算法和Trustrank算法,其中Hilltop算法想法非常有趣,在該算法的一個(gè)專利版本里面提到了對(duì)最初的搜索結(jié)果頁(yè)面集合再次進(jìn)行鏈接關(guān)系相關(guān)性計(jì)算,以進(jìn)一步精確在該檢索詞范圍權(quán)重最高的頁(yè)面。


      頁(yè)面權(quán)重分?jǐn)?shù)還會(huì)涉及到域名的建站時(shí)間因素(這里我認(rèn)為不僅僅是因?yàn)殒溄哟嬖诘臅r(shí)間因素),在百度的算法里,主域名的權(quán)重對(duì)子域名和頁(yè)面的權(quán)重影響也會(huì)比谷歌大很多。


      在這些步驟完成后,會(huì)進(jìn)入最后一個(gè)反作弊模塊,處理掉那些作弊積分超過(guò)一定程度的頁(yè)面以及在沙盒里的頁(yè)面,然后得到最終的排序結(jié)果。


      在考慮這個(gè)搜索引擎排序算法的時(shí)候,基本上就可以確定大部分的頁(yè)面是沒(méi)有機(jī)會(huì)在搜索引擎里面獲得展出的,這是因?yàn)闄?quán)重在搜索引擎的算法里占有高度優(yōu)先級(jí)的原因。


      在可以獲得的數(shù)據(jù)里,我認(rèn)為曾經(jīng)的谷歌PR值是最接近能反映頁(yè)面權(quán)重的數(shù)據(jù),雖然已經(jīng)停止更新一年了。愛(ài)站,CHINAZ等第三方網(wǎng)站提供的百度權(quán)重是基于從百度引導(dǎo)過(guò)去的流量為標(biāo)準(zhǔn)進(jìn)行計(jì)算的結(jié)果,雖然能一定程度反應(yīng)域名的權(quán)重,不過(guò)這種以結(jié)果論的方式來(lái)說(shuō)明問(wèn)題不太準(zhǔn)確,以提高頁(yè)面權(quán)重的目標(biāo)來(lái)說(shuō),這些第三方數(shù)據(jù)不能作為標(biāo)準(zhǔn)。


      因此,做網(wǎng)站不應(yīng)該是追求大量采集內(nèi)容(就像許多人拼命來(lái)采集谷粉搜搜的內(nèi)容一樣),或者勤于天天更新簡(jiǎn)單的原創(chuàng),采集的內(nèi)容和簡(jiǎn)單的原創(chuàng)如果沒(méi)有人分享,不能吸引高質(zhì)量的鏈接,頁(yè)面的權(quán)重就不會(huì)上升,就得不到排名的機(jī)會(huì),同樣也吸引不了用戶。


      因此,做網(wǎng)站應(yīng)該更新有價(jià)值的原創(chuàng),能夠吸引來(lái)自許多網(wǎng)站的正文相關(guān)鏈接,或者做出有價(jià)值的工具網(wǎng)站讓更多人使用分享,獲得許多高信任度的鏈接,只有這樣,在搜索引擎排序最重要的權(quán)重分?jǐn)?shù)排序階段,獲得更多機(jī)會(huì)。


    selaoban在线视频免费精品| 久久国产精品无码HDAV | 亚洲国产日韩一区高清在线| 日韩欧美亚洲国产精品字幕久久久| 精品熟女少妇av免费久久| 亚洲第一极品精品无码久久| 成人午夜视频精品一区| 香蕉视频在线精品| 日韩社区一区二区三区| 国产精品一区二区资源| 午夜精品福利在线观看| 精品久久久无码人妻中文字幕豆芽| 国产精品免费网站| 精品久久久久久无码专区| 亚洲精品成人久久| 91精品国产高清久久久久| 99精品一区二区三区| 久久99精品久久久久久首页| 久久精品国产亚洲麻豆| 国产啪精品视频网站免费尤物| 精品无码一级毛片免费视频观看 | 中文字幕无码精品亚洲资源网| 亚洲国产精品视频| 一本大道无码日韩精品影视_| 无码精品久久一区二区三区| 视频二区国产精品职场同事 | 久久精品99国产精品日本| 精品综合久久久久久97超人| 国内精品九九久久久精品| 97人妻精品全国免费视频| 手机在线观看精品国产片| 中文字幕在线亚洲精品| 自拍偷在线精品自拍偷| 精品久久久久久国产91| 国产成人精品手机在线观看| 亚洲国产精品国自产拍AV| 久久久久成人精品| 久久久久亚洲精品无码蜜桃| 99国产精品免费视频观看| 麻豆文化传媒精品一区二区| 久久精品青青草原伊人|