如何利用分詞技術(shù)打一個(gè)翻身仗




分詞技術(shù)并不是百度的強(qiáng)項(xiàng),而是通過(guò)第三方的分詞技術(shù)應(yīng)用于自己是網(wǎng)站搜索上的,分詞主要是通過(guò)對(duì)實(shí)詞和虛詞的分割,找到對(duì)用戶來(lái)說(shuō)有用的詞這些詞往往就被稱作關(guān)鍵詞,通過(guò)對(duì)分詞技術(shù)的了解,讓我們能夠有效的提升網(wǎng)站關(guān)鍵詞的指定,同時(shí)也有助于提升網(wǎng)站的排名!
通常分詞算法是針對(duì)百度而言的,谷歌因?yàn)閷?duì)分詞技術(shù)不敏感,所以在中文搜索市場(chǎng)上,百度一直是領(lǐng)導(dǎo)者,返回的結(jié)果往往對(duì)用戶更加的有用,所以我們做網(wǎng)站優(yōu)化如果主要針對(duì)的是中文群體,那么了解百度的分詞技術(shù)是非常必要的!下面我們就來(lái)具體的說(shuō)明一下百度的分詞技術(shù)!
一般而言,百度的中文分詞是基于詞典和統(tǒng)計(jì)的兩種匹配方式,這兩種方法并不是單獨(dú)存在的,而是相互聯(lián)系相互影響的!
一:基于詞典的匹配方法
這是一種根據(jù)用戶的搜索詞語(yǔ)按照詞典中的詞語(yǔ)進(jìn)行拆分,如果能匹配成功怎會(huì)切分成一個(gè)一個(gè)的單詞,然后再根據(jù)方向上的不同,將這個(gè)單詞分成正向和逆向的兩種匹配方式,在正向的匹配中,又能夠按照詞語(yǔ)的長(zhǎng)度不同又細(xì)分為最大匹配和最小匹配兩種方式!這種分詞技術(shù)單詞匹配的程度主要取決于詞典的完整性以及最新的更新情況!
對(duì)于這種分詞技術(shù),我們?cè)谧鯯EO優(yōu)化的時(shí)候,在首頁(yè)目標(biāo)關(guān)鍵詞的選擇上就要結(jié)合這方面的原理,不能夠人造單詞,除非你能夠造出“神馬都是浮云”能夠紅遍大江南北的詞,否則是很難獲得流量的,就算是你能夠?qū)⒕W(wǎng)站的排名提升到首頁(yè)上,那也不管用!而且對(duì)于陌生的詞匯,百度的搜索結(jié)果可能都不會(huì)返回結(jié)果,你的網(wǎng)站因此而不會(huì)被收錄,所以在關(guān)鍵詞的選擇上一定要根據(jù)常用詞,根據(jù)詞典詞來(lái)進(jìn)行選擇!
二:基于統(tǒng)計(jì)分詞的方法
這種方法的分詞技術(shù),會(huì)需要搜索引擎進(jìn)行大量的計(jì)算,比如字與字相鄰的概率如何,某個(gè)短語(yǔ)在什么地方出現(xiàn)的最多,用戶在搜索某個(gè)詞語(yǔ)或者詞的時(shí)候會(huì)尋找什么樣的內(nèi)容,這都是搜索引擎基于判斷的標(biāo)準(zhǔn),這個(gè)方法能夠迅速對(duì)新詞作出反應(yīng),比如當(dāng)一個(gè)新聞熱詞出現(xiàn)的時(shí)候,很多人都會(huì)用這個(gè)新詞來(lái)搜索這個(gè)詞,比如小月月,比如藥佳鑫等等,如果搜索引擎對(duì)這些詞無(wú)動(dòng)于衷,那么用戶肯定不會(huì)使用這樣的垃圾搜索引擎的!
對(duì)于這種情況,我們就可以在做SEO優(yōu)化時(shí),要充分考慮到內(nèi)容的相關(guān)性,我們簡(jiǎn)單的那A5網(wǎng)站做個(gè)例子,當(dāng)A5第一次出現(xiàn)的時(shí)候,搜索引擎肯定不知道這是什么樣的詞,當(dāng)大家都用A5這個(gè)詞搜索,而且都希望找到的是ADMIN5這個(gè)網(wǎng)站,自然搜索引擎就會(huì)隨著自己的計(jì)算統(tǒng)計(jì),然后就能夠把A5當(dāng)成admin5了!這就是一個(gè)相關(guān)性的妙用,還有就是趕驢網(wǎng)對(duì)趕集網(wǎng)來(lái)說(shuō),也是利用分詞技術(shù)打得一個(gè)非常漂亮的仗!