什么是搜索引擎的緩存機(jī)制




為了能在極短的時間內(nèi)響應(yīng)用戶的查詢請求,搜索引擎除了在用戶提交查詢信息前就生成關(guān)鍵字對應(yīng)的頁面排序列表以外,還需要為那些查詢最頻繁的關(guān)鍵字對應(yīng)的頁面排序列表建立緩存機(jī)制。
經(jīng)過統(tǒng)計,搜索引擎發(fā)現(xiàn)關(guān)鍵字查詢的集中現(xiàn)象非常明顯。查詢次數(shù)最多的前20%的關(guān)鍵字大約占了總查詢次數(shù)的80%(就這是著名的80/20法則)。因此,只要我們對這20%左右的關(guān)鍵字建立緩存就可以滿足80%的查詢需求。
由于用戶查詢時返回的信息主要是與關(guān)鍵字相關(guān)的頁面排序列表,因此關(guān)鍵字緩存機(jī)制的建立主要是針對與關(guān)鍵字相關(guān)的頁面排序列表。在對常用關(guān)鍵字的頁面排序列表建立緩存后,搜索引擎就可以把緩存中的信息返回給用戶,這樣速度就會非??欤簿湍軡M足絕大部分用戶的需求。
由于互聯(lián)網(wǎng)中的信息是時刻都在增長的,如果搜索引擎每次都向用戶返回同樣的信息。不但用戶得不到更高質(zhì)量的信息,其他網(wǎng)站也不能向用戶展示最新的高質(zhì)量信息,從而造成信息滯后。因此,搜索引擎還會對緩存中的內(nèi)容進(jìn)行定期更新。