索引庫
作者:聚擎
瀏覽:1246次
發(fā)布時間:2017-04-23




索引庫就類似于我們查字典時候的檢索表,或者是圖書館的書目檢索。Google的蜘蛛在抓取網(wǎng)頁之后,就把這些頁面放到對應的索引庫里面。在用戶搜索的時候,只需要到相應的檢索庫里面搜索相應的信息,而不是從所有的頁面當中。
中文名
索引庫
類似于
我們查字典時候的檢索表
分類根據(jù)
詞語
用 于
網(wǎng)絡
目錄
索引庫的分類方式
索引庫里用詞語來分類。因為盡管互聯(lián)網(wǎng)上的網(wǎng)頁是不斷激增的,但是每一種語言里,詞語的數(shù)量都是相對固定的。比如英語就是一百多萬個單詞,100億 ÷ 1百萬 = 1 萬;漢語是8萬多個詞語,100億÷8萬=12萬5千。都是計算機很容易處理得過來的。
用詞語來分類還有一個好處,就是可以匹配用戶查詢的那個詞語。本來用戶就是要查這個詞語的,那我就按這個詞語去分類就是。所以,搜索引擎的索引庫,最后就是這個樣子的: