關于百度標題各個規則優先級的梳理,以 pc 端為例。
服務器
1. 百度蜘蛛判斷網頁編碼字符集
2. 抓取網頁標題,部分繁簡轉換
3. 部分全角標點符號轉換半角標點符號
4. 阿拉丁結果(sp)、最新相關信息(中間頁)等優先級高于過濾重復標點符號
5. 把連續重復超過 3 次的部分標點符號替換為 3 次
客戶端
1. 選擇何種編碼的百度搜索(UTF-8, GB2312, Big5, etc.)
2. 搜索框輸入查詢字符串
3. “百度一下”替換不同編碼,并將部分全角符號替換為半角符號及安全過濾
4. HTML 實體轉換
5. 是否開啟不糾錯策略 f=12&nojc=0(開),f=13&nojc=1(閉)
服務器
1. 編碼轉換
2. F2-78 參數所指策略
3. 標題前后綴
4. 分詞技術
5. 匹配飄紅
6. 計算可展現字數
7. 各種截斷
客戶端
1. 展現在用戶眼前的可見標題(3-64 字節)
2. 點擊標題
服務器
1. 用戶點擊過的標題以 4-65 字節長度存入數據庫
1.2 平板電腦
www.baidu.com/s?dsp=ipad&wd=ipad Pad 版
百度 Pad 版研究不多,新買了一塊 iPad mini 2 測試 Pad 版搜索結果標題長度,大致和 pc 端規則一致。
評論(0人參與,0條評論)
發布評論
最新評論