<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    百度首席架構師揭密:算法是百度工程師的利器

    作者:軒情浪子 瀏覽:293 發布時間:2018-04-20
    分享 評論 0

      “工欲善其事,必先利其器”,對于百度工程師來說,算法就是他們解決難題的利器。


      為什么這么說?因為百度搜索引擎研發的各個環節都離不開算法。我們需要快速,準確、實用、創新和不斷改進的算法來滿足用戶的需求。


      百度面對的是海量的互聯網數據,以及每天上億次的檢索請求。它要求百度能夠收錄和索引超過10億的中文網頁,并提供快速的檢索服務。這只有高效率的算法才能完成。


      百度招聘的工程師在加入公司后,有一道入門練習題,就是編寫一個數據掃描分析程序,要求寫出的程序能在1分鐘之內掃描分析完千萬量級的數據,才算及格。高水平的程序員可以利用高效的算法在10秒以內解決問題,甚至只要六七秒。但如果沒用對算法,花一星期的時間,也做不到1分鐘之內。


      大家可以設想一下,百度有十億以上的網頁,如果要在一周甚至三天內處理一遍,平均每秒處理要多少個?每天1億次的檢索又意味著峰值時每秒要處理多少次檢索?事實上,針對一個問題,我們可以想出很多的算法,但如果效率不高,是無法真正投入使用的。


      Web搜索引擎是一個很新的研究領域,因為從它誕生到現在不過10年左右的時間。學術界IR(Information Retrieval)領域的研究為搜索引擎提供了不少算法方面的理論基礎模型,但這些理論距構建一個好的Web搜索引擎還有很大一段距離。這需要我們探索和開發很多新的算法及系統。實際上,百度搜索引擎中的很多算法都極具創新性,而且都是基于實際應用的需求。這是和學術界研究工作的一個較大差異。學術界的算法研究主要是為了解決某個學術方面的問題,不是太關注實用性,以及效率。


      舉個例子來說,在傳統的中文分詞算法研究中,學術界最關注的是能達到多高的準確率,但對算法的運行速度上考慮的相對較少??稍诎俣?,如果使用的分詞算法速度太慢,就根本無法應用。此外,百度面對的是Web上的大量數據,大部分傳統的IR算法都會遇到信息爆炸的問題,我們需要想出很多新的方法來解決這些問題。這對我們的工程師的算法提出了很高的要求。


      Web上的數據是不斷變化的,用戶的檢索需求也是不斷變化的。百度就是要在這不斷變化的兩者之間需找一個最佳匹配。所以百度的算法需要持續的進行改進,以迅速適應這些變化。比如對搜索引擎來說有一個方面的技術很重要,就是判斷一個網站是否在作弊的方法。由于那些針對搜索引擎作弊的人,如果能提高搜索引擎排名,將獲得巨大的經濟利益,所以他們會不斷使用各種方法去猜測百度算法中潛在的漏洞,進行攻擊。這是一個很復雜的問題,而且仍在不斷發展變化中。這就要求我們能夠迅速的發現這類問題,提出算法,并應用到百度搜索引擎中。在最短時間內消滅問題。否則作弊行為很快就會泛濫成災。


      在百度,算法的應用是融入到研發部門每個人的工作中的。在這里,不是經理告訴工程師做什么,怎么做,用什么算法,而是需要工程師自己在某個領域去發現問題,提出算法,評估效果,并不斷改進。這要求每個工程師在算法上的基本功很強,并能靈活的加以應用,以解決實際問題?,F在,百度有不少的程序員,他們大部分的時間是用在發現問題,分析問題,思考解決問題的方法上。實際編寫代碼所花的時間并不多。


      有不少人覺得,現在的搜索引擎已經足夠好了,算法上沒有太多改進余地了。我不贊成這個觀點。雖然每次CNNIC互聯網用戶調查的數據顯示,超過90%的人對搜索引擎提供的服務表示滿意,但是第一次搜索就能找到滿意結果的用戶只有50%左右,很多用戶都是在多次更換關鍵詞之后才搜索到自己想要的結果。這說明我們還有巨大的改進空間。讓所有用戶能在第一時間找到他們想要的信息,是我們的最終目標。


      可以說,搜索引擎開發中使用的基本算法大部分都在大學課程中涵蓋了。對于一個人來說,在學校學習過這個算法,和能夠靈活運用是兩個概念。只有通過參與較多的項目開發和程序編寫,將算法和應用相結合,才能在這方面得到較好的發展。 對于算法學習,我的建議還是多思考,多做項目和程序。在做的過程中肯定會遇到一些問題,這是正常的。好的程序員善于從問題和失敗中學到東西,舉一反三,設法避免以后出現同樣或類似的錯誤。另外,還要善于從別人身上學習,有意識的進行思考和總結,這是比較有效的方式。


    亚洲国产精品视频| 国产成人无码精品一区二区三区 | 99久久婷婷免费国产综合精品| 精品av天堂毛片久久久| 欧洲精品无码一区二区三区在线播放| 亚洲午夜成人精品无码色欲| 伊人久久国产精品| 国产在线精品国自产拍影院同性| 无码人妻精品一区二区三区夜夜嗨 | 国产精品理论电影| 久久99国产综合精品| 国产精品hd免费观看| 精品剧情v国产在免费线观看| 久久久久亚洲精品无码系列| 老司机福利精品视频| 成人精品一区二区激情| 久久亚洲日韩精品一区二区三区| 香蕉视频在线精品| 精品伊人久久大线蕉地址| 999久久久免费精品播放 | 久久精品国产亚洲Aⅴ香蕉| 国产精品国产三级国产专播下 | 国产精品自产拍在线观看花钱看 | 亚洲精品成人片在线观看精品字幕 | 91国在线啪精品一区| 中文字幕日韩精品一区二区三区 | 精品无码久久久久久国产| 久久精品中文闷骚内射| 国内精品在线视频| 精品久久久久久久中文字幕| 日韩人妻无码一区二区三区 | 精品无人区无码乱码大片国产| 国产福利电影一区二区三区,日韩伦理电影在线福 | 日韩视频免费在线| 国产美女精品三级在线观看 | 亚洲日韩精品无码专区加勒比☆| 精品毛片乱码1区2区3区| 亚洲午夜国产精品无卡| 亚洲国产精品久久66| 亚洲精品无码久久久久| 国产精品高清在线|