<ul id="g60s4"><pre id="g60s4"></pre></ul>
<strong id="g60s4"><nav id="g60s4"></nav></strong>
<ul id="g60s4"></ul>
  • <tr id="g60s4"></tr>
  • 
    
  • 或者

    揭秘搜索引擎中的反SEO作弊研究

    作者:數風流人物 瀏覽:147 發布時間:2018-03-21
    分享 評論 0

    SEO簡稱為搜索引擎優化。其主要工作是通過了解各類搜索引擎如何抓取互聯網頁面、如何進行索引以及如何確定其對某一特定關鍵詞的搜索結果排名等技術,來對網頁進行相關的優化,使其提高搜索引擎排名,從而提高網站訪問量,最終提升網站的銷售能力或宣傳能力的技術。


    在國外,SEO開展較早,那些專門從事SEO的技術人員被Google稱之為searchengineoptimizers(SEOers)。由于Google是目前最大的搜索引擎提供商,Google也成為了全世界SEOers的主要研究對像。為此Google官方網站專門有一頁介紹SEO,并表明 Google對SEO的態度。


    SEO的出現最早是研究搜索同HACK找尋漏洞的技術發展中引渡過來的,一部分人發現了這個可以左右搜索排名的機制問題,而在世界頂級搜索引擎Google的飛速發展及排名算法機制不斷更新的情況下,SEO技術及隊伍也在近些年來飛速發展和壯大,人們對它的認可和重視也與日俱增。


    一、SEO作弊

    1、什么是seo作弊


    搜索引擎作弊,或稱為SEO作弊、SEOSpam、搜索引擎垃圾等,是指為了提高在搜索引擎中展現機會和排名的目的,欺騙搜索引擎的行為。


    2、如何作弊


    由于技術型搜索引擎在網站排名過程中完全由蜘蛛程序自動完成,沒有人工參與,這為那些針對排名原理而采用欺騙蜘蛛程序的手段提供了成功的可能性。在SEO的發展過程中,一直伴隨著關于作弊方法的討論,成為業界關注的話題。成為SEO必須了解基本的作弊手段,目的是避免無意間采用了相關手段遭到處罰。以下是被視為作弊的常見手段


    a)、關鍵字堆砌。為了增加關鍵詞的出現頻次,故意在網頁代碼中,如在META、title、注釋、圖片ALT以及URL地址等地方重復書寫某關鍵詞的行為(stuffing)。


    b)、虛假關鍵詞。通過在META中設置與網站內容無關的關鍵詞,如在title中設置熱門關鍵詞,以達到誤導用戶進人網站的目的。同樣的情況也包括鏈接關鍵詞與實際內容不符的情況。


    c)、隱形文本/鏈接。為了增加關鍵詞的出現頻次,故意在網頁中放一段與背景顏色相同的、包含密集關鍵字的文本。訪客看不到,搜索弓I擎卻能找到。類似方法還包括超小號文字、文字隱藏層等手段。隱藏鏈接是在隱形文本的基礎上,在其他頁面添加指向目標優化頁的行為。


    d)、重定向(re-direct)。使用刷新標記(metarefresh)、CGI程序、Java、JavaScript或其他技術,當用戶進人該頁時,迅速自動跳轉到另一個網頁。重定向使搜索引擎與用戶訪問到不同的網頁。


    e)、偷換網頁。也稱誘餌行為(bait- -switch),是在一個網頁成功注冊并獲得較好排名后,用另一個內容無關的網頁來替換它的行為。


    f)、復制站點或內容。通過復制整個網站或部分網頁內容并分配以不同域名和服務器,以此欺騙搜索引擎對同一站點或同一頁面進行多次索引的行為。鏡像站點(miiwsites)是此中典型。


    g)、橋頁/門頁(bridge/doorway/portal/entry)。計對某一關鍵詞專門制作一個優化的頁面,鏈接指向或重定向到目標頁面。有時候為動態頁面建立靜態人口,或為不同的關鍵詞建立不同內頁也會用到類似方法。但與橋頁不同的是,前者是網站實際內容所需而建立的,是訪問者所需要的,而橋頁本身無實際內容,只針對搜索引擎作了一堆充斥了關鍵詞的鏈接而巳。


    h)、隱形頁面(cloakedpage)。指同一個網址下對不同的訪問者選擇性地返回不同的頁面內容,搜索引擎得到了高度優化的網頁內容,而用戶則看到不同的內容。


    i)、重復注冊。違反網站提交紀律,突破時間間隔限制,將一個網頁在短時間內反復提交給同一個搜索引擎以獲得收錄的做法。


    j)、垃圾鏈接。加人 鏈接工廠 (亦稱大量鏈接機制)是由大量網頁交叉鏈接而構成的一個網絡系統。一個站點加入 鏈接工廠 后,它可得到來自該系統中所有網頁的鏈接,同時作為交換,它需要 奉獻 自己的鏈接,以此方法來提升鏈接得分。


    二、搜索引擎反作弊

    1、為什么捜索引擎要反作弊


    對于上述提到的搜索引擎作弊行為,幾乎所有搜索弓I擎都是反對的。SEOspam的破壞性是相當巨大的,它不僅直接破壞了搜索引擎網站賴以生存的關鍵所在,即每日數以億計的用戶搜索體驗,同時也破壞了搜索引擎獲得收益的主要來源,如競價排名以及相關廣告。


    搜索引擎反作弊類同于互聯網的病毒與反病毒。因此,作為搜索引擎,對待垃圾和作弊網站的態度也是高度一致:懲罰或者刪除。幾乎所有的捜索引擎官方站點也公布了一些原則,對作弊行為進行鑒定,并給出了對應的懲罰措施。比如2005年3月26日凌晨4點,忍無可忍的Google突然發力,將一大批spam 站點清除。


    2、反作弊


    搜索引擎作弊其實不僅僅是損害了搜索引擎擁有者的利益。從長遠看,如果網站的本身質量并沒有提高,而是通過搜索引擎作弊來吸引瀏覽者,那么網站最終還是得不到用戶的青睞,無法留住瀏覽者,最終受到傷害的還是網站本身。


    雖然通過技術手段不可能完全杜絕各種搜索引擎作弊行為,但還是能夠有效減少這些行為。解決辦法如下:


    a)、加強頁面內容的智能判斷。對于關鍵字堆砌和虛假關鍵字這兩種作弊行為,應加強智能判斷。例如從頁面的〈body〉 /body 部分 提取,而非〈title〉〈/title〉或者 meta〉〈/meta 部分;判斷關鍵宇是否僅在某一段落內重復,以去除惡意重復現象。對 于重定向這種行為,應對頁面內增加重定向分析。使用刷新標記進行重定向,可以在頁面內容中進行標記判斷;使用JavaScript來進行重定向,可以對頁 面中的JavaScript代碼進行判斷。


    b)、網絡爬蟲隱身。無論是隱形頁面、偷換頁面,還是重定向,都會對網站的當前訪問者進行判斷,從而對網絡爬蟲和普通用戶作出不同的反應。搜索引擎應該讓一部分網絡爬蟲隱身,裝扮成普通用戶來訪問網站,對網站進行測試,便可以有效杜絕這種類型的作弊。


    c)、網站歷史記錄。對網站的頁面變更記錄其歷史。一般來說一個W站的非內容部分的頁面變化是很小的,如網站目錄結構、頁面結構、很多特殊連接都是不經 常變化的。如果某一個網站變化較大,就有必要對此網站作進一步的審核。這樣做可以杜絕偷換網頁這一作弊方法,并提高人工審核的效率。


    d)、網站評級。一般來說,好的網站上的鏈接質量也會很高,而一些垃圾網站的鏈接也多是與其相似的網站。也就是說,網站也是聚類生存的。因此,可以對網站進行評級歸類,以有效預防通過垃鏈連接來作弊的網站。


    通過以上四種方法,可以有效提高搜索引擎的反SEO作弊能力,但這樣并不能完全杜絕SEO作弊。要想提高搜索引擎的反作弊能力,還必須要人的加入,綜合使用各種方法,逐級分層審査。


    第一層是提高技術手段。例如加強頁面的智能分析和網絡爬蟲的抓取能力,增加爬蟲隱身能力。其目的是進行最底層的反作弊判斷,判斷的對象是頁面,由電腦進行海量的重復性作業。


    第二層是網站分析。通過網站的歷史記錄與網站評級系統,對網站進行分析評價。目的是從中篩去合法的,找出有SEO作弊嫌疑的網站,判斷的對象是網站,由電腦和人進行比較篩選。


    第三層是最終評審。由人對篩選出的嫌疑網站進行試用、評審。判斷的對象是網站,完全由人完成,并得出最終結論。


    通過電腦與人工的合作作業,可以基本上杜絕搜索引擎優化中的作弊行為,使搜索引擎的結果更符合瀏覽者的需要。


    三、Google網頁評級系統

    Google搜索引擎采用的核心軟件PageRank是由Google創始人開發出的一套用于網頁評級的系統。這是Google搜索排名算法中的一個組 成部分,級別從1到10級,10級為滿分,PK值越高說明該網頁在搜索排名中的地位越重要。也就是說,在其他條件相同的情況下,PR值高的網站在 Google搜索結果的排名中有優先權。網頁級別由此成為Google所有網絡搜索工具的基礎。


    1、Google對網頁級別的描述


    作為組織管理工具,網頁級別利用了互聯網獨特的民主特性及其巨大的鏈接結構。實質上,當從網頁A鏈接到網頁B時,Google就認為A投了B 票。Google根據網頁的得票數評定其重要性。然而,除了考慮網頁得票數(即鏈接)的純數量之外,Google還要分析投票的網頁。重要的網頁所投出的票就會有更高的權重,并且有助于提高其他網頁的重要性。


    重要的高質量網頁會獲得較高的網頁級別。Google在排列其搜索結果時,都會考慮每個網頁的級別。當然,如果不能滿足用戶的查詢要求,網頁級別再高,對用戶來說也毫無意義。因此,Google將網頁級別與完善的文本匹配技術結合在一起,為用戶找到最重要、最有用的網頁


    Google所關注的遠遠不只是關鍵詞在網頁上出現的次數,它還對該網頁的內容(以及該網頁所鏈接的內容)進行全面檢査,從而確定該網頁是否滿足用戶的査詢要求。


    2、PR值算法原理


    PR值算法總體上基于下面兩個前提:


    a)、 個網頁被多次引用,則它可能是很重要的;一個網頁雖然沒有被多次引用,但是被重要的網頁引用,則它也可能是很重要的;一個網頁的重要性被平均傳遞到它所引用的網頁。這種重要的網頁稱為權威(authoritive)網頁。


    b)、假定用戶一開始隨機地訪問網頁集合中的一個網頁,然后跟隨網頁的鏈接向前瀏覽網頁,不回退瀏覽,那么瀏覽下 個網頁的概率就是被瀏覽網頁的PageRank值。


    影響PR值的因素如下:


    PR值體現為0~10的11個數值,在Google的工具欄上以一條橫向綠色柱狀圖顯示,0級情況下呈白色。它是針對網頁而不是網站,因此一個網站的首頁和內頁往往有著迥然不同的PR值。根據PR值的算法原理,可知影響一個網站(首頁)PR值的因素主要包括:


    1、網站的導人鏈接質量。(a)根據前文對高質量導入鏈接的分析,則獲得高PR值需要獲得來自網站的鏈接;(b)加人搜索引擎分類目錄;(c)與已經加 人目錄的網站交換鏈接;(d)獲得來自PR值不低于4并與用戶主題相關或互補的網站的鏈接;(e)用戶鏈接出現在流量大、知名度高、頻繁更新的重要網站上 (如新聞源)。(f)與用戶交換鏈接的網站具有很少導出鏈接;(g)與內容質量高的網站鏈接(PR值上升潛力大)。


    2、導出鏈接數量。根據PR計算原理,由于 一個網頁的重要性被平均傳遞到它所引用的網頁 ,反過來看,一個頁面內過多地導出鏈接將潛在引起該頁PR值的流失。但從內容的角度看,適當數量的與主題有關聯的導出鏈接給搜索引擎帶來良好的印象。因此,一個頁面,尤其是首頁的導出鏈接數量的把握,應該兼顧到PR值與關鍵詞內容兩者之間的平衡,即控制導出鏈接數量,以不超過10個為宜。


    3、搜索引擎收錄一個網站的頁面數量。在探討SEO的時候,人們過多關注核心關鍵詞排 名以及首頁的表現情況,卻往往忽略了一個極其重要的問題,即搜索引擎對一個網站收錄的頁面數量。后者在SEO中也有著極其重要的意義。一個用核心關鍵詞查 詢排名不佳的網站,可能由于被抓取大量網頁而在用戶使用其他關鍵詞查詢時內頁獲得前三甲排名。由于用戶搜索時使用的關鍵詞具有分散性,使得這種情況往往給 網站帶來極大的訪問量。


    正因為收錄頁面的數量直接影響訪問量,所以對PR值的影響也是很大的。被收錄頁面越多,主頁PR值越高。不過需要強調的是,此處所指的數量是指被收錄數與網站頁面總數的比值,而不是收錄頁面的絕對數值。但對各個搜索引擎來說,究竟達到多大的比值算是良好,目前還沒有相關的數據。


    4、首頁PR的高低。盡管對PR的界定是針對網頁而不是網站,但由于每個網頁都依托某一網站而存在,首頁是推廣的核心頁面,網站 首頁PR高低對內頁各PR也產生直接影響。 般而言,一個網站各頁面的PR值呈現以下走向:首頁 級頁面 二級頁面 三級頁面 每 深人一級,PR降低一或兩個檔次。更深層次可能就無法列人評級范圍了。當然,如果一個深層內頁有很多外部或內部鏈接,情況則另當別論。


    5、文件類型。Google可以索引到的網頁和文件類型包括pdf、asp、jsp、html、shtml、xml、cfin、doc、xls、ppt、 rtf、wks、lwp、wri、swf。做成PDF格式的文件往往都是網站比較重要的內容或文章。因此Google默認PDF格式文件的PR值為3,高于一般HTML文件。同理,Google給予XML、PS、Woid、PowerPoint、Excel等類型頁面的PR值也比普通網頁文件高。因此,對 于網站比較有價值的內容,建議做成pdf格式。


    6、PR值的更新。Google每個月進行一次徹底的數據更新(google dance),更新后的網站排名和導人鏈接都會有某些變化,但其PR更新時間一般要延遲至dance后三個月左右,而且網站的PR值相對穩定,要上升或下降一級PR是很不容易的事情。


    7、PR值的作用。由于網頁級別的高低直接受鏈接的影響,而鏈接僅是SEO的一個方面,PR的高低只能反映出SE0的部分效果。一個網頁如果擁有高PR值能夠 說明的僅是:a)網頁比較重要,擁有排名靠前的優先權,并不能與排名靠前直接劃上等號;b)具有獲得高質量導入鏈接的談判優勢;c)搜索引擎會加快對網頁 數據的更新;d)看上去挺美。


    正因為具有排名靠前的優先權和談判優勢,使得高PR網站往往最終確實產生高排名,業內不少人士就干脆直接將 PR與SEO劃等號,這不僅不正確,也不利于SEO實施。因為PR值不高的網站同樣有可能獲得好的排名,而PR值高的不見得有理想的排名。并且在這樣的思想指導下,人們往往片面追求鏈接效應,忽略了SEO對于內容、結構、關鍵詞等方面的分析和改進,而后者才是用戶和搜索引擎長期關注的焦點。網絡營銷人士認為:PR值的高低應該是包括SEO在內的搜索引擎營銷所產生的自然結果,而不應該作為追求的目標。


    對于搜索引擎優化,各大搜索引擎的態度是不同的,有的并不表態,有的公開支持。合法的搜索引擎優化應該是值得鼓勵的,可以為搜索引擎提供更為精確的網站索引。 搜索引擎優化中的作弊行為是被各大搜索引擎一致拒絕并提供了各種處罰措施。要想完全杜絕搜索引擎排名中的作弊行為是不可能的,一個成功的搜索引擎應必須要做到盡量避免索引到垃圾頁面。要做到這個目標,就必須從域名的分析到頁面內容的抽取、從網站歷史行為到最新頁面狀態的檢索都進行檢査。可以肯定的是,各大搜索引擎的反作弊策略只是剛剛開始。


    91精品国产自产在线观看永久∴| 久久精品成人国产午夜| 成人精品国产亚洲欧洲| 国产精品一区二区久久精品| 乱色精品无码一区二区国产盗| 亚洲综合精品香蕉久久网| 国产精品内射久久久久欢欢| 日韩加勒比一本无码精品| 日韩一级视频在线观看播放| 香蕉久久夜色精品国产| 国产1024精品视频专区免费| 久久精品国产免费观看三人同眠| 亚洲国产精品自在线一区二区| 久久免费国产精品一区二区| 中文字幕精品无码一区二区三区| 久久综合精品国产一区二区三区| 国产A√精品区二区三区四区 | CAOPORM国产精品视频免费| 亚洲AV无码成人精品区日韩 | 国产成人无码久久久精品一| 91麻豆精品国产91久久久久久| 亚洲动漫精品无码av天堂| 国精品午夜福利视频不卡麻豆 | 亚洲精品无码久久久久久| 中文字幕国产精品| 国产麻豆精品原创| 国产精品1024永久免费视频| 国产成人精品日本亚洲网址| 2022国产成人福利精品视频| 国产成人精品亚洲日本在线| 国产成人亚洲合集青青草原精品| 亚洲av永久无码精品三区在线4| 亚洲精品福利网站| 国产精品久久久久久| 九九精品免费视频| 日韩精品一线二线三线优势| 成人精品一区二区三区电影| 在线精品日韩一区二区三区| 国产精品亚洲一区二区三区久久| 国产99精品在线观看| 国产精品大白天新婚身材|