近日,由于谷歌內部機器人“誤操作”,一批描述谷歌如何對網頁排名的內部文檔在線泄露。由于這些文檔披露的搜索排名機制與谷歌公開發布的規則并不完全一致,一些知名SEO專家指責谷歌欺騙了整個行業多年。
同時,也有安全專家認為“真實版”谷歌搜索排名機制文檔的泄露對黑帽SEO來說也是一次不可多得的“盛宴”。
機密文檔被“開源”
泄露文檔描述了谷歌內容倉庫API的舊版本,披露了谷歌搜索內部運作的幕后(真實)細節。
據悉,這些材料于3月13日左右由谷歌自己的自動化工具無意中提交到一個可公開訪問的谷歌GitHub存儲庫(鏈接在文末)。該自動化工具在提交時附上了Apache2.0開源許可證,這是谷歌公共文檔的標準做法。5月7日的一次后續提交試圖撤回這一泄露。
這些文檔被搜索引擎優化(SEO)公司EA Digital Eagle的首席執行官Erfan Azimi發現,并于上周日由其他SEO從業者——SparkToro的首席執行官Rand Fishkin和iPullRank的首席執行官Michael King披露。
從技術上講,由于谷歌是在Apache2.0許可下發布的文檔,這意味著任何偶然發現這些文檔的人都獲得了“永久、全球、非獨占、免費、免版稅、不可撤銷的版權許可”,因此這些文檔現在可以在線免費獲取(鏈接在文末)。
泄露文檔樣本
欺騙SEO行業多年
這些泄露文檔不包含代碼,主要描述了如何使用谷歌內容倉庫API(GoogleApi.ContentWarehouse,可能僅供內部使用);泄露的文檔包括大量對內部系統和項目的引用。雖然谷歌云API中有一個同名的公共API,但GitHub上泄露的內容顯然超出了這個范圍。
這些文件揭示了谷歌在網頁相關性排名中優先考慮的因素(與公開規則有出入),這也是SEO行業和網站運營者們長期關注的問題。
這批超過2500頁的文檔詳細描述了與API相關的14000多個屬性,但由于這些屬性是否被使用,以及是否重要的信息很少。因此,很難辨別谷歌在其搜索結果排名算法中給這些屬性分配的權重。
但上述SEO專家認為,泄露文檔包含了大量頗具價值的細節,因為它們與谷歌多年來的公開聲明并不完全一致,甚至是矛盾的。
“這些細節與谷歌多年來的公開聲明相矛盾,例如谷歌一再公開(撒謊)否認使用以點擊為中心的用戶信號,否認在排名中單獨考慮子域名,否認對新網站進行沙盒處理,否認收集或考慮域名年齡等?!盨parkToro的Fishkin在一份報告中解釋道。
iPullRank首席執行官King在文章中提到了谷歌搜索顧問John Mueller的一段視頻聲明,后者稱“谷歌沒有類似網站權威評分的東西”——即否認谷歌會評級網站的權威性,并在搜索結果中給與更高排名。
但King指出,泄露文檔包含“siteAuthority”站點權威評分。
一個關鍵的關注點是點擊的重要性——不同類型的點擊(好點擊、壞點擊、長時間點擊等)在確定網頁排名中的作用。在美國政府對谷歌的反壟斷審判中,谷歌承認點擊指標是網頁搜索排名的一個因素。
另一個發現是谷歌使用Chrome瀏覽器中瀏覽的網站作為質量信號,在API中顯示為參數ChromeInTotal。“與頁面質量評分相關的一個模塊包含來自Chrome瀏覽器的站點級視圖衡量標準,”King解釋道。
此外,文件還顯示谷歌考慮了其他因素,如內容新鮮度、作者身份、頁面是否與網站的核心內容相關、頁面標題與內容的一致性以及文檔正文中術語的平均加權字體大小。
這些泄露的文檔不僅揭示了谷歌搜索排名的復雜機制,還暴露了谷歌內部機制與公開聲明的表里不一。這些信息對SEO行業和網站運營者來說無疑是寶貴的洞見,當然,對于黑帽SEO來說更是如此。
參考鏈接:
來源:GoUpSec