SEO每天一貼 http://www.nkjmnnn.com Zac的SEO博客,堅持13年,優化成為生活。唯一排名始終堅挺在百度、谷歌首頁的網站。需要SEO服務、顧問和培訓的公司歡迎找我。 Fri, 13 Sep 2019 11:51:13 +0000 en-US hourly 1 https://wordpress.org/?v=5.4 nofollow標簽的作用有重大變化 http://www.nkjmnnn.com/seo-tips/nofollow-as-hint/ http://www.nkjmnnn.com/seo-tips/nofollow-as-hint/#comments Tue, 10 Sep 2019 19:08:01 +0000 http://www.nkjmnnn.com/?p=5714 幾個小時前,Google官方博客發了個帖子:Evolving “nofollow” – new ways to identify the nature of links (演變中的nofollow – 判斷鏈接性質的新方法),公布從今天開始,nofollow標簽的作用和Google處理nofollow的方法有了重大變化。

nofollow標簽的歷史

經典的nofollow標簽作用和使用方法以前的帖子寫過,詳情讀者可以參考以前帖子。

nofollow標簽(準確說是屬性,不過約定俗成,還是叫標簽吧)是Google和Yahoo等搜索引擎2005年推出的,目的是告訴搜索引擎不要跟蹤加了nofollow的鏈接,不要傳遞鏈接權重,不要在搜索算法中計算這個鏈接。百度也支持nofollow標簽。

nofollow最初的目的是加在論壇、博客留言之類的地方,因為這些地方的鏈接是別的用戶加的,并不是站長對其它網站的一個投票。很快nofollow也被廣泛使用在廣告、贊助鏈接上,因為這種鏈接也不應該被視為一個投票。

既然搜索引擎基本上忽略nofollow鏈接,nofollow鏈接指向的頁面不會獲得權重,SEO們又開始用nofollow控制內部鏈接權重的流動。不過Google不建議這種用法,并明確告訴SEO們,nofollow標簽是會浪費權重的。用nofollow控制內部鏈接權重流動曾經很流行,但現在大部分英文網站不再這么做了。

目前百度對nofollow標簽的處理方法是否和Google一樣,并不確定。以前百度工程師表示過,nofollow標簽不會浪費權重,所以中文網站用nofollow控制內部權重更為有效。目前是否依然成立?有機會我找百度的朋友確認一下。

這次nofollow標簽有什么重大變化?

Google的帖子主要公布了兩個處理nofollow的重大變化:

一是增加了兩個新的屬性:

rel=”sponsored”: 這個新屬性/標簽用于標注廣告、贊助商或其它因利益而存在的鏈接。

rel=”ugc”: 這個新屬性/標簽用于UGC(用戶產生內容),如論壇帖子、博客評論之類的。

rel=”nofollow”: 這個老的屬性/標簽依然用于沒有任何投票、背書意味的鏈接,也不傳遞排名權重。

換句話說,新公布的兩個標簽是為廣告和UGC各新創了一個專用標簽。

第二個重大變化是,也是意義更重大的:這三個標簽將被Google搜索算法在決定鏈接是否應該被考慮時視為一個暗示(Google用的詞是hint),更容易理解點的詞是一個建議,而不是指令。

以前的nofollow基本上是一個指令,Google會忽略加了nofollow的鏈接,在計算權重流動時根本不考慮這個鏈接。以后,Google只把這三個標簽當作建議,算法是否考慮這個鏈接,由Google自行綜合其它因素來做決定。

為什么要做這個變化?

用的好好的,為什么突然會有這么個變化?Google的說法是為了更好地分析、使用鏈接信號。鏈接中包含了很多可以提高搜索質量的信號,如錨文字。Google現在覺得考慮所有鏈接有利于Google更好理解不自然的鏈接模式。

把nofollow家族三個標簽當作建議,既能使Google不失去寶貴信息,又保留了站長表明鏈接不是投票的機制。

從今天開始,Google在搜索排名算法中立即把nofollow三標簽當作建議。Google的爬行、索引算法則從2020年3月2號開始把nofollow三標簽當作建議。看來nofollow標簽本來對Google排名就沒什么影響,未來幾天做英文SEO的站長可以關注一下排名是否有明顯變化。而nofollow對爬行、抓取、索引應該有更明顯影響,畢竟會使鏈接權重流動產生變化。

在大部分情況下,即使Google處理方式改為建議,也不會改變鏈接的性質和作用,因為通常還是不會在算法中考慮這個鏈接,和以前一樣。Google應該會仔細評估怎樣使用新的鏈接數據。

目前,我覺得SEO們不必做任何改動,先觀察情況,很可能就沒什么影響。對抓取、索引有潛在影響,但Google也挺謹慎,2020年3月前這幾個月肯定會收集更多數據,評估影響,不會讓搜索結果有大幅波動。

幾個問題

Google帖子特意解答了幾個站長可能會問的問題,這里簡單介紹幾句。不是翻譯,只是挑幾個我覺得有意思的點,想看完整全文的請看Google的帖子。

需要修改現有的nofollow標簽嗎?

不用。無論是用于廣告還是帖子、留言,現有的nofollow標簽繼續有效,不用改。

不過,如果現有nofollow標簽是用于廣告鏈接的,Google還是說不用改,但建議有功夫的時候可以改為rel=”sponsored”。看來Google對有利益交換的鏈接是很敏感的,也想挖到更多數據,部分鏈接改為rel=”sponsored”能使Google大規模判斷廣告鏈接時更準確。

一個鏈接可以用多個屬性值嗎?

可以。比如rel=”ugc sponsored”可以表示鏈接是廣告也是用戶產生的內容,rel=”nofollow ugc”表示用戶產生內容,鏈接不要跟蹤。(注意,這都只有建議作用了)

屬性用錯了怎么辦?

除了廣告,屬性用錯了不是什么大事。比如把UGC或非廣告鏈接寫為rel=”sponsored”沒什么大關系,最多也就是不計算這個鏈接,和現在的nofollow效果是一樣的。

但如果是廣告鏈接的話,還是需要用rel=”sponsored”(如前所述,最好用這個),或者rel=”nofollow”(也可以)。廣告鏈接如果標為ugc會怎樣呢?Google沒說,但顯然不建議。所以,現有的rel=”nofollow”可以不改,但不要把廣告性質的鏈接改錯為rel=”ugc”。

對外部鏈接建設的影響

如前所說,自己網站上的鏈接并沒有必要去修改。但至少對英文網站來說,這次nofollow作用的改變可能會對外部鏈接建設的方式產生比較大影響。

一直以來,SEO們建設外鏈時對nofollow鏈接的熱情是遠遠小于dofollow鏈接的。但未來即使加了nofollow的鏈接也可能會被Google當作一個正常、傳遞權重的鏈接了,對部分人來說,這可能是個大好事。

比如在各個社交媒體網站傳播度高的網站,在wiki、百科、問答網站被推薦比較多的網站,在論壇參與時間長、留有很多簽名的網站,很多以前作用不大的nofollow鏈接可能一夜之間變得更有效。

當然,到底哪些nofollow鏈接被當作普通鏈接,我們將無法知道,那些把自己鏈接都加了nofollow的社交媒體網站、新聞網站自己也不會知道。做外鏈建設時,可以不用再考慮是否有nofollow,只考慮是否有利于吸引用戶了。

百度、必應是否會跟進?我們拭目以待吧。

13 Sep更新:正在日本開會的Google員工Gary Illyes回答問題時說,Google這次把nofollow改為一種建議,主要因為由于nofollow的使用,Google失去了很多有用的鏈接信號。絕大部分社交媒體網站、新聞網站,現在所有指向外部的鏈接都一律加nofollow了,如果忽略所有這些鏈接,那就沒多少高質量鏈接可以參考了。所以現在Google會重新考慮這些NF鏈接的作用,鏈接信號和鏈接關系網絡勢必起不小變化,可能導致排名也會起很大變化。接下來SEO行業肯定會仔細觀察。

另外,頁面meta標簽的nofollow也是被當作建議。沒有ugc或sponsored的meta標簽。

]]>
http://www.nkjmnnn.com/seo-tips/nofollow-as-hint/feed/ 77
移動端網站SEO優化該怎樣做? http://www.nkjmnnn.com/mobile-seo/mobile-seo-3-ways/ http://www.nkjmnnn.com/mobile-seo/mobile-seo-3-ways/#comments Sat, 27 Jul 2019 18:24:32 +0000 http://www.nkjmnnn.com/?p=5523 過去幾個月在問答社區回答了一些關于移動端網站優化問題,發現很多移動SEO的問題涉及到用哪種架構做移動站。不少SEO貌似對獨立移動站,也就是單獨的m.domain站有不小的執念,認為獨立移動站才是效果最好的。

問答后臺看到另一位讀者“一條愛做夢的咸魚”,也是問“新網站做移動SEO,使用m站還是響應式?”:

您好,我在某個回答中看到了你的回答,有一些疑惑,您建議:“新網站,或者剛剛要做移動SEO的,最好就直接采取響應式了。”,為什么直接采取響應式呢,我自己的感覺是目前移動搜索排靠前的都是m站較多

翻看了一下以前寫的關于移動SEO的帖子,才發現移動端SEO到底應該選哪種方式優化還沒有仔細寫過。今天的帖子就深入探討一下怎樣選擇移動優化的三種方式。

移動優化的三種方式

移動網站大體上有三種方式可以選擇:

響應式設計(responsive design):

PC站和移動站的URL是完全一樣的(不管用什么設備訪問都一樣),返回給瀏覽器的HTML代碼也是一樣的,不同寬度的屏幕排版不同是通過CSS控制的。以前也經常稱為自適應設計,就是因為排版是根據屏幕寬度自動適應的。

動態服務(dynamic serving):

PC站和移動站的URL是完全一樣的,這點和響應式設計相同,但動態服務方式返回給瀏覽器的HTML代碼(以及CSS)是不一樣的,PC設備得到的HTML代碼是PC版,移動設備得到的HTML代碼是專門做了移動優化的移動版本。

獨立移動站(separate m. site) :

移動站的URL和PC站是不一樣的,通常用單獨的子域名,比如PC站是www.nkjmnnn.com,移動站是m.seozac.com,當然移動站的HTML代碼(以及CSS)與PC站也是不一樣的,是專門做了移動優化的。換句話說,這種方式下,移動站就是個獨立的網站。

這三種方式各有各的特點。

響應式設計

既然URL一樣,所有設備得到的 HTML代碼也一樣,好處顯而易見:簡單明了,搜索引擎不會被弄糊涂。搜索引擎抓取、索引一套頁面就行了,提高索引效率,尤其對大網站,抓取份額浪費在多個URL上,就意味著降低深層頁面被抓取的機會。自適應設計只有一個URL,鏈接、權重計算都集中在一個URL上,不會出問題。

用戶也不會被弄糊涂,收藏書簽、分享頁面也不會因為URL的不同而出問題。

站長方面開發維護一套代碼就可以了,后端開發成本相對低一些。建設的外鏈也集中在一個URL上。不需要判斷設備、瀏覽器類型,也不需要轉向,也就不會出錯。

當然也有壞處。比如,移動設備由于屏幕大小的關系,經常要隱藏一些內容和功能,但還是需要下載完整的HTML代碼,經常還包括圖片,所以會浪費帶寬。手機網速慢的話,多下載文件就意味著速度變慢。而且,同一套代碼要在所有設備顯示正常,還要盡快開始渲染,前端設計需要比較高的水平。

響應式設計的頁面必須設置viewport,告訴瀏覽器按照屏幕寬度自動調整頁面排版:

<meta name=”viewport” content=”width=device-width, initial-scale=1.0″>

雖然有缺點,但隨著移動網速、手機性能的提高,響應式的缺點逐漸顯得沒那么致命,而它的簡捷性就更顯優勢了。所以,響應式設計是今后的方向,是大勢所趨。這也就是為什么我建議新網站,或者剛剛要做移動SEO的網站,肯定直接就做響應式了,不用考慮其它選項。(除非貴公司不差錢,可以考慮動態服務。)

獨立移動站

和響應式設計相比,獨立移動站顯然開發成本要提高,要開發維護兩套代碼。隨著國內人力成本提高,需要重復做的事情會越來越不劃算。

獨立移動站的更大潛在麻煩是URL的不同可能造成混亂和各種出錯。比如,既然移動和PC版本URL不同,搜索引擎就需要建立對應關系,必須判斷PC頁面對應的移動版本URL是什么,移動頁面對應的PC版本URL是什么。網站需要在頁面添加代碼幫助搜索引擎判斷:

PC頁面需要加下面代碼指明移動版本位置:

<link rel=”alternate” media=”only screen and (max-width: 640px)”?href=”https://m.seozac.com/”>

對應的移動頁面需要加下面代碼指明PC版本位置:

<link rel=”canonical” href=”http://www.nkjmnnn.com/”>

在搜索引擎兩個版本都抓取了、并且正確判斷的情況下,PC和移動版本就建立了一一對應關系。但是,如果站長把標簽加錯了怎么辦?搜索引擎只抓取了一個版本怎么辦?搜索引擎沒有準確解析<link ref>標簽怎么辦?

而且,要建立一一對應關系,需要PC版本和移動版本主體內容是一樣的。很多時候m.移動版本頁面內容精減或修改過多,搜索引擎認為內容不相符怎么辦?甚至有的時候獨立移動站只建了部分頁面,很多PC頁面沒有對應移動頁面又怎么辦?

網站有兩個版本,用戶在添加書簽、分享鏈接時,不可避免地會有一部分指向PC頁面URL,一部分指向移動URL,鏈接權重將分散。

通常,為了用戶體驗和幫助搜索引擎判斷對應關系,網站需要做符合規則的轉向:

  • PC用戶由于某種原因訪問了移動URL的話,需要被自動301轉向到PC版本URL
  • 移動用戶由于某種原因訪問了PC頁面URL的話,需要被自動301轉向到移動URL

301轉向一般是服務器端做的,首先就需要根據瀏覽器用戶代理匹配特征字符串判斷用戶設備和瀏覽器類型,上網設備和瀏覽器五花八門,程序100%檢測正確不是件容易的事。判斷出錯,用戶可能就只能看到一個排版錯誤的頁面,甚至某些功能都無法使用。搜索引擎蜘蛛也可能被判斷錯,導致不能建立兩個版本的對應關系。

大公司需要用子域名做多語言網站SEO的話,加上m.獨立移動站,就會使管理子域名更加復雜,因為網站又要增加:

  • sg.seozac.com
  • m.sg.seozac.com
  • cn.seozac.com
  • m.cn.seozac.com

等等。多語言hreflang標簽和獨立移動站的<link ref>標簽排列組合起來,哪個對應哪個不能弄錯了。如果再加上Google AMP百度MIP頁面版本,所有版本之間的對應關系和標簽寫法,可能會把人繞暈倒。

動態服務

動態服務和獨立移動站一樣,首先在服務器端判斷設備和瀏覽器類型,然后在同樣的URL上、根據瀏覽器屏幕寬度返回不同的HTML和CSS代碼。

所以動態服務方法相當于把響應式設計和獨立移動站的優點結合起來了,即有URL統一的簡潔明了,又有獨立移動站的代碼優化,SEO效果是最好的。當然,代價是前后端成本都要提高。

對不差錢的公司來說,動態內容是最佳選擇,比如amazon現在就是用動態服務做移動優化的,URL統一簡單,不會出錯,兩個版本的代碼還可以分別優化,據說,亞馬遜移動版本節省了40%的文件下載量,對手機用戶來說,頁面打開速度的提升是至關重要的 。

是否使用動態服務要看公司情況。對大部分網站來說,頁面內容、排版、功能沒那么復雜,響應式設計已經滿足需要,用高成本實現動態服務,節省的下載量沒那么明顯,比如SEO每天一貼這種博客,還有大量內容型網站,頁面連個圖片都沒有,除了留言也沒有別的交互,那是一點下載都節省不了,動態服務就沒意義了。

搜索引擎蜘蛛訪問動態服務的頁面時,從HTML代碼是無法自動知道不同瀏覽器得到的代碼將會是不同的。比如PC蜘蛛訪問時,得到的是PC版代碼,但蜘蛛并不必然知道移動蜘蛛來訪問的話會得到不同的代碼,所以服務器端需要通過Vary HTTP頭信息告訴搜索引擎蜘蛛,PC蜘蛛和移動蜘蛛得到的代碼是不一樣的,兩個蜘蛛都要來訪問一下。比如amazon.com頁面的服務器頭信息:

< Content-Type: text/html

< Content-Length: 6400

< Connection: keep-alive

< Server: Server

< Date: Sat, 27 Jul 2019 16:42:45 GMT

< Vary: Content-Type,Host,Cookie,Accept-Encoding,X-Amzn-CDN-Cache,X-Amzn-AX-Treatment,User-Agent

< Edge-Control: no-store

< x-amz-rid: KH589YRZC8QEW3QEWGKD

< X-Cache: Error from cloudfront

< Via: 1.1 1b52a5dd431f9e3c81753e61dfdf467a.cloudfront.net (CloudFront)

< X-Amz-Cf-Pop: SFO9

< X-Amz-Cf-Id: 0qtVw99a2_AustEZ-dxC_cs9hfVzyll-DmHnmWFDtBSWKtinpxhB2Q==

其中Vary那行就是通知瀏覽器/蜘蛛,根據后面列的情況不同,HTML代碼是不同的,Vary: User-Agent指的就是根據瀏覽器用戶代理的不同,HTML代碼是不同的。

對獨立移動站的執念來自何處

很多公司和站長對獨立移動站情有獨鐘,認為m.移動站SEO效果是最好的,做新網站還要做獨立m.站。這個執念可能來自兩方面。

一是以前百度更建議獨立移動站,我在2015年廈門百度之夜的帖子中說明過這一點。但現在4年過去了,百度現在的正式官方態度我沒有看到,但兩年前百度搜索主任架構師譚待明確跟我說過,百度也認為響應式設計是未來趨勢,百度也推薦轉向響應式設計。我的觀察是,百度現在對響應式設計的支持沒有問題。

Google一直以來就是推薦響應式設計的。

當然,這里說的推薦,并不是說響應式比獨立移動站的SEO效果更好,而只是表明,百度和Google對三種方法是一視同仁的,排名上并不偏向哪一個,SEO效果是一樣的。既然效果一樣,當然推薦那個簡單便宜的了。

第二個原因,就如開頭讀者說的,目前在百度移動搜索排名靠前的m站較多。這是個準確的觀察,確實百度移動搜索結果中排名好的m站很多,在不少行業,m.站排在前面的占大部分。不過,這并不必然說明m.獨立移動站有SEO優勢,我覺得這更多是采樣偏差造成的。

舉個例子,數據表明,車禍發生大部分是男性司機造成的,不過這是否說明男司機開車有劣勢呢?恐怕不能這么認為,因為必須考慮路上司機的男女比例,很可能開車的80%是男的,造成了70%的車禍,所以70%車禍是男司機造成,不能說明男司機開車水平比女司機差。

移動搜索排名也是同樣道理。現在排名靠前的m.站居多,很可能這些站絕大部分是老站(所以才排名能力高嘛),而幾乎所有老站當初開始做移動SEO時都是從m站入手的,不到萬不得已,這些使用m站的老站不會去改為響應式設計,因為改動太大了,冒險,又沒有明顯好處(如前所說,三種方式SEO效果一樣的),沒有動力改。

所以,老站、大站排名好,而老站、大站又以m站為主,所以我們就看見m站排名好了。但這不說明一個新站就要學著做m站啊。

]]>
http://www.nkjmnnn.com/mobile-seo/mobile-seo-3-ways/feed/ 78
Google新PR:以鏈接距離為基礎的頁面級別 http://www.nkjmnnn.com/google/google-new-pr/ http://www.nkjmnnn.com/google/google-new-pr/#comments Thu, 18 Jul 2019 17:07:51 +0000 http://www.nkjmnnn.com/?p=5599 Google PR是Google誕生以來最具知名度的概念,以至于很多人認為Google PR的意義更多在于公關炒作,而不是排名算法。2016年4月,Google取消了工具條輸出PR值的顯示,站長們再也看不到最新的PR值了,也有很多SEO認為Google完全取消了PageRank算法。現在的Google排名算法中還有PageRank嗎?眾說紛紜。

Google從2006年就不再使用PageRank了

前天,一位自稱的前 Google軟件工程師在Hacker News的一個討論Google替代品的帖子中透露,Google早在2006年就不再使用Google PR了:

The comments here that PageRank is Google’s secret sauce also aren’t really true – Google hasn’t used PageRank since 2006. The ones about the search & clickthrough data being important are closer…

翻譯過來的意思是:

評論里說PageRank是Google秘方的說法并不正確 — 從2006年Google就不再用 PageRank了。關于搜索和點擊率數據很重要的說法還比較靠譜……

說得很明確,Google算法早就不再使用PageRank了。

另外,點擊率也是Google算法重要排名因素之一,但到目前為止,真實有效的Google點擊器或Google快排這種東西還沒有誕生,而百度對百度快排貌似已經放棄治療了…這個是另一個話題,暫且不提。

這是真的嗎?

為了驗證這位前Google員工身份,SEO們已經做了人肉分析,結論是大概率是真的。這位員工名字是Jonathan Tang,Twitter賬號在此,2009年至2014年在Google工作,他的Hacker News賬號是2007年注冊的,不大可能用這么老的賬號來胡扯或造謠。

而且,這些年Google與SEO行業的官方溝通人JohnMu在Twitter上評論此事時并沒有否認,只是說:

SEO們應該知道,20年來Google工程師不可能沒有對搜索做出修改。

所以,雖然沒有官方認證,但應該是真的。其實,Matt Cutts等人很早以前也表示過,Google算法肯定還是考慮鏈接的,而且鏈接依然是最重要的排名因素,PageRank以及Google排名的基本原理沒有變化,但不可能這么多年原樣不動地用PageRank的原始版本,肯定是修改過的了。

JohnMu去年也直接評論過PageRank的使用情況,表示現在的Google算法不可能還是一比一地原樣用PageRank的最初公式。

那么2006年以后工具條顯示的PR是什么鬼?

前面提到,Google是從2016年取消工具條顯示PR的,如果2006年就不再用PR了,那么2006年到2016年工具條上顯示的PageRank是什么東西?

而且Google的另一位發言人Gary Illyes在2017年還發推明確說:“你們不知道嗎,Google在18年后依然在排名算法中使用PageRank(還有幾百個其它信號)。”

所以到底是在用還是不用了?

Jonathan Tang后續又解釋了一下:

他們2006年用另一個算法取代了PR,那個算法給出的結果大致和PR相似,但計算速度快得多。工具條顯示的宣稱是PR的數值就是這個替代算法的結果。這個替代算法的名字都和PageRank相似,所以Google這么宣稱,在技術上也不能說是錯的。

所以,從2006年開始,Google算法中使用的、工具條所顯示的,都不是原始PageRank計算公式的結果,而是一個結果類似、名稱類似、計算速度快得多的算法。

我們姑且稱之為Google新PageRank吧。

那么這個Google新PR的計算原理是什么?Jonathan Tang沒說,連真實名稱也沒說,大家只能猜測了。

疑似Google新PageRank專利

Jonathan Tang的帖子后面,專門研究Google專利的大神Bill Slawski發了個回復:

Google的新版本PageRank專利2006年通過。巧合?

Bill Slawski去年發帖詳細介紹過這個新版本PageRank專利,這兩天又仔細讀了一下專利原文Bill Slawski的帖子,這里介紹一下大意。

專利名稱是Producing a ranking for pages using distances in a web-link graph – 基于鏈接距離的頁面級別計算。

簡單說,新PageRank不再計算導入鏈接的總數,而是計算這個頁面與種子頁面之間的距離,距離越近,頁面質量越高,頁面級別、新PageRank越高。這個思路和Yahoo!的TrustRank是極為相近的,基本假設都是:好網站不會鏈接向壞網站,但會鏈接向其它好網站。

種子頁面、鏈接長度、鏈接距離

這個專利涉及幾個概念。種子頁面(Seed Pages)、鏈接長度(Link Length)、鏈接距離(Link Distance)。

種子頁面(Seed Pages)

如上面的簡單網絡鏈接圖所示,Google選出一部分頁面作為種子頁面,如圖中上半部分的頁面106、108、110,下半部分的都是種子頁面集之外的、需要計算新PR值的。

關于種子頁面的幾個要點:

  • 種子頁面顯然是高質量的頁面,專利里舉的例子是Google目錄(其實就是已經死了的開放目錄)和紐約時報。
  • 種子頁面需要與其它非種子頁面有很好的連通性,有比較多的導出鏈接指向其它高質量頁面。
  • 種子頁面需要穩定可靠,有多樣性,大范圍覆蓋各類主題。

鏈接長度(Link Length)

種子和非種子之間有的離得近,有的離得遠。如種子頁面106通過鏈接132直接連向非種子頁面112,非種子頁面118則沒有種子頁面直接連向它,要通過兩層鏈接。

鏈接距離并不是簡單地數鏈接層數。每個鏈接Google會計算一個鏈接長度,鏈接長度取決于鏈接本身的特征和鏈接所在頁面的特征,比如頁面上有多少鏈接,鏈接的位置,鏈接文字所用字體等等。

所以,同樣是一個鏈接,鏈接長度是不一樣的:

  • 頁面導出鏈接越多,鏈接長度越長。這和原始PageRank思路是一樣的,導出鏈接越多,每個鏈接分到的權重越少。
  • 鏈接所在位置越重要,比如正文中,正文靠前部分,鏈接長度越短。
  • 鏈接錨文字字號越大,或者在H1中,可能鏈接長度越短。

我記得Matt Cutts很久以前在談到PageRank可能的修正時提到過,正文中的鏈接和頁腳的鏈接被用戶點擊到的概率顯然差距很大,所以不同位置的鏈接獲得的PR和權重應該是不一樣的。這種說法很符合這個專利的意思。

鏈接距離(Link Distance)

鏈接距離就是頁面與種子頁面集合之間的最短鏈接長度之和。種子頁面和非種子頁面之間通常不止一條鏈接通路,如示意圖中,頁面118可以通過鏈接132、136從種子頁面106到達,也可以通過鏈接134、142、140到達,還可以通過鏈接134、140到達,還可以通過其它鏈接從其它種子頁面到達,所有這些從種子集到頁面的鏈接通路中,鏈接長度之和最短的那個被定義為鏈接距離。

如果一個頁面無法從任何種子頁面出發訪問到,也就是種子頁面集合到這個頁面完全沒有鏈接通路,那么鏈接距離是無限大。

然后Google算法根據鏈接距離計算出一個頁面的排名能力分數,也就是新PR值,最后的排名算法中,這個新PR值作為排名因素之一。也就是說,鏈接距離越短,離種子越近,Google認為頁面越重要,排名能力越高。

鏈接距離的計算不需要迭代,所以比原版PageRank的計算要快得多,而在代表頁面重要性上,我相信Google做過對比,準確性差不多,所以就用來代替原來的PR了。

簡化鏈接網絡圖(Reduced Link-Graph)

專利最后面提到了另一個概念:簡化鏈接網絡圖(Reduced Link-Graph),不過沒有再說明這個概念有什么用,用一個段落說了簡化鏈接網絡圖這個概念后專利就結束了。不過簡化鏈接網絡圖有可能和鏈接質量判斷、Penguin算法更新等相關。

在前面示意圖中,所有頁面之間的所有鏈接組成一個完整的鏈接網絡圖,其中只由最短鏈接距離通路組成的鏈接被稱為簡化鏈接網絡圖,也就是用來計算新PR值的那些鏈接。顯然,簡化鏈接網絡圖是完整鏈接網絡的一個子集,不過每個頁面的鏈接距離都已經保留在簡化鏈接網絡圖中了,去掉的那些鏈接對頁面鏈接距離和新PR值沒有影響。在簡化鏈接網絡圖中,每個頁面獲得的鏈接權重來源都是可以回溯到最近的種子頁面的。

如果一個頁面從種子集合完全沒有鏈接通路可以到達,也就是前面說的鏈接距離為無限大,這個頁面將被排除在簡化鏈接網絡圖之外。如果一個頁面得到的鏈接都來自簡化鏈接網絡之外,雖然鏈接總數可能很大,但其鏈接距離依然是無限大。

換句話說,在簡化鏈接網絡之外的鏈接是被忽略掉的,無論有多少鏈接。聯想到Penguin 4.0算法更新,其中一個特征就是,垃圾鏈接是被忽略掉的,不被計入鏈接的流動中,這和基于鏈接距離的頁面級別非常相似。

]]>
http://www.nkjmnnn.com/google/google-new-pr/feed/ 34
外貿SEO應該怎樣做?(策略篇) http://www.nkjmnnn.com/en-seo/seo-for-international-trading/ http://www.nkjmnnn.com/en-seo/seo-for-international-trading/#comments Wed, 22 May 2019 11:57:41 +0000 http://www.nkjmnnn.com/?p=5408 這幾年做外貿SEO的越來越多,背后原因很復雜,不去探討了。今天就自己SEO服務客戶情況所見,聊一點外貿網站SEO該怎么做的感想。

我所遇到的英文外貿網站,大部分是賣產品的,產品各種各樣,從單一軟件或產品小網站,到規模不等的2B企業,到巨型2C電商平臺。賣服務的不多,當然也有,甚至有非常有創意、有價值的服務,不過總體上來說還是占很少數。中國是制造大國,論產品能力,在世界上少有對手。但服務類,需要的是另一種技能,國內企業走向世界可能還需要一段時間。所以,這里說的外貿SEO以賣產品的網站為主。

外貿SEO的策略考慮

今天先說策略方面的考慮,以后有機會再聊技術方面的細節。

對英文產品類、交易型搜索結果頁面真正關注的SEO應該都會看到一個明顯規律,排名在前面的頁面絕大部分是兩類:

  • 垂直領域專業購物網站。比如,買假發大概率會看到wigs.com頁面,買婚禮裝的大概率會看到davidsbridal.com、herworld.com之類的,買女童裙的大概率會看到next、zara等網站。
  • 電商巨頭網站。包括Amazon、ebay、阿里,也包括傳統線下巨頭如macys、walmart、bestbuy、target等等。

其中,有些行業的垂直領域專業網站競爭者比較多,比如服裝行業。

一般來說,大部分產品搜索,垂直專業網站排名又比電商巨頭要好。總體搜索流量,那肯定是亞馬遜最高,但那更多是因為亞馬遜品類齊全、規模巨大,總體排名都不錯。具體到某一個行業的產品,大部分情況下排名在前面的會是垂直專業網站,然后才是亞馬遜等綜合電商跟在后面。

所以,要想在外貿領域獲得SEO流量,要么做成專業垂直網站,要么在電商巨頭沒有完全覆蓋到的查詢詞縫隙中獲得排名。

SEO技術上的問題可以后面再考慮,首先要思考的是策略問題,要做成這兩類網站,那么網站應該是什么樣的?或者要解決的最大問題是什么?

排名好的垂直專業網站是什么樣的?

一張圖片勝過千言萬語,看一下優秀的垂直領域專業網站產品分類頁面是什么樣的:

垂直專業網站的SEO

尤其是注意看第一屏的樣子:

垂直專業網站第一屏

而國內網站風格是有很顯著中國特色的,國內外貿公司做出的外貿網站也大部分沿襲了這一風格:

看著眼熟吧?倒不必糾結這是哪個網站,因為大部分國內做的外貿電商網站分類頁面都是這個樣子的:

  • 左側給出進一步過濾的導航,通常下面還有熱銷產品
  • 產品列表最上面是一堆品牌、價格、排序、顯示方式等的選擇
  • 除了產品名稱,產品列表本身盡量列出可能吸引用戶的賣點:現價、原價、免運費、rating等
  • 姑且不論產品圖片的質量

上圖已經算簡潔的了,有時候列表上方的選擇可能更多:

國內電商網站分類頁面

產品列表本身包含的信息也經常更多:

國內電商網站產品列表

然后再回頭看一遍國外垂直專業網站的產品列表頁面:

垂直專業網站第一屏

感受到差別了嗎?簡單說,優化得當的分類頁面不是按照產品列表頁面來做的,是按照著陸頁面的要求做的,看著就像雜志的一頁,簡潔、美觀、重點突出:

  • 大幅高質量題圖,或視頻
  • 字體、顏色都經過設計的tagline
  • 產品分類說明,注意不是放在頁面最下面,是在最上面
  • 有限的排序選擇
  • 簡潔的產品列表,除了圖片,很多網站只列出產品名稱和價格,連評星都沒有

結論,產品不多的網站,要做成垂直專業網站,首先不是考慮SEO細節,而是想想網站該長成什么樣子。

綜合電商又該首先解決什么問題?

前面提到過的,除了做成垂直專業網站,另一條出路是在綜合電商巨頭沒覆蓋到的縫隙中生存。

說是縫隙,貌似很狹窄,其實也沒那么難。雖然Amazon、ebay體量那么大,什么產品都有,再加上阿里系和walmart等的競爭,但依然存在很多查詢詞,新站是有機會在這些巨頭中搶下個排名的。原因還是那個長尾理論,而且在互聯網世界,長尾真的是太長了,用戶會搜索的詞五花八門,總有一些查詢詞是巨頭網站占不完前兩頁的,Google只好暫時拿一些質量不怎么樣的頁面湊數,這就是機會,而且這個數量并不小。

這種情況下要解決的主要問題是什么?是你得有足夠的產品頁面被收錄。長尾詞的查詢量經常小到沒辦法做關鍵詞研究,所以幾乎無法預計哪些產品能鉆出巨頭網站的縫隙,那就要靠有足夠的量,再加上一點運氣,總有一定百分比的頁面或獲得排名。

那么除了公司真的有這么多產品,SEO方面要解決的就是收錄:

  • 要有精心設計的導航結構、內部鏈接結構,使盡量多的產品頁面獲得抓取途徑和最基本的收錄權重
  • 在復雜的導航系統中,還要盡量減少分類、過濾條件頁面造成的復制內容
  • 產品描述內容質量怎么解決?靠供應商提供的產品說明?那網上恐怕是有很多同樣內容的頁面了。這時候,UGC、用戶評論、數據挖掘、高質量的信息聚合能力、甚至AI的使用,很可能會是核心競爭力了。
]]>
http://www.nkjmnnn.com/en-seo/seo-for-international-trading/feed/ 64
怎樣利用XSS漏洞在其它網站注入鏈接? http://www.nkjmnnn.com/blackhat/xss-attack-google/ http://www.nkjmnnn.com/blackhat/xss-attack-google/#comments Sun, 05 May 2019 12:19:35 +0000 http://www.nkjmnnn.com/?p=5322 前兩天英國的SEO老手Tom Anthony曝出一個 Google蜘蛛存在的漏洞,可能被黑帽SEO利用XSS漏洞在別人網站注入鏈接,而且這些鏈接確定會被Google蜘蛛抓取。這個漏洞如果被大規模利用,顯然是會影響權重流動和搜索排名的。

Tom去年11月就把這個漏洞匯報給Google了,不過到目前為止Google并沒有解決這個漏洞的意思,他們的說法是“Google的現有保護機制應該能預防這種濫用,不過相關團隊正在檢查驗證”。另外Google在回復Tom時提到了有些“內部溝通上的困難”,公司大了是不是都會有這種問題?

既然Google過了5個月都沒有采取措施,Tom決定把漏洞公布出來,站長們好檢查自己網站是否有XSS漏洞,提取采取預防措施,以防自己網站被注入鏈接。Google同意Tom公布相關信息,看來還是挺自信的。

什么是XSS攻擊

XSS攻擊是Cross Site Scripting的縮寫,跨站腳本攻擊的意思。按說Cross Site Scripting的縮寫應該是CSS,但就和頁面樣式表那個CSS重復了,所以跨站腳本攻擊這個改成了XSS。

XSS是一種代碼注入攻擊。大部分網站都會有某些功能腳本是可以任意修改URL的,比如搜索功能,UGC用戶貢獻內容網站的提交功能,用腳本實現的轉向等等。比如搜索概念,URL經常就是domain.com/search.php?keyword,或者domain.com/?s=keyword之類的(SEO每天一貼的搜索功能就是這個URL格式),其中的keyword是可以替換成任意字符的。

那么keyword部分被替換成腳本會發生什么?比如domain.com/?s=<script>alert(‘XSS’)</script>。有這種漏洞的網站就是在URL中注入惡意腳本時,沒有進行安全過濾,而瀏覽器也沒有分辨出是惡意腳本,所以執行了惡意腳本。

XSS可以被用來獲取用戶敏感信息,可以用來冒充用戶向網站發出請求等等,還可以執行腳本,在生成的HTML代碼中插入內容,這就是黑帽SEO可以利用來注入鏈接的漏洞。

怎樣利用XSS漏洞在別人網站注入鏈接

修改URL中的參數,替換為腳本,瀏覽器執行腳本,在HTML中插入內容,所以也可以插入鏈接。當然如果只是訪問用戶的瀏覽器上顯示鏈接,搜索引擎不抓取這個URL的話,黑帽SEO也就不感興趣了。問題就是 Google蜘蛛可以抓取被注入腳本的URL,也可以執行JS,所以也就可以看到被注入的鏈接。

防止XSS攻擊,一是服務器端的程序要做安全過濾,最基本的是HTML轉義,把<script>alert(‘XSS’)</script>當作被搜索的字符串,而不是要執行的腳本。二是瀏覽器端的XSS識別,現在的很多瀏覽器(如Chrome)看到URL中有可疑字符如script之類的,會直接拒絕打開頁面。

如果Google蜘蛛和Google自己的Chrome瀏覽器一樣能夠識別XSS攻擊,帶有注入腳本的URL根本不抓取,就沒有事情了。但根據Google官方文件說明,到目前為止,Google蜘蛛使用的是比較老的Chrome 41版本,而Chrome 41是沒有XSS識別功能的。所以,有XSS程序漏洞的網站,有可能被Google蜘蛛抓取到被注入鏈接的URL。

Tom做了實驗。某新銀行(Revolut)網站有XSS漏洞(天哪,銀行網站有XSS漏洞。不過現在已經補上了),Tom在Revolut域名上構造了個帶有注入腳本的URL,瀏覽器執行后會在頁面頂部放上個鏈接。Google蜘蛛會怎樣處理這種URL呢?Tom用Google的頁面移動友好性測試工具驗證了一下,因為這個工具會按照 Google蜘蛛的方式渲染頁面。結果是這樣:

XSS攻擊注入鏈接

顯然,Google能夠抓取URL,執行注入的腳本,生成的頁面頂部是有那個被注入的鏈接的。這可是來自銀行域名的一個外部鏈接。

為了進一步驗證,Tom把實驗URL提交給Google,結果說明,Google索引了這個URL,快照顯示,通過JS腳本注入的鏈接也正常出現在頁面上:

Google索引了被XSS注入的鏈接

Tom還發現,通過XSS注入,也可以添加、修改HTML中的標簽,比如canonical標簽,這個也是挺危險啊。不過這個和本帖XSS注入鏈接關系不大,就不細說了。

XSS攻擊注入的鏈接有效果嗎?

僅僅能索引不一定說明問題,如果如某些垃圾鏈接一樣被Google忽略,沒有鏈接的效果,那也不能利用來操控外部鏈接。為了驗證這種URL上的鏈接是否有鏈接效果,Tom進一步做了實驗。

Tom在Revolut域名的URL上注入一個鏈接,指向自己實驗網站上以前不存在、剛剛創建的一個頁面,提交Revolut的URL,沒多久,Google就抓取了Tom自己實驗網站上的新頁面,而且索引了這個頁面,出現在搜索結果中:

這說明,被注入的鏈接,至少是能起到吸引蜘蛛抓取的作用的。對權重流動和排名有沒有普通鏈接一樣的作用呢?Tom顧慮到可能會對正常搜索結果的影響而沒有進一步試驗了。

這里不得不說,國外很多SEO是很有情懷的。我在想,如果是國內SEO們發現這個等級的漏洞,會報告給搜索引擎補上漏洞嗎?大概會把這個漏洞為己所用,運用到死吧。

對搜索結果的潛在影響有多大?

如果這種方式注入的鏈接有正常鏈接的效果,對權重、排名有效,那么只要被黑帽SEO使用,對操控權重、排名顯然有很大幫助,對搜索結果有多大潛在影響呢?

https://www.openbugbounty.org/ 網站上列出了12萬5千多有XSS漏洞的網站,其中包括260個.gov政府網站,971個.edu域名網站,包括了前500個鏈接最多網站中的195個,想象一下潛在的影響會有多大。

當然,Google很自信,他們的防御機制應該可以鑒別出這種黑帽方法,我猜想Google內部調查說明,這種方法到目前為止沒有被利用。不過,這是 Tom發布信息之前,現在呢?我估計有很多人已經在瘋狂實驗這個方法的有效性了。我這篇帖子發出來,國內肯定也會有SEO去嘗試。那么,大規模濫用這種注入方法的情況下,Google的預防機制還會有效嗎?

另一方面,幾乎可以肯定, Tom的帖子發出來,會迫使Google必須要積極采取措施,補上這個漏洞,不能讓XSS攻擊注入鏈接真的成為有效的SEO作弊方法。想嘗試的,盡快吧,很快就會沒用的。

5月8號更新:Google在7號的Google I/O開發大會上宣布,Google蜘蛛將使用最新版的Chrome引擎,目前版本是74,以后都會保持使用最新版本。看來Google早就做了準備,所以這么有信心。

]]>
http://www.nkjmnnn.com/blackhat/xss-attack-google/feed/ 49
以人工智能為基礎的搜索算法是什么樣的? http://www.nkjmnnn.com/topic/ai-based-algorithm/ http://www.nkjmnnn.com/topic/ai-based-algorithm/#comments Sat, 27 Apr 2019 18:31:31 +0000 http://www.nkjmnnn.com/?p=5060 三年前,Googled的AlphaGo橫空出世時,我寫了《AlphaGo、深度學習及SEO》這篇帖子,在那之后,我一直非常關注人工智能與搜索算法的進展。

人工智能與搜索算法

我不知道搜索算法什么時候會大規模以AI為基礎,也不知道目前AI技術在搜索算法中應用到了什么程度。由于目前人工智能技術的不可解釋性,搜索引擎以AI作為算法基礎會是非常謹慎的,不然很不容易debug。

不過算法中的一些模塊應用AI是肯定的,以前介紹過百度的DNN模型和Google的RankBrain算法,都是AI在搜索算法中的應用。

那么完全以人工智能為基礎的搜索算法是什么樣的?工作原理和流程是什么?簡單說一下我的理解。

人工智能的優勢與搜索

目前實現人工智能的主流方法是機器學習中的深度學習分支,在這篇帖子里就不加嚴格區分了。

簡單說,人工智能是給予系統大量訓練數據,人工智能自己從中尋找模式和規律。給予AI系統的數據是打了標簽的,或者說是告訴了AI系統結果。比如,在圍棋中,AI系統有了大量歷史棋局數據(后來的Alpha連歷史棋局都不需要了,自我對局的數據就行了),以及這些棋局的輸贏結果,這個結果就是標簽。然后AI系統自我學習棋局盤面與結果(輸贏)之間的關系。

在搜索中,AI系統有了頁面的大量數據,也就是搜索引擎本身的索引庫,還需要標簽,也就是要知道哪些頁面是高質量的?針對一個查詢詞,哪些搜索結果是用戶滿意的?然后AI算法自己學習頁面特征(也就是排名因素)和排名之間的關系。

傳統的搜索算法是搜索工程師人工選擇排名因素,人工給予排名因素一定的權重,根據給定公式,計算出排名。這種方法的弊端是,當數據量大了,排名因素多了的時候,調整排名因素的權重是件很困難的事。最初的權重很可能就是根據常識,再加上拍腦袋,具有很大的主觀隨意性。當有幾百個因素,這些因素又互相影響時,調整這些因素的權重就變成混亂、無法預見結果的事了。

而從海量數據中找模式正是AI的擅長。AI可以快速尋找可能的排名因素,調整排名因素權重,自動迭代計算,擬合出排名因素和用戶滿意的搜索結果之間的計算公式。

通過訓練數據訓練出來的計算公式就是AI搜索算法,可以應用于用戶更多的搜索了。

誰來打標簽?

既然訓練AI搜索算法時需要打了標簽的數據,那么這些標簽數據是從哪來的?這就是搜索引擎質量評估員的作用了。

前不久Google質量評估指南帖子里詳細介紹了質量評估員的工作。這些真實用戶(他們不是Google員工),在學習質量評估指南后,Google在評估系統中給評估員真實網站、真實查詢詞數據,評估員進行相關評估,最主要的就是:

  • 給頁面質量打分
  • 給特定查詢詞的搜索結果打分

Google的質量評估員很早就存在了,應該不是為了開發AI算法招募的,而是用來評估傳統算法質量的。但他們的評估數據剛好可以被人工智能系統有效使用。

這樣,AI系統就知道,針對某個查詢詞,用戶滿意的搜索結果是哪些頁面,是按什么順序排名的。

現在,AI系統有了海量頁面特征數據,也知道什么樣的搜索結果是真實用戶滿意的,下一步就是訓練系統,尋找頁面特征和搜索排名之間的關系。

訓練人工智能搜索算法

搜索引擎可以把打了標簽的搜索結果數據分成兩組。一組訓練用,一組驗證用。

AI算法檢查訓練組搜索結果中的頁面有哪些特征,這些特征又應該給予什么樣的權重,根據什么樣的計算公式,才能計算出用戶滿意的(打過標簽的)搜索結果。

與傳統算法不同的是,需要哪些特征(排名因素),這些特征給予多少權重,不是工程師決定的,是AI系統自己尋找和評估的。這些因素也許是工程師想得到、早就在用的,比如:

  • 頁面的關鍵詞密度
  • 頁面內容長度
  • 頁面上有沒有廣告
  • 頁面有多少外部鏈接
  • 頁面有多少內部鏈接
  • 頁面有多少以查詢詞為錨文字的鏈接
  • 頁面所在域名有多少外鏈
  • 頁面打開速度多快
  • 等等等等,可能有幾百上千個

也許是工程師壓根兒沒想過的,也許有些是表面上看起來毫無關系、毫無道理的,比如:

  • 頁面正文用的幾號字
  • 文章作者名字是三個字
  • 頁面第一次被抓取是星期幾
  • 頁面外鏈數是單數偶數

以上只是舉例,為了說明,AI尋找的不是因果關系,而是相關關系。只要AI看到排名好的頁面有哪些特征就夠了,至于把這些特征與排名聯系起來是不是看著有道理,并不是AI關心的,也是不必要關心的。

當然,有些因素可能是負面的,比如域名長度,很可能與高排名是負相關的。

AI系統被訓練的過程就是找到這些排名因素(無論人類看著是否有道理),給予這些因素一定權重,擬合出一個計算公式,剛好能排出用戶滿意的那個搜索結果。這個擬合過程應該是迭代的,一個權重數值、一個公式不行,自動調整,再次計算,直到比較完美擬合出評估員打過標簽的搜索結果。這個訓練過程也許要幾天,也許幾個星期,要看數據量。

AI搜索算法驗證

被訓練過的AI搜索算法就可以應用于其它沒在訓練數據里的查詢詞了。

首先用前面提到的驗證組數據驗證一下,如果新訓練出來的算法給出的搜索結果與驗證組數據(同樣是評估員打過標簽的)吻合,說明算法不錯,可以上線了。如果AI算法給出的搜索結果與驗證組搜索結果里的頁面不同,或者頁面基本相同但排序差別很大,可能就要重新訓練AI系統了。

當然,要做到所有查詢詞,AI算法給出的搜索結果與評估員打過最滿意標簽的搜索結果完全一樣,是不大可能的。估計只要排在前面,比如前20名的頁面順序差異在一定的容錯范圍內就可以了。排在越前面,需要越低的容錯率,比如排在第一第二的頁面不對,比排在第三頁之后的頁面不對嚴重多了。

驗證過的算法就可以上線,接受真實用戶的檢驗了。這里很可能牽扯到一個SEO們普遍認為與排名有關、但搜索引擎一直否認的排名因素:用戶體驗數據是否是排名因素?

很多SEO排名因素統計表明,頁面點擊率、跳出率、用戶停留時間、訪問深度與排名有很高的相關性,但Google一直明確否認這些數據是排名因素。當然,對百度來說,點擊率顯然是排名因素。

原因很可能就是,搜索引擎需要用這些用戶體驗數據驗證搜索算法質量,如果用戶普遍點擊率降低、跳出率提高,說明新上線的算法有問題,需要調整。雖然搜索引擎沒有直接使用用戶數據來排名,但算法的目標就是提高用戶數據,使得這兩者之間高度相關。

新的AI算法上線后,搜索引擎監控的用戶數據說明用戶滿意,算法就成功了,等待下一輪的優化。

以上純屬猜測。

]]>
http://www.nkjmnnn.com/topic/ai-based-algorithm/feed/ 26
Tag標簽頁面如何優化? http://www.nkjmnnn.com/seo-tips/how-to-optimize-tag-page/ http://www.nkjmnnn.com/seo-tips/how-to-optimize-tag-page/#comments Thu, 18 Apr 2019 17:37:34 +0000 http://www.nkjmnnn.com/?p=5229 讀者“會飛的雨”問:tag標簽頁面如何優化?

Tag頁面很常用,用得好的話SEO效果不錯,但很多網站的tag頁面使用并不恰當,甚至可能會有負效果,所以這是個很好的問題。不過這個問題一兩句話很難說清,而且在SEO每天一貼沒有討論過這個話題,所以單獨寫個帖子聊一下tag標簽頁面怎樣SEO。

什么是tag頁面?

tag頁面,或者標簽頁面,是組織網站內容的一種分類方式。站長根據每篇文章的內容給文章打個標簽,既然是根據內容打的,通常標簽也就是與文章內容最相關的關鍵詞。比如這篇帖子是討論標簽頁面如何優化的,可以打上“標簽頁面”、“優化”之類的標簽。如果文章是談996的,可能會打上“996”、“馬云”之類的tag。

然后網站為每個標簽建立一個標簽頁面,把包含這個標簽的所有文章列在標簽頁面上。所以,tag頁面可以理解為一個按關鍵詞分類的內容聚合頁面。

最常見的tag頁面就體現在博客上。WordPress等博客CMS會把tag鏈接以tag cloud(標簽云)的形式顯示在側欄中,tag的尺寸代表了這個tag里內容的多少:

SEO每天一貼沒有啟用tag功能,所以看不到標簽云。沒有啟用的原因看完這個帖子就清楚了。

Tag頁面與分類頁面的區別

分類頁面(Category Page),也可以稱為欄目頁面,產品列表頁等等,總之,就是網站主導航里面那些頁面。

Tag頁面和分類頁面都是組織內容的分類方式,各有特點和用途。

分類頁面一般是有從屬關系的,比如本帖子是在SEO技術這個分類之下。稍大點的網站分類從屬關系就更明顯,分類本身就有從屬,比如一雙男旅游鞋可能是在這個分類結構下:

鞋帽 – 鞋 – 男鞋 – 休閑男鞋 – 男旅游鞋

上面的各個分類本身也是有從屬關系的,是會體現在URL的目錄結構中的。這種從屬關系都是有邏輯的,在目錄結構、面包屑導航等的協助下,用戶可以清晰判斷當前頁面在網站的什么位置。

而tag頁面沒有這種從屬關系,各個tag頁面是并列關系,其URL也沒有層級目錄,通常所有tag頁面的URL都是 /tag/標簽名稱/ 而已。

分類頁面一般是固定的,沒有改版時不會增加或減少。Tag頁面可以隨時增加,尤其是有突發事件、話題時,分類系統中有“程序員”或者“互聯網”甚至“馬云”都是可能的,但不大可能有“996”這個分類。而標簽就可以有“996”。

Tag頁面的SEO特點

由于Tag頁面就是針對關鍵詞的內容聚合頁面,所以tag頁面與關鍵詞的相關度通常是很高的,也所以tag頁面排名經常是不錯的。

而且tag的使用更靈活。如前面提到的,有熱點話題時,關鍵詞經常是新創的,如果有多篇跟進文章,用標簽聚合在一起是最合適的。

一般來說,標簽應該是編輯人工打的。有的網站也會從文章中自動提取關鍵詞,或者利用詞庫,生成tag頁面,所以tag頁面也經常被用來自動生成大量頁面,意圖覆蓋更多關鍵詞。這個方法要十分慎重使用。

Tag頁面使用時要注意什么?

雖然tag頁面相關度高,但用不好也容易有負面作用。

比如前面提到的自動生成大量頁面,這必須是在內容數量足夠、而且生成頁面相關性夠高的情況下。一個只有幾千個產品的網站,如果生成幾千個tag頁面,組合來組合去也都是那些產品,恐怕會造成大量低質、重復的頁面。一個“黑連衣裙”tag頁面如果夾雜很多白色衣服,用戶體驗恐怕也是個問題。

即使有足夠內容保證,相關度也夠高(比如標簽是編輯人工打的),也要避免一個很多網站在犯的錯誤:tag頁面不應該與現有分類頁面重復。比如一個新聞網站,把所有和財經有個的新聞打上“財經”這個標簽是毫無意義的,“財經”這個tag頁面與“財經”欄目內容必然高度相似,對搜索引擎來說是重復內容,對網站來說,到底優化哪個頁面將失去焦點。

Tag關鍵詞應該是分類名稱沒有的、又有一定關注度的詞,比如“中美貿易戰”,而不是“財經”。很多時候,這種不會出現在分類導航系統中的詞,是有不小的查詢量的,除了前面提到的突發新聞,還有保持穩定的人名、公司名,都不大會出現在分類名稱中,但名人、大公司名字,搜索量是很大的。

Tag與分類名稱重復,也可以理解為標簽打得太寬泛,要避免。另一方面,標簽也不能打得太細,比如我見過把文章標題打成標簽的,結果是一個tag頁面上就一篇文章,這頁面質量也太低了。最好一個Tag頁面上至少有5篇10篇相關文章,才生成這個Tag頁面。

最后,我沒有啟用Tag功能是因為,我沒辦法想出那么多與分類名稱不同、又有一定關注度的關鍵詞。

]]>
http://www.nkjmnnn.com/seo-tips/how-to-optimize-tag-page/feed/ 56
未來SEO也許不用再操心爬行、抓取問題? http://www.nkjmnnn.com/msn/bing-reduce-crawling/ http://www.nkjmnnn.com/msn/bing-reduce-crawling/#comments Thu, 11 Apr 2019 16:46:25 +0000 http://www.nkjmnnn.com/?p=5029 SEO每天一貼很少寫關于必應Bing或雅虎Yahoo!的事,原因顯而易見:他們那可憐的市場份額真不大值得寫。

微軟雖然一直對搜索不離不棄,投入重金和時間,但到目前為止,Bing在搜索市場從來都是個陪襯。Yahoo!就更甭提了,在收購了除Google、Bing以外的所有搜索引擎之后,Yahoo!竟然自廢武功,把自己多年積累、收購的所有搜索技術徹底放棄了,雅虎網站的搜索功能轉為使用Bing的技術 – – 不禁讓人心里嘀咕:確定不是Google臥底干的嗎?一個最重要的對手就這么沒了?

不過Bing對SEO們一直都是挺友好的,而且Bing工程師們給SEO行業不少很有建設性的意見。比如,關于外鏈建設,我覺得最精彩的一句話就是某位必應工程師說的,大意是,最好的外鏈是那些你根本不知道其存在的外鏈。

必應大幅提高URL提交限額

一月底Bing站長博客發了一篇帖子,表示Bing站長工具URL提交工具做了升級,大幅提高站長可以提交的URL數目上限,從原來的每天只能提交10個,每個月最多50個,增長1000倍,現在每天可以提交10,000個,沒有月上限。唯一的限制是,網站需要在Bing站長工具注冊驗證180天以上:

Bing提高URL提交上限

帖子還說了很有意思的一段話,如果以后搜索引擎按這個方向發展的話,SEO們未來可能不用再操心頁面爬行、抓取的問題了:

We believe that enabling this change will trigger a fundamental shift in the way that search engines, such as Bing, retreive and are notified of new and updated content across the web. Instead of Bing monitoring often RSS and similar feeds or frequently crawling websites to check for new pages, discover content changes and/or new outbound links, websites will notify the Bing directly about relevant URLs changing on their website. This means that eventually search engines can reduce crawling frequency of sites to detect changes and refresh the indexed content. 

翻譯過來大意是:

我們相信這個變化會引發搜索引擎發現及抓取新內容(包括新建或更新的內容)方式的根本性變革。站長將可以直接通知Bing網站上有了URL變化,而不需要Bing通過監控RSS或頻繁爬行來發現新頁面。這實際上意味著搜索引擎在發現、更新索引內容時,可以降低對網站的爬行頻率。

內容索引不再依靠爬行?

一直以來,我覺得SEO有三大難點:內容、內部鏈接結構、外鏈建設。其中,網站內部鏈接結構就是要解決搜索引擎有效爬行、抓取的難題,既要抓得全,抓得快,又要避免抓取不必要的內容,還得合理分配權重。越是大站,這個問題越難完美解決。做過大站的SEO一定都深有體會,不管怎樣調整網站結構,都無法做到頁面100%被索引。

必應的這篇帖子在告訴SEO們,以后很可能不用擔心抓取的問題了,有了新頁面,或者舊頁面有了更新,直接提交URL就行了(通過站長工具或API),不必依靠Bing蜘蛛爬行抓取,實際上,Bing蜘蛛會大大減少爬行,卻不耽誤索引新內容。

后續SearchEngineLand對Bing搜索工程師的訪談證實,減少爬行,確實是Bing的目標。他們希望未來幾年內,Bing不再依靠爬行來發現新內容。Bing認為,對網站爬行的方法低效、費資源,不如站長直接提交內容。Bing表示,提交URL是頁面抓取的“很強”的信號,要想內容被快速索引,就趕緊用提交工具吧。

確實,大型網站,頁面被抓取一遍,可能需要幾個星期,甚至更長時間,那么網站上有新頁面,或老頁面內容有更新,要被抓取,也可能會有幾個星期的延遲。提交URL是個更快的方法。

其實百度早就在做類似的事,在百度資源平臺提交內容是快速抓取新頁面的很好方法,小時級收錄確實可以在幾小時內收錄,有時幾分鐘就收錄。不過百度資源平臺提交好像不支持老的但有更新的頁面。

對SEO行業的潛在影響

如果Google以后也跟進采取這個方法,可能會對SEO行業產生不小的影響。搜索引擎發現、抓取、索引新內容的方式變得更加簡單直接,SEO們調整網站結構的必要性和難度將大大降低。

不過也有潛在問題。比如,黑帽SEO們顯然不會放過這個機會。以前垃圾內容靠爬行被抓取越來越困難,因為從一個頁面到另一個頁面的爬行就是個鑒別、過濾的過程。大量主動提交垃圾頁面成為可能后,搜索引擎該怎么處理?

再比如,搜索引擎減少爬行,倒是節省資源了,但老的、不更新的頁面被重新抓取的次數將大大減少,這會不會導致鏈接關系計算的不準確、不及時?順便提一句,不知道為什么總是有人說鏈接對排名已經不重要了,其實依然很重要。

SEO的基本方法過去十多年沒有大變化,但SEO依然是個不斷變化的行業。

]]>
http://www.nkjmnnn.com/msn/bing-reduce-crawling/feed/ 36
搜索引擎自己怎么做SEO? http://www.nkjmnnn.com/topic/how-se-do-seo/ http://www.nkjmnnn.com/topic/how-se-do-seo/#comments Tue, 26 Mar 2019 17:18:57 +0000 http://www.nkjmnnn.com/?p=4691 和其他網站一樣,搜索引擎本身也需要做SEO。以前本博客上就替朋友發過雅虎、微軟招聘SEO人員的帖子。

Google也是一樣。前幾天Google工程師在Think with Google博客上發了一篇帖子,講述谷歌自己怎樣做SEO。雖然是Google自己做網站SEO的經驗,對百度也一樣適用。

Google自己擁有7000多個網站,由全世界數百個產品和營銷團隊運營。對這些網站來說,seo也是他們流量來源的核心。雖然近年來搜索流量比例在下降中,但目前還是大約占網站總流量的一半左右,還是第一大來源。

搜索算法對所有網站一視同仁

Google搜索算法對自己的網站和其它網站是平等對待的,沒有特殊照顧。運營團隊也必須遵守Google發布的網站質量規范。

與外界想象可能不同的是,Google內部員工不一定就了解Google搜索算法,這幾百個運營網站的團隊和普通SEO一樣,對算法的了解很可能并不比我們多多少。Google自己的網站以前多次被自己的算法所懲罰,甚至要解除懲罰也需要和其它站長一樣,在Google Search Console里提交審核申請。

Google與SEO社區溝通的官方代表也不一定完全了解搜索算法。就在前幾天,近年代替Matt Cutts出席世界各地SEO行業大會的Gary Illyes,剛剛發現Google不再使用rel=prev/next標簽了,而過去幾年谷歌在線幫助文檔、對外溝通和回答問題時都一再推薦使用這個標簽。搜索算法負責抓取的團隊幾年前就放棄使用這個標簽,其它團隊的人并不知道。Gary Illyes大概是很偶然地發現了這個事,所以撤下了相關的幫助文檔。有SEO注意到文檔被撤,另一位Google官方SEO聯系人JohnMu在Twitter回答問題時提到,Google根本不用rel=prev/next標簽了。

這個話題這幾天在SEO行業掀起不小的波動。Gary Illyes和JohnMu他們對算法已經算是非常熟悉了,不然沒辦法回答SEO們的問題。即使他們也不一定了解很多算法細節。

所以,Google運營網站的團隊和普通SEO們大致是站在相同的起跑線上。

小處著手

很多有效果的優化并不一定是多高大上的,而是從小處著手,看似基礎、細節的地方,常常有明顯的優化效果。

比如,Google My Business(我的商家)營銷團隊在自己的網站上執行了很基礎的技術優化,如加上正確的canonical標簽,提示搜索引擎哪個URL是規范化的、應該被返回的版本,結果搜索流量上漲了兩倍:

圖中四個時間節點:

  • 新版Google My Business上線
  • 添加canonical標簽
  • 上傳帶有hreflang標簽的sitemap.xml文件
  • 修改meta標簽(標題標簽、說明標簽之類)

這幾個確實都是基礎優化。

擁抱變化

隨著內容的豐富、用戶行為的變化等,搜索算法和搜索概念也一直變化。比如,現在移動查詢量已經超過PC搜索,Google算法也必須適應這個新形勢,產生相應的變化,比如Google AMP的提出和發展。

雖然有的時候各種變化、新技術令人眼花繚亂,但Google內部負責網站的團隊得到的經驗是,越積極擁抱變化,不斷嘗試,SEO效果就越好。

比如,Think with Google團隊去年集中精力解決Google Search Console中顯示的各種錯誤,增加結構化數據,添加AMP頁面。在解決了一些AMP頁面錯誤信息后,頁面展示增長了200%:

圖中黃色時間點就是修正AMP錯誤的時間,之后展現量直線上升。

整合,而不是分散

很多公司和站長都肯定有這種體會,公司出于各種目的,比如為了針對不同客戶群、不同地區,或者不同產品線,經常用差不多的內容建出多個網站。這一點我是深有感觸,我的客戶中極少只有一個網站的,經常是一大堆網站,內容雷同,我在診斷客戶網站時經常發現怎么這些網站這么像呢?然后客戶告訴我,都是他們的網站……

Google也是如此,多年累計下來,Google內部檢查發現,自己有大量近乎重復內容的網站。重復內容不僅讓用戶犯迷糊,也讓搜索引擎算法犯迷糊。集中力量建一個高質量網站,而不是建多個小網站,才是得到搜索流量的最好方法。

比如,在內部檢查后,他們把Google Retail有關的6個營銷網站清理、整合內容為一個,結果是自然搜索流量增長了64%。

我想,整合不僅是多個網站整合為一個,也存在于網站內部。在《SEO實戰密碼》第一版中,我也有過網站越大越好的觀點,但第三版中我已經做個修正,現在的觀點是網站越強越好,而不是越大越好。同一個話題,最好是在一篇文章中寫清、寫透,而不是分成幾個小文章,哪個都不深入。

]]>
http://www.nkjmnnn.com/topic/how-se-do-seo/feed/ 31
Google 2019年3月核心算法更新 http://www.nkjmnnn.com/gg/march-2019-update/ http://www.nkjmnnn.com/gg/march-2019-update/#comments Fri, 15 Mar 2019 17:16:57 +0000 http://www.nkjmnnn.com/?p=5046 本來不想談Google的這次2019年3月核心算法更新,因為昨天在 Google算法更新大全帖子里已經加上了這次更新的內容。但讀者ailly問了這個問題:

哈羅 Zac 您好!3.12這次的Google算法對于網站有什么影響呢。還是持續去年8月份的更新,更多的應該專注于構建優質內容上面嗎?我們公司做軟件的,主要市場是國外,對于這次更新,面向西語、英語等歐美國家網站排名有很大影響、但是對于面向日本的網站并沒有收什么影響。這個是說明我們日本方面的網站沒有觸及這次更新的點嗎?還是說日本這邊的更新和歐美不是同步進行的呢?

看來還是有SEO關注Google SEO方面的新聞的,所以寫個帖子聊一下。

當然,另一個發帖子的原因是,發現已經4個多月沒更新博客了……

谷歌2019年3月核心算法更新

2019年3月12號開始,SEO相關論壇就有人發現Google排名大幅度變化,應該是有比較大的算法更新。

雖然現在Google很少確認算法更新了,但這次還真在Twitter發文確認了:

Google的說法是,和去年8月的Medic更新一樣,這次也是所謂核心算法更新,3月12號上線。全球同時上線。(所以回答讀者ailly的問題,不是因為沒有同步上線,可能是日語網站做得比較好?建議看看日語網站有什么特殊的地方。)

Google也再次強調,這種核心算法更新,SEO是沒有辦法采取針對性措施的,被影響的網站也不一定有什么要修改的,Google的原話是“no fix”,沒法修正,只能關注高質量內容,提高網站整體質量。和以前對核心算法更新的建議沒有任何差別。

Google沒有明說,但有人得到的消息是,這次Google 2019年3月的核心算法更新,是近年最大的更新之一。

為什么取名為2019年3月核心更新

Danny Sullivan發推把這次更新命名為:March 2019 Core Update(2019年3月核心更新)。為什么取個這么沒特色的名字呢?

在Google給這次更新命名之前,webmasterworld的Brett Tabke,在長達15年后又一次為Google算法更新命名了,把這次更新稱為:佛羅里達2更新。

Google早期的算法更新都是webmasterworld命名的,是效仿臺風命名方法,按字母排序,男名女名間隔,這其間的歷史淵源詳見Google算法更新大全帖子。其中webmasterworld命名的最有名的一次更新就是2003年11月的佛羅里達更新(Florida Update),因為webmasterworld當時馬上要在佛羅里達開 PubCon大會。

而這次核心算法更新的時間,是Brett Tabke他們剛好在佛羅里達剛開完PubCon大會,所以Brett Tabke一時興起,長達15年后又給Google更新命了個名。

但佛羅里達2更新與2003年的佛羅里達更新,除了名字成個系列,別的就沒有任何關系了。Google官方為了怕站長們混淆,以為這兩次更新有什么技術上的關系,所以出來說明,還是叫“2019年3月核心更新“吧,更新類型和時間都清楚了,多好。

哪些網站受到了影響?

索性我自己的和客戶的英文網站,到目前為止,都沒有被影響。不過,這種核心算法更新通常需要1個多星期才能上線完成,現在還不能高興得太早。因此,我個人對這次更新還沒有感受,也無從分析。

從網上看到的帖子,各種說法都有,幾乎看不出規律。有說是鏈接相關的,有說還是針對醫藥行業的,有說是美容行業的,有說是E-A-T相關的,有說是去年8月Medic核心算法更新回調的,總之,五花八門,沒什么特殊幫助。

不過從論壇、twitter等地方的動靜看,這個2019年3月核心算法更新影響是比較大的,但實際影響沒有達到像Google所說的是過去幾年最大的一次。

3月17號更新:

SEO行業的初步結論是回調。據Brett Tabke說,他在這次更新上線之前就得到了消息,他的觀察是,很多被上次核心算法更新影響的網站這次恢復了,很像是以前核心算法更新的回調。

另外,一家流量監測公司Sistrix分析部分英國網站的結論是,這次更新得益、排名流量提升的網站中,75%是去年受負面影響,排名流量下降的網站。這次受負面影響的網站中,70%是以前就受負面影響的。所以,受影響的基本是同一群網站,有的以前被誤判,這次回升,有的是進一步下降。

]]>
http://www.nkjmnnn.com/gg/march-2019-update/feed/ 22
ag真人平台