2012年3月30日 星期五

HITS演算法詳解


HITS演算法詳解

HITSHyper-link-induced topic search)是由kleinberg提出來的基於連接分析的網頁排名演算法,描述2種類型的網頁:“權威性(authority)的網頁”:對於一個特定的的檢索,該網頁提供最好的相關資訊;“目錄型(hub)網頁”:該網頁提供很多指向其他高品質權威型的網頁鏈結。由此,我們可以在每個網頁上定義“目錄型權值”和“權威型權值2個參數。
1HITS演算法基本思想:
 1、好的hub型網頁指向好的authority型網頁
 2、好的authority型網頁是由好的hub型網頁所指向的網頁
2Hits演算法

HITS(Hyperlink Induced Topic Search) 演算法是利用HubPAuthority的搜索方法具體演算法如下
將查詢q提交給基於關鍵字查詢的檢索系統,從返回結果頁面的集合總取前n個網頁(如n=200),作為根集合(root set),記為S,則S滿足:
1.S中的網頁數量較少
2.S中的網頁是與查詢q相關的網頁
3.S中的網頁包含較多的權威(Authority)網頁

通過向S中加入被S引用的網頁和引用S的網頁S擴展成一個更大的集合T。T中的Hub 網頁為頂點集V1,以權威網頁為頂點集V2
V1中的網頁到V2中的網頁的超鏈結為邊集E,形成一個二分有向圖V1中的任一個頂點v ,h( v)表示網頁vHubh(v)收斂V2中的頂點u,a(u) 表示網頁的Authority值。
開始時h ( v) = a ( u) = 1,u 執行I 操作修改它的a ( u) ,v執行O操作修改它的h ( v),然後規範化a ( u)Ph ( v),如此不斷的重複計算下面的I操作和O操作直到a ( u)
其中I操作:a ( u) = Σh ( v);O 操作:h ( v) = Σa ( u) 。每次迭代對a ( u) h ( v) 進行規範化處理:a ( u) = a ( u)PΣ[ a ( q) ]2;h ( v) = h ( v)PΣ[ h ( q) ]2

HITS演算法可以獲得比較好的查全率輸出一組具有較大Hub值的網頁和具有較大權威值的網頁但在實際應用中HITS演算法有以下幾個問題

S 生成T 的時間開銷是很昂貴的T 生成有向圖也很耗時需要分別計算網頁的APH計算量大;網頁中廣告等無關鏈結影響AH值的計算降低HITS演算法的精度;HITS演算法只計算主特徵向量處理不好主題漂移問題;進行窄主題查詢時可能產生主題泛化問題。

相關分析演算法大體可以分為4
基於隨機漫遊模型的演算法比如PageRank、Repution演算法基於HubAuthority 相互加強模型的演算法HITS 及其變種基於概率模型的演算法SALSA、PHITS;基於貝葉斯模型的演算法如貝葉斯演算法

所有的演算法在實際應用中都結合傳統的內容分析技術進行優化。Allan Borodin 也指出沒有一種演算法是完美的在某些查詢下結果可能很好在另外的查詢下結果可能很差
S擴展為基本集合(base set) TT包含由S指出或指向S的網頁。可以設定一個上限如 1000—5000個網頁。
開始權重傳播。在集合T中計算每個網頁的目錄型權值和權威型權值。Clever的做法是採用目錄型網頁和權威型網頁相互評價的辦法進行遞迴計算。對於一個網頁p,用xp來表示網頁p的權威型權值,用yp來表示它的目錄型權值,並且用如下公式進行計算:
1.計算各節點的HubAuthority
2.賦予每個節點的hub值和authority值都為1
3.運行Authority更新規則。
4.運行Hub更新規則。
5.Normalize數值,即每個節點的Hub值除所有Hub值之和,每個Authority值除所有Authority值之和。
6.必要時從第二步開始重複。

引用自《Chczz.com

Google PageRank演算法詳解


Google PageRank演算法詳解

PageRank Google 對網頁重要性的評估演算法。
PageRank 值的提高可有效提升你的網頁在 Google 搜索引擎中的頁面排名,PageRank 值較大程度上決定了網頁的權重,交換友情鏈結是提高網站 PageRank 值最直接有效的方法。

獲得友情鏈結的PageRank 分值計算方式:
PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))

符號說明:PR(A) 表示從外部鏈結站點 t A 網站帶來的 PR 分值;d 為阻尼因數 (damping factor),一般取值為 0.85PR(t) 表示外部鏈結網站本身的 PR 分值;C(t) 表示外部鏈結網站包含 A 網站的外鏈數量。

如果 www.example.com PR=2,並有 1 個鏈結至bankshung.blogspot.com 的外部鏈結,則bankshung.blogspot.com獲得 PR 計算如下:
PR(A) = (1-0.85) + 0.85*(2/1)
=0.15+0.85*4
=0.15+1.70
=1.85

也就是說,當獲得一個 PR 值為 2,外部鏈結數為 1 的網站的鏈結時,bankshung.blogspot.com將會獲得 1.85 PR 分值。

引用自《芒果小站

HITS演算法與PageRank演算法比較

HITS演算法與PageRank演算法比較

HITS演算法PageRank演算法可以說是搜索引擎鏈結分析的兩個最基礎且最重要的演算法。從以上對兩個演算法的介紹可以看出,兩者無論是在基本概念模型還是計算思路以及技術實現細節都有很大的不同,下面對兩者之間的差異進行逐一說明。

1.HITS演算法是與用戶輸入的查詢請求密切相關的,而PageRank與查詢請求無關。所以,HITS演算法可以單獨作為相似性計算評價標準,而PageRank必須結合內容相似性計算才可以用來對網頁相關性進行評價。

2.HITS演算法因為與用戶查詢密切相關,所以必須在接收到用戶查詢後即時進行計算,計算效率較低;而PageRank則可以在爬蟲抓取完成後離線計算,線上直接使用計算結果,計算效率較高。

3.HITS演算法的計算物件數量較少,只需計算擴展集合內網頁之間的鏈結關係;而PageRank是全局性演算法,對所有互聯網頁面節點進行處理。

4.從兩者的計算效率和處理物件集合大小來比較,PageRank更適合部署在伺服器端,而HITS演算法更適合部署在用戶端。

5.HITS演算法存在主題泛化問題,所以更適合處理具體化的用戶查詢;而PageRank在處理寬泛的用戶查詢時更有優勢。

6.HITS演算法在計算時,對於每個頁面需要計算兩個分值,而PageRank只需計算一個分值即可;在搜索引擎領域,更重視HITS演算法計算出的Authority權值,但是在很多應用HITS演算法的其他領域,Hub分值也有很重要的作用。

7.從鏈結反作弊的角度來說,PageRank從機制上優於HITS演算法,而HITS演算法更易遭受鏈結作弊的影響。

8.HITS演算法結構不穩定,當對“擴充網頁集合”內鏈結關係作出很小改變,則對最終排名有很大影響;而PageRank相對HITS而言表現穩定,其根本原因在於PageRank計算時的“遠端跳轉”。

引用自《TechWeb技術社區

如何分析競爭對手的站-站外優化篇


如何分析競爭對手的站-站外優化篇

  作為網站優化人員,日常的優化無非是圍繞這站內優化與站外優化,對於站內優化筆者本文暫且不說,筆者今天主要要說的是關於站外優化。站外的優化對於一個站點的作用我們毋須懷疑。站外優化的方式想必大家都已經有很多自己的方式,但是最廣泛使用的方式莫過於通過友情鏈結。友情鏈結對於一個站點來說是一把雙刃劍,如果我們把這把劍使得好的話,可以禦敵於千里之外,如果使得不好的話那就是出師未捷身先死,針對這個問題,筆者將分享自己關於友情鏈結交換時我們需要的考慮的問題。

一、你需要查看對方的網頁快照




  雖然我們不能用網頁快照來衡量一個站點的品質高低,但是我們卻可以通過它來分析網站的品質。一般情況下,如果網站的品質高的話,那一定會被搜索引擎所青睞,相對而言爬行你的站點就會更加的積極,那麼你的站點的收錄和快照就會跟上。所以所網頁快照對於一個站點的品質衡量上還是很重要的,當然對於網頁快照的更新頻率我們也不能太苛刻,畢竟蜘蛛也有“懶”的時候,對於快照一般我們可以將快照的延遲期限設定為一周。

二、PR只能參考,不要迷戀




  對於一些網站,可能網站的歷史比較悠久,相對而言pr會比較高,但是隨著WEB進入後PR時代,許多站長仍然對PR之執迷不悟,認為PR高就是一切。有些站點只是因為購買了老功能變數名稱,所以PR值才會那麼高,但是站點的收錄和從搜索引擎的有機搜索進來的流量卻只有一點點。如上圖所示,而這樣的站點對於你來說沒有什麼太大的意義。

三、查看對方的搜索引擎收錄情況

  我們都知道內容是一個網站的靈魂,沒有內容的網站根本不能有發展,一個網站即使有在高的PR,但是如果沒有內容,對於這種站點來說,筆者可以不客氣的說不能走得太遠的。對於一個站點我們不僅要看他的總收錄量,我們還要關注站點是不是有每天有規律的更新收錄,因為這樣可以證明蜘蛛每天都有對其站點進行內容的抓取。

四、查看對方站點的友鏈數量

  對於一個站點來說,權重是有限的,而我們交換友鏈也主要是為了分配那一點點的權重,如果一個站點有著大量的友鏈,那麼它分配到你的站點的權重自然而然的被稀釋了。對於一個高權重的站點,如果有七八十個友鏈的話,那麼從它身上分配到的鏈結權重還不如一個普通的站點。所以我們在做友鏈的交換的時候,還應該檢查對方的友鏈數量,一般友鏈數量要超過50個是最好的。

五、對方站點是否與你的站點相關

  對於友鏈的相關性,這個很容易理解。對於友情鏈結的交換,我們應遵循尋找與自己的站點有相關性內容的站點,這樣會是搜索引擎更加信任你的站點。如果你的友鏈都是一些不相干的站點的話,搜索引擎很容易認為你是購買鏈結的。

引用自《CK數字電影院

SEO的發展史,SEO3.0S版本的定義


SEO的發展史,SEO3.0S版本的定義

首先我們來回顧下SEO的發展史:

SEO1.0是1995-1998年,當時注重的是網站的內容匹配,搜索引擎蜘蛛識別能力較弱,所以就出現了羅列關鍵字的現象。是否有內容成了排名的主要因素之一。

SEO2.0是1999-2010年,這個時間段注重的是站內優化,站外優化,同時搜素結果的地區性差異,以及多媒體結果的出現(搜索結果中出現圖片等結果)。網站是否有高的權重,是否有高品質的內容成了排名的主要因素之一。

SEO3.0是2011-?年,是否滿足用戶的需求,是否有高的權重,是否有好的內容成了排名的主要因素之一。產品設計優化、用戶滿意度優化、資源整合優化在此階段顯得尤為重要。SEO的英文定義也可從Search Engine Optimization演變為Searcher Experience  Optimization,中文翻譯為搜索體驗優化。搜索引擎越來越人性化,搜索引擎 考慮的是為搜索者提供高品質的用戶體驗。

SEO3.0S是提醒SEOer關注搜索引擎市場的動態,搜索引擎市場的份額已經發生了變化,這些變化或許就是搜索引擎發展的趨勢。第一個S是微博搜索(s.weibo.com)。



第二個S是SOGOU,搜狗在過去的一年中表現不凡,根據艾瑞資料搜狗已經成為中國第三搜索引擎,第一位百度,第二位穀歌。

第三個S是SOSO,SOSO依託中國最多的用戶端QQ,迅速壯大。

所謂的SEO3.0S也就是提醒廣大的SEO從業人員,在關注Searcher Experience  Optimization(搜索體驗優化)的同時關注三個S的發展動態,SEO3.0S遲早會到來。

引用自《NICK的SEO博客

Youtube影片SEO優化的六大秘訣


Youtube影片SEO優化的六大秘訣

第一:好的標題
不僅要包含關鍵詞,同時還要有吸引力!(關鍵詞最好放在最前面)。

第二:好的標籤
把自己最重要的關鍵詞放在首位,youtube最多可以設置12個標籤。

第三:好的描述
寫一段經典,有吸引力的描述:最好包括關鍵詞,聯繫方式(影片的初衷就是方便別人聯繫你)我曾經看到過一個影片流量超級大,只可惜沒留下聯繫方式(不知道失去了多少客戶),站點鏈接(方便客戶更好的了解你)。

第四:好的鏈結
影片優化也一樣,同樣需要外鏈的支持,外鏈可以是別人的收藏,自己添加的外鏈等等。

第五:定時的更新
定時的發布新的相關的影片上去,這和英文站點的定時更新沒什麼兩樣。

第六:評論也很重要哦!
瀏覽者的評論越多,說明你的影片非常受歡迎哦,對排名就有很多好處哦。

引用自《網路行銷軍火庫

2012年Enterprise SEO的四大趨勢


2012年Enterprise SEO的四大趨勢

什麼是Enterprise SEO? 就是指大企業的SEO,這個SEO跟中小企業的SEO基本上沒有太多差異,但是細節上有些不同。例如在"大型商務網站的SEO策略: 訪談Jonathon Colman"與"搜尋引擎優化: CNN 與 SEO"所說,大型網站有必須更加聚焦的重點,也就是因為大企業網站必須顧慮的範圍很廣泛,必須有更具效率的策略。

再者,大企業的SEO必須是團隊式的SEO,也不能如小網站只有一人獨力進行,因此大企業的SEO必須全面結構式的、必須是系統性的進行,才能收到最明顯的效益。

全面結構式與系統性的進行,是大企業SEO的兩大重點。

我們就來談談這篇"Enterprise SEO: 4 Trends to Watch in 2012"所說的四大趨勢。

(1) SEO已經逐漸被大企業重視

作者談到我們以前也提過的In-House SEO的問題,大企業的SEO最好不要採用In-House SEO(內部人員自己進行SEO),而必須聘請SEO顧問並搭配Outsourcing SEO+In-House SEO。

為什麼大企業的SEO最好不要採用In-House SEO?

因為範圍廣泛,並且大企業自己會有很多包袱,很可能自己無法看到應該改善的重點,或是就算看到缺點,可能因為不能說出來而錯失改善的機會。

對於曾經待過大企業的人,應該都有一個感覺,很多時候不是在解決真正的問題,反而都在解決人的問題,人所引起的問題都比真正的問題難以解決。

所以這時候,就必須有專業的顧問進來擔任黑臉的角色,企業SEO顧問必須獲得高層的授權,在經過與管理階層獲得溝通後,把真正應該進行的措施展示出來。

作者認為Link development(連結)、social media(社交)、content strategies(內容)是企業SEO應該著重的重點,以及企業SEO還必須有精準的使用分析工具,來進行評估工作。

許多大企業雖然開始重視SEO,但是很多還是採用In-House SEO,應該逐步更換策略,以內部人員搭配SEO顧問與外包廠商,可以獲得更好的結果。

(2) Rich Snippets越來越重要

我們提過Rich Snippets非常重要,並且也可能會變成spam的樂園,在"研究顯示reviews與images是Mobile SEO的重點"也提到,具有正面評等內容的網頁,會提升讀者的信賴以及點選。

除此之外,Authorship也扮演重要角色,因為讓讀者透過Rich Snippets來瞭解網頁,可以增加點選的機會。而Authorship的累積,更可能跟Google+產生連結,由網站內容累積社交網路的影響力,再反過來透過社交網路的影響力來提高搜尋表現。

在前面有提到,企業SEO必須是全面結構式的。

只有透過Rich Snippets,或是說透過Microdata之類的協定,才能夠在最省力的情況下,把網站內容呈現給搜尋引擎,網站結構對於小企業很重要,對於企業網站更是極端重要。

(3) 社交策略更加影響SEO

Social SEO已經說過太多次,企業網站必須把Facebook、Google+、Twitter、Plurk ... 等等社交網路都囊括進去社交策略當中。

雖然目前Google+的影響最大,但是長期而言,搜尋引擎不可能忽略其他社交網路的訊號,因為現在Google正在爭取社交網路的龍頭,所以Google+權重偏高是可以理解的,但是不要忘記了PostRank也是Google的,Google不可能不去利用這些訊號。

除了社交因素會影響SEO之外,Google對於登入用戶的加密處理 (encrypted search),對於SEO也有很大的影響,許多傳統的分析方式就無法瞭解點選是透過哪些關鍵字而來。

對於大企業而言,比小網站更有優勢的是具有更多的人力來進行社交網路策略。

對於大企業而言,不是只有SEO相關人員才能協助SEO,如果能夠擬出更好的方式來鼓勵內部人員透過社交網路來行銷企業網站,就能夠讓整個企業動起來。

(4) Domain Authority (網域權威度)越來越重要

Domain authority不僅會影響搜尋引擎的評估,也會影響使用者的點選意願。

大企業的Domain Authority通常都不錯,因為具有長期註冊時間、具有多樣的網路連結、具有社交網路偏好度 ... 等等因素,所以企業間網路的競爭,不是在比較Domain Authority好不好,而是在比較Domain Authority有多好。

就如同之前"研究顯示Wikipedia特別受到Google搜尋排名喜愛"所說的,其中一個重要因素也是Wikipedia的Domain Authority,也就是我們說到的八個原因累積而成它的Domain Authority被Google所喜愛。

Domain Authority跟Page Authority不同點在於全面性的評估,而非以頁面來衡量。Domain Authority根據root domain的連結數量,以及其他網站全面的SEO指標

以上所提到的Enterprise SEO的四大趨勢,不是指對於小網站就不重要,而是這些趨勢對於企業網站更加重要,並且必須以更不同的觀點來擬定策略。

引用自《DNS台灣搜尋引擎優化與行銷研究院

流量多樣化才能讓網站更加健全



流量多樣化才能讓網站更加健全

網路的變化實在非常劇烈,今天你的網站可能都還可以擁有大量的搜尋流量,或是擁有大量的社交網路流量,但是很可能明天這些流量就會瞬間消失,因為你的網站可能因為某些原因而被處罰,也可能因為替你帶來流量的網站出了問題,或是根本已經消失 ...

所以最好的策略就是「具有流量多樣性」,如此就不必為了某個特定來源的流量消失而擔心。

我們在"Google Panda演算法更新之SEO生存指南"說過,如果你的網站流量多樣化,你就不需要太擔心搜尋流量突然降低,如果你的流量來源只單一依靠搜尋流量,那麼如果被Google Panda演算法更新的閃電打到,那麼可能就會讓網站無法生存。

因此你的網站必須具有Google的自然搜尋流量、Bing的自然搜尋流量、Facebook的流量、Twitter的流量、Plurk的流量、其他搜尋引擎與社交網路的流量、或是來自其他各種網站的流量,如果你的流量大多偏於某個流量,那麼你就必須特別注意了,是否可能有一天這個流量反而會讓我的網站消失呢?

這篇"The Importance of Having Diverse Traffic Strategies"就說到BuildMyRank的例子,雖然Google宣稱這些違規的作法都在Google的監視中,但是為什麼需要這麼久才處理這些違規,而除了BuildMyRank之外呢? 還有多少的類似情況都還能享受違規的成果呢? 而怎麼樣的違規才算是違規呢? 也是一直混沌不清的事情。

以前只要不是大量而惡意影響排名的連結就不會有問題,並且別人的壞連結不會影響好的站台,但是現在已經不一樣了,是否會被Google處罰完全看運氣好不好,是否會被陷害也完全要看運氣好不好,Google並沒辦法讓這些人為操作完全無效,只能一陣子抓幾個大咖加以遊街示眾,然後繼續讓其他人為操作逍遙法外。

因此作者認為,不應該再依靠Google或是任何一個單一流量來源,而應該靠自己去吸引讀者進來。例如~ Article syndication (文章聚合)、eZine marketing (電子雜誌行銷)、email marketing(郵件行銷)、ebook publishing(電子書出版)等等。

只是Google讓許多網站變得很懶惰,因為Google就會幫他們把流量送過來。當Google把許多網站都變懶惰之後,他就具有掌控一切的權利,現在則是多加入了一個Facebook,幾乎許多網站的主要流量來源都是Google與Facebook,頂多加上Yahoo或是Bing。

我們應該如何才能讓流量多樣化呢? 最主要的就是找到你的目標客戶(target customer)在哪裡? 從這些目標客戶可能到達的地方去挖掘可行的辦法。

目標客戶可能存在任何地方,甚至於可能不在網路世界,因此就必須回歸行銷的最原始本質去思考,而非只有搜尋引擎與社交網路。

因此要讓流量多樣化,可能無法有一個簡單的答案,各種不同的行業有不同的方法,不同類型的網站有不一樣的情況。

但是這樣一來,是說不要依賴SEO嗎? 並不是,而是你的網路行銷策略,不能只依賴SEO或是只依賴Facebook,也不能只依賴任何單一類型的行銷策略,你必須啟動的是全方位的網路行銷策略。

引用自《網路行銷也可以這樣玩

2012年3月29日 星期四

競爭對手會不會使用SEO黑帽手法進行陷害?


競爭對手會不會使用SEO黑帽手法進行陷害?


根據BuildMyRank的報導,他說他們每天都會監看Pagerank、索引數目等等數據,但是近日發現他們被Google取消許多的索引,並且他們無法想像會發生這種事情,這是怎麼回事呢?

BuildMyRank說他們認為,只要做些跟別人不同的事情,就可以提供更有品質的服務,但是後來發現事情並不是這樣的。並且他們說到新聞的報導是不正確的,並將對於服務進行退款。

到底是什麼樣的事件呢? 我們再來看看這篇報導~"Google Eliminates Another Link Network, BuildMyRank.com – Just One Of Several?"。

原來是透過BuildMyRank的服務,你可以快速的具有「高品質」的連結,而BuildMyRank本來以為這樣是可以被允許的,並且認為他們是提供高品質的服務,所以認為被Google處罰是莫名其妙的事情,但是至少BuildMyRank沒有擺爛,還肯進行退費。

另外一篇"Google Penalizes Blog Networks, Did SEOs Use It To Hurt Competitors?"就提到了另外一個問題,你的競爭對手會不會利用這個情況,利用相同手法替你的網站建立違規的連結,然後等著看你被處罰呢?

這整個事件就產生了兩個問題需要討論,一是什麼樣的連結策略才是被允許的呢? 另外一個是Google怎麼知道違規的連結策略是誰幹的呢?

什麼樣的連結策略才是被允許的呢?

在Google的最高標準下,只有editoral link (編輯者在內文建立的連結),並且這個連結是與本文談論內容相關的,其他類型的連結都很可能被Google判斷為違規的行為。

因此只要是「人為的」、「付費的」、「非內容相關的」、「大量的」這些情況中任一種行為,都是不被Google允許的連結。其實這種畫分方式,模糊地帶是很大的,並且也很可能被誤判,所以是否會被處罰,最後就決定於是否嚴重影響搜尋結果,並且被Google注意到了。

所以情況就是,違反Google的連結策略,不一定會被處罰,完全看運氣好不好了,但是通常都會幹到被處罰為止,因為沒人願意放棄可以快速成長的手法。

Google怎麼知道違規的連結策略是誰幹的呢?

坦白說,Google不會知道到底是否競爭對手幹的,如果網站A與網站B是競爭對手,而網站A替網站B在BuildMyRank進行快速連結服務,當Google開始處罰BuildMyRank時,當然就會處罰網站B,Google哪會知道是網站A搞的鬼? 如這篇"Google: "Probably Possible" 3rd Party Bad Links Can Hurt You"所說的,是的 ... 這是可能的事情,雖然Google有複雜的演算法來判斷,但是如果手法高超的話,仍然有可能被Google誤判的。

在很久以前,只要是出於善意的連結就不會有問題,並且壞連結不會影響好站,但是現在不一樣了,因為網路環境不一樣了,因為各種手法越來越多了。但是老實說,Google並沒有讓大家能夠安心,如果人為操作連結絕對沒有效果的話,自然不會有人去操作,但是Google卻讓這些人為操作成功運作,然後再去抓出來處罰,而且又可能讓競爭對手拿來上下其手。

所以BuildMyRank這些事件的發生,其實讓人更不信賴Google,Google應該做的是找出一個演算法,讓這些違規的作法根本產生不了效果,如此就不需要任何處罰,也不必讓老實的網站經營者擔心被陷害了。

引用自《DNS台灣搜尋引擎優化與行銷研究院

2012年3月6日 星期二

Google的40個搜尋演算法更新 (February Changes)之一

Google的40個搜尋演算法更新 (February Changes)之一


Google在近日公佈了二月的演算法修正,這次總共公佈了40個更新,這些更新包括了related searches、sitelinks、autocomplete、UI elements、indexing、synonyms、SafeSearch等等,往後我們也會詳細說明Google每個月的更新內容。


除了我們在"Google更新連結訊號(link signal)演算法"提到的更新之外,以下是其他Google的搜尋演算法更新 (algorithm updates):

(1) More coverage for related searches [launch codename “Fuzhou”] 相關搜尋涵蓋更多的範圍 [啟動代碼為 Fuzhou] ~ 這個更新因為有更多的資料來源,使得搜尋時會有更多的相關搜尋內容。以後在進行Google搜尋,在頁面的最下端,會出現更多的相關搜尋 (只是不知是否只有英文搜尋會有影響?)。

(2) Tweak to categorizer for expanded sitelinks [launch codename “Snippy”, project codename “Megasitelinks”] 對於延伸sitelinks分類的更新 [啟動代碼為 Snippy,專案代碼為 Megasitelinks]~ 這個更新主要針對以往sitelinks分類而產生重覆進行改善。

(3) Less duplication in expanded sitelinks. [launch codename “thanksgiving”, project codename “Megasitelinks”] 減少延伸sitelinks的重覆 [啟動代碼為 thanksgiving,專案代碼為 Megasitelinks]~ 跟(2)一樣是改善sitelinks重覆問題。

(4) More consistent thumbnail sizes on results page ~ 搜尋結果頁面縮圖尺寸大小更加一致性,尤其不同搜尋型態的搜尋結果頁面,盡量求其一致的畫面。

(5) More locally relevant predictions in YouTube. [project codename “Suggest”] 對於YouTube在地化相關性的預測 [專案代碼 Suggest]~ 針對不同地區的YouTube搜尋,會優先考慮與搜尋者所在位置的當地資料,例如如果在美國搜尋"lady gaga in",可能就會給予"lady gaga in times square",也就是會與其他地區有不一樣的搜尋結果。

(6) More accurate detection of official pages. [launch codename “WRE”] 對於官方網頁更正確的偵測 [啟動代碼 WRE]~ 以往有些誤判某些企業的官方網站,現在都已經修正過來了,例如搜尋"acer",Acer的官方網站就會出現在搜尋結果第一名的位置。

(7) Refreshed per-URL country information. [Launch codename “longdew”, project codename “country-id data refresh”] [啟動代碼為 longdew,專案代碼為 country-id data refresh]~ 更新與國家相關的網址,以得到更多最新的訊息。

(8) Expand the size of our images index in Universal Search. [launch codename “terra”, project codename “Images Universal”] 對於Universal Search的圖案擴大索引尺寸[啟動代碼為 terra,專案代碼為 Images Universal]~ 使用更多的資料,以增加顯示更多相關的圖案。

(9) Minor tuning of autocomplete policy algorithms. [project codename “Suggest”] 些微的調整自動完成的政策演算法 [專案代碼 Suggest]~ 之前Google曾經一些不當的建議搜尋關鍵字而惹來官司,這個autocomplete的修正,主要是讓一些不恰當的關鍵字不會出現。

(10) “Site:” query update [launch codename “Semicolon”, project codename “Dice”] Site指令查尋更新 [啟動代碼 Semicolon,專案代碼 Dice]~ 讓site:這個指令產生的搜尋結果更有多樣性。

(11) Improved detection for SafeSearch in Image Search. [launch codename "Michandro", project codename “SafeSearch”] 改善SafeSearch在圖案搜尋的偵測 [啟動代碼 Michandro,專案代碼 SafeSearch]~ 只要是針對成人圖片內容搜尋的安全搜尋進行更新,也就是不該出現的內容不會出現。

(12) Interval based history tracking for indexing. [project codename “Intervals”] 以區間為基礎的索引歷史追蹤 [專案代碼 Intervals]~ 修正文件追蹤演算法的訊號。

(13) Improvements to foreign language synonyms. [launch codename “floating context synonyms”, project codename “Synonyms”] 外語同義詞的改善 [啟動代碼 floating context synonyms,專案代碼 Synonyms]~ 這個改善主要修正英文到其他語言的同義詞,因此對於英文搜尋來說,會產生更多與同義詞相關的內容。

(14) Disabling two old fresh query classifiers. [launch codename “Mango”, project codename “Freshness”] 停止兩個舊的新鮮搜尋分類器 [啟動代碼 Mango,專案代碼 Freshness]~ 通常某些特定搜尋會將比較新鮮的內容優先呈現,現在取消了兩個不合時宜的"新鮮搜尋分類器"。

(15) More organized search results for Google Korea. [launch codename “smoothieking”, project codename “Sokoban4”] 韓國Google更多組織過的搜尋結果 [啟動代碼 smoothieking,專案代碼 Sokoban4]~ 把韓國的搜尋結果分類為新聞、部落格、網頁。

(16) Fresher images. [launch codename “tumeric”] 更新的圖案 [啟動代碼 tumeric]~ 修正了對於新圖案的訊號演算法。

(17) Update to the Google bar. [project codename “Kennedy”] Google Bar的顯示方式更新 [專案代碼 Kennedy]

(18) Adding three new languages to classifier related to error pages. [launch codename "PNI", project codename "Soft404"] 錯誤頁面相關的分類器,增加三個新的語言 [啟動代碼 PNI,專案代碼 Soft404]~ 對於404錯誤的回報,增加了Portuguese、Dutch、Italian三種語言。

(19) Improvements to travel-related searches. [launch codename “nesehorn”] 旅遊相關的搜尋改善 [啟動代碼 nesehorn]~ 主要針對飛機航班(flight)查尋的搜尋進行改善。

(20) Data refresh for related searches signal. [launch codename “Chicago”, project codename “Related Search”] 相關搜尋資料刷新的訊號 [啟動代碼 Chicage,專案代碼 Related Search]~ 改善"Searches related to"的顯示,例如大家都在搜尋"apple"後就會馬上搜尋"banana",那麼"banana"就是相關搜尋。

以上的20個搜尋演算法更新項目,大致可以歸納為以下幾種類型:

(1) 與資料本身相關: 呈現更新、更精準、更大範圍、更多樣性的搜尋內容,如上述的(1)、(5)、(7)、(8)、(10)、(12)、(16)、(19)、(20)。

(2) 與資料格式相關: 使資料的展現更容易閱讀,如上述的(4)、(15)、(18)。

(3) 與資料過濾相關: 更有效的控制應該出現以及不該出現的資料,如上述的(2)、(3)、(6)、(9)、(11)、(14)。

(4) 與資料對應相關: 相關詞或是同義詞的對應修正,如上述的(13)。

(5) 與使用者界面相關: 修正使用者界面,如上述的(17)。

其中比較值得注意的地方是Google對於fresh(新鮮)local(在地)relevant(相關)的演算法修正,雖然Google並沒有清楚說明改變在哪裡,但是根據幾個搜尋結果可以看到確實Google SERP已經有些微的變動。

另外的20個搜尋演算法更新,我們將在下一篇文章來討論。

引用自《SEO關鍵解碼

Google更新連結訊號(link signal)演算法


Google更新連結訊號(link signal)演算法

Google在"Search quality highlights: 40 changes for February"一口氣公佈了40個演算法的更新,其中最重的一個項目就是關於link evaluation (連結評估) 的演算法更新 ...


我們將會把這40個更新在另文討論,我們先來看這個link evaluation (連結評估) 的演算法更新:

Link evaluation. We often use characteristics of links to help us figure out the topic of a linked page. We have changed the way in which we evaluate links; in particular, we are turning off a method of link analysis that we used for several years. We often rearchitect or turn off parts of our scoring in order to keep our system maintainable, clean and understandable.

連結評估: 我們通常使用連結的特徵來協助我們瞭解被連結頁面的主題,我們目前已經更改評估的方法,我們關閉了一個已經使用多年的連結分析方法。我們通常重構或是關閉部分計分的方式,以便讓我們的系統維護純淨容易瞭解。

以上是Google告訴我們的內容,現在的問題是,Google並沒有說到底關閉了哪一個連結分析的方法。

Google的演算法中,跟link analysis (連結分析) 有關的項目有以下:

(1) Pagerank
(2) Anchor Text 錨點文字
(3) Link location 連結位置
(4) Link repetition 連結重覆
(5) Link reciprocation 交換連結
(6) Link accumulation on page 連結累積
(7) Link changes over time 連結改變
(8) Link age 連結歷時
(9) Context & tags 前後文與標籤
(10) Title 標題
(11) NoFollow & Follow
(12) Numbers of inbound/outbound links
(13) Meta
(14) Image link attributes (ALT...)
(15) Font size & Style

並且就Google的說明中的這一段文字~"We often use characteristics of links to help us figure out the topic of a linked page." 上述的項目跟決定主題有關係的只有~ (2)(9)(10)(13)(15)。

當網頁A連往網頁B,Google會使用存在網頁A連往網頁B的錨點文字、該錨點文字的前後文內容、該錨點文字的前後文中有特殊屬性的文字、網頁A的標題與meta內容來決定網頁B的主題,但是現在Google已經關閉了其中一個評估項目。

你覺得Google最可能會關閉哪個評估項目呢? 存在網頁A連往網頁B的錨點文字? 該錨點文字的前後文內容? 該錨點文字的前後文中有特殊屬性的文字? 網頁A的標題與meta內容? 還是其他項目呢?

目前我們也無法得知,只能後續用更多的實驗來證明了。

引用自《SEO關鍵解碼