2012年5月31日 星期四

iAcquire因為違反連結策略,被Google刪除索引


iAcquire因為違反連結策略,被Google刪除索引

我們之前在"甚麼是Google Penguin Update?"說到,其目的是為了處罰愚弄Google的網站,現在iAcquire也因為違反連結策略,被Google刪除索引 ...

在這篇"iAcquire Banned From Google After Link Buying Allegations"已經被證實,並且這篇"iAcquire – Did Google Overreact?"認為Google反應過度。

iAcquire是一家提供link building (建立連結) 服務的公司,現在確實已經無法在Google看到他們的任何索引資料,如下圖:


Google認為iAcquire確實掌控了一個付費的連結網路,但是iAcquire自己說: " Every link we build is based on the very same principles touted throughout the industry. Our links are contextual and relevant through outreach performed by 40 actual in-house people that sit in our Arizona office and everything is pushed through strenuous quality assurance…." 我們的每個連結都是經過該業界詳細的瞭解,都是與本文相關性的,由四十位在我們亞歷桑那辦公室透過詳細的品質評估。

我們不打算討論iAcquire是否違反連結策略,也不打算談iAcquire後面的整個運作架構,我們打算談的是,到底網站沒有去操作連結能否活下去?

我們在"SEO的核心理念:內容為王、架構為后"說到,內容很重要,如果缺少架構為后的概念,你的網站可能只做到一半... 那連結不重要嗎?

有一個問題經常被詢問到: 「有些黑帽的網站都沒有更新的內容,內容也只有一頁,但是他卻具有優秀的搜尋排名,我努力更新內容半天,卻沒有購買連結來得有效果,怎麼辦呢?」

購買連結有沒有效果呢? 當然有效果,在還沒有被抓到以前,確實對於提升搜尋排名有效。

那我們該不該也去購買連結呢? Google是否可以真正的處罰購買連結或是付費連結呢?

是否也要加入購買連結的行列,完全看你的企業策略,如果你認為打帶跑的策略適合你的行業,就算被抓到就趕緊換個基地重新重來,那麼購買連結也許並不是那麼罪惡。

但是如果你的網站不希望中途發生任何問題,而是希望以品質來吸引讀者,那麼你應該透過淡定SEO來思考~ 「著重於Macro SEO」、「分散網站流量」、以及「以使用者為中心」。

Google是否可以真正的處罰購買連結或是付費連結呢? 當然不可能,只要有利可圖,Google要面對的所謂違法連結,絕對無法根治,因為只要是以link analysis為基礎,就一定會有人做假連結,Google不可能跟得上假連結的製造速度。

因此一定會有漏網之魚,靠著人為連結而居於優秀的搜尋排名,面對這種情況,一樣需要淡定SEO。

所以我們說內容為王、架構為后,那麼連結呢? 連結就是屁,放屁有益身體健康,但是如果故意製造出來的屁,就不僅對身體沒有好處,還會有害。

是否要加入購買連結的行列? 實在沒有對錯,完全看你的企業策略吧。

轉載自《SEO關鍵解碼

2012年5月25日 星期五

SEO的核心理念:內容為王、架構為后

SEO的核心理念:內容為王、架構為后

從本網第一次SEO達人養成密集班開課到現在,SEO的整體環境真的變化相當大,也就是說許多當時可行的方法,現在可能有些都已經不太適用,但是有一個SEO的核心理念,一直都沒有改變,那就是~ 內容為王、架構為后 ...

「內容為王、架構為后」也是本網在多年以前的演講以及課程中一直強調的SEO核心理念。
許多認為「SEO無用論」的人,都是只看到「內容為王」的部分,是的~ 內容確實是SEO非常重要的元素,所以我們在網站優化當中,才把「內容優化」列為其中的要素。

但是認為「SEO無用論」的人,卻沒有看到或是想到「架構為后」的部分,也就是網站的架構對於使用者以及對於搜尋引擎的影響。

「內容為王、架構為后」對於網站來說,缺一不可,而且隨著網站越來越大,如果沒有良好的架構,會越來越無法收拾,不但使用者會覺得越來越難用,連搜尋引擎都會無法忠實的處理你的網站資料。

為什麼SEO的環境以及技術一直在改變,但是內容為王、架構為后的SEO核心理念都沒有變呢? 因為搜尋引擎就是依靠內容以及架構才能服務眾多的使用者。

但是雖然內容為王、架構為后的大方向沒有改變,但是其實細節也都在微觀的改變。也就是十年前的內容當然不是現在使用者想看的,十年前的架構也不能適合於現在的搜尋引擎。

內容很重要,應該沒有人會反對,但是所謂「架構為后」是什麼意思呢?

「架構為后」有三大層面,第一個是針對使用者,第二個是針對網站,第三個是針對搜尋引擎。
針對使用者的結構,是指可以讓使用者很方便瀏覽或是可使用性(Usability)的網站結構。
針對網站的結構,是指可以讓網站具有規模可伸縮性(Scalability)的網站結構。
針對搜尋引擎的結構,是指可以讓搜尋引擎可解讀性(Interpretability)的網站結構。

以上的Usability、Scalability、Interpretability就是能夠影響網站的架構為后項目,有些網站可能很方便讀者瀏覽,但是卻沒有規模可伸縮性,因此可能內容越來越多而必須重新設計網站。有些網站可能很方便讀者瀏覽,也具有規模可伸縮性,但是卻無法讓搜尋引擎快速解讀的功能。

所以內容為王是沒有錯誤的,但是如果缺少架構為后的概念,你的網站可以只做到一半。所以抱持SEO無用論的人應該思考Usability、Scalability、Interpretability,也許就不會認為只要內容好,就能夠做好SEO。

轉載自《台灣搜尋引擎優化與行銷研究院

從架構為后談搜尋引擎可解讀性(Interpretability)

從架構為后談搜尋引擎可解讀性(Interpretability)

搜尋引擎可解讀性(Interpretability)是什麼意思? 我們在"SEO的核心理念: 內容為王、架構為后"談到三個架構項目,可使用性(Usability)規模可伸縮性(Scalability)都還蠻好理解的,但是搜尋引擎可解讀性(Interpretability)可能必須再詳加解說 ...


假設你出席一個演講場合,結果演講者全程使用日文,對於不懂日文的人來說,絕對是鴨子聽雷一樣,不知所云。

假設你出席一個演講場合,演講者雖然使用中文,但是卻有很重的口音,對於懂中文的人來說,雖然大略還是聽得懂意思,但是一定有部分內容會無法理解而忽略過去。

所以演講者要讓聽眾聽得懂演講的內容,當然要使用聽眾能夠瞭解的語言,並且必須很清楚的表達出來,其間不能有含混不清的地方。前者牽涉到技術性的,後者則牽涉到語文的呈現。

上面的例子跟搜尋引擎可解讀性(Interpretability)有什麼關係呢?

在網站與搜尋引擎的關係中,你的網站就是演講者,而搜尋引擎就是聽眾。

你的網站必須講搜尋引擎聽得懂的語言,也就是技術性相關,網頁的標準表示法,你的網站如果使用的表示法是搜尋引擎不懂的,那麼就無法讓搜尋引擎瞭解。例如你使用了javascript,是搜尋引擎不能或是不願意去解析的,那麼某些內容就會被丟棄。

如果別人的網站使用了semantic tag,但是你卻沒有使用,那麼搜尋引擎就會更瞭解別人的網站,而沒有辦法順利的處理你的網站資料。

所以要讓你的網站具有搜尋引擎可解讀性(Interpretability),第一件事就是要使用搜尋引擎可以瞭解的標準表示法,並且正確的使用。

而另外一種情況是牽涉到語文的呈現,對網站而言就比較困難。因為你必須瞭解搜尋引擎是如何儲存你的網站資料。

這篇"專訪 Google 台灣總經理簡立峰,談網路搜尋難題",提到一個事情,Google 台灣區總經理簡立峰說到一個小技巧:只要搜尋「的」這個字就可以知道有多少中文資料了,因為絕大多數的中文網站都會用到這個字。

其實Google 台灣區總經理簡立峰,應該只是為了要說給不太懂的人可以很快的瞭解,所以才用這個簡化的說法,因為簡立峰就是CKIP (Chinese Knowledge and Information Processing) 的專家。

在Google搜尋「的」這個字,所得到的資料筆數應該比實際上的資料筆數少很多,你也應該可以發現許多應該存在你的網站的字,透過Google是無法搜尋得到的,因為不一定都會被儲存為索引,許多詞組是被丟棄的。

Google如何決定哪些字詞應該被索引呢?

例如我們來看這個句子~ 「從架構為后談搜尋引擎可解讀性」,經過CKIP的分詞可得到其中一種剖析樹圖示如下:

所以被分詞為: [從] [架構為] [后談] [搜尋] [引擎] [可] [解讀] [性] 共8個。

如果都只取單一個詞組的話,[為后] 就搜尋不到了。

如果還取兩個詞組的話,就多出了[從架構為]、[架構為后談]、[后談搜尋][搜尋引擎][引擎可][可解讀][解讀性],就可以搜尋到更多的結果了。如果還取三個或是以上的詞組的話,那就有更多的組合了。

當然Google不是使用CKIP,還有加強很多規則進去,但是絕對沒有不出錯的分詞系統,而不管再怎麼強的搜尋引擎,都不可能把你的網站進行全文索引,除非你的網站重要到不行,因此你的網站的語文呈現,要怎樣才不會讓搜尋引擎把重要的詞組丟棄,就是必須要考慮的問題。

所以要讓你的網站具有搜尋引擎可解讀性(Interpretability),第二件事就是要瞭解搜尋引擎的索引規則,並且盡可能完整的呈現網站內容。

轉載自《SEO關鍵解碼

2012年5月23日 星期三

Google knowledge graph (知識結構圖) 是什麼?


Google knowledge graph (知識結構圖) 是什麼?

Knowledge Graph (知識結構圖)是Google推出的新功能,根據Google在"Introducing the Knowledge Graph"的說法,為了讓使用者瞭解真實的世界以及其間的關係,所以有了這個知識結構圖 ... Knowledge Graph也有人翻譯成~ 「知識圖譜」或是「知識圖表」。

但是還是覺得「知識結構圖」或是「知識關係圖」比較能夠表示這裡Graph的真正意含。

因為「圖譜」已經在許多領域有既定的用法,指的是有系統性分類的圖集,而「圖表」則跟graph意義差更遠。

graph的意義是指: A graph in this context is a collection of "vertices" or "nodes" and a collection of edges that connect pairs of vertices. A graph may be undirected, meaning that there is no distinction between the two vertices associated with each edge, or its edges may be directed from one vertex to another ... 意思就是由「節點」與連接節點的「邊」所組成,具有方向性或是沒有方向性的結構,稱之為graph。

「節點」就是vertices或是nodes,「邊」就是edges。 例如下圖就是一個沒有方向性的graph:

下圖就是一個具有方向性的graph:

為什麼Google要把knowledge跟graph加在一起? 知識具有graph的什麼特性呢?

知識(knowledge)是由訊息(information)而來的,訊息就好像是「節點」,而訊息跟訊息之間的「邊」就是關係,這個關係可能有方向性,也可能沒有方向性。透過「邊」的連接,就讓「節點」與「節點」產生了某些關係。

例如,我們來看看下面的影片介紹

上面的說明中,提到一個例子,我們想知道諾貝爾獎有多少女性得主?

我們就可以從「諾貝爾獎」這個節點出發,找到關係為「得獎者」的節點,並且這個「得獎者」的節點必須是具有「女性」屬性。

而這些資料其實原本就在Google的資料中心,只是沒有解構出「節點」、「邊」、與「屬性」,現在Google推出knowledge graph,表示已經完成了一部分的graph關係,並且可以解析使用者的query (查詢),瞭解使用者到底想問什麼。

例如你搜尋~ tallest building in the world (世界最高的建築),你就可以看到如下的內容,左邊是一般的搜尋結果,右邊是特別整理出來的knowledge panel (知識面板),這個右邊的面板並不是所有的問題查詢都會出現。

但是如果你想查詢~ greatest president in the world (世界最偉大的總統),對不起 ... Google也不知道。

其實這些東西,很早WolframAlpha就已經提供了。

如下圖,如果你一樣搜尋tallest building in the world ... WolframAlpha直接給你答案。

但是如果你問wolframalpha ~ greatest president in the world (世界最偉大的總統),他會告訴你不合邏輯,因為總統是以國家為單位,沒有一個人是世界的總統 ... 哈,還蠻有道理的。

如果你問~ greatest president of United States (美國最偉大的總統),他會避重就輕,只回答你 美國的總統,因為他不知道誰是美國最偉大的總統。

所以許多訊息談到Google knowledge graph,都把這個東西說得太出神入化了,其實Google在這個時間點推出來,有點在提醒大家不要只是一直注意Facebook IPO的味道。

Google在"Introducing the Knowledge Graph: things, not strings"說到,一個完美的搜尋引擎是要真正瞭解你要什麼,並且給你真正想要的東西。意思就是我們Google是一個完美的搜尋引擎,不要只注意Facebook。

但是Google也還算誠實,他也說到"And we can now sometimes help answer your next question before you’ve asked it, because the facts we show are informed by what other people have searched for." 我們『有時候』能夠在你還沒有提問之前,就知道你想問什麼,因為我們呈現給你的事實是其他人已經搜尋過的。

所以,Google能提供的是已經大家經常詢問的問題,或是已經有人整理過的,Google並沒有那麼厲害自己去推理出來各物件的關係,也許以後可能,但是現在只能做到一小部分。

這篇"Google Launches Knowledge Graph To Provide Answers, Not Just Links"也說到,Google knowledge graph是一個big change (大的改變) 沒有錯,但是還不至於讓使用者有振奮的感覺。

Google目前已經對於五億個物件(object)整理出來35億個事實(fact),並且大多屬於下列的類型: 演員、導演、電影、藝術品或是博物館、城市或是國家、島嶼、湖泊、燈塔、音樂專輯或是音樂團體、星球或是太空航空器、雲霄飛車或是摩天大樓、 運動團體 ... 等等,也就是目前Google knowledge graph並不是所以問題都能夠回答。 其實Google knowledge graph的技術,我們在"搜尋引擎的語意趨勢,你準備好了嗎?"就談過了,他就是透過Semantic Web而產生的結果。

還有一個同樣的老問題,為什麼只有英文的內容才有呢? 除了因為中文的複雜度比較高之外,沒有足夠的可結構性資料來產生適當的物件(object)與事實(fact)也是一個問題,還是一個更重要的問題是~ Google是美國的公司。所以,要等到有中文內容的Google knowledge graph,大概還有得等了。

轉載自《SEO關鍵解碼

2012年5月17日 星期四

Trust Flow & Citation Flow 是什麼?


Trust Flow & Citation Flow 是什麼?

最近Majestic SEO推出了新的網站連結評估因素,稱之為Trust Flow與Citation Flow,用來說明網站連結的品質,這兩個到底是什麼東西呢?

這篇"Majestic SEO Announces New Link Metrics: Trust Flow & Citation Flow"說,這兩個指標是用來說明網站的backlink flow,個別的意思如下:

Citation Flow (引用來源) : 是一個基於連結的網站來源,用來預測網址具有多少影響力的數據。

Trust Flow (信任來源) : 是一個基於連結的網站信任來源,用來預測網址具有多少可信度的數據。

所以這兩個數據最好是不要差異太大,如果Citation Flow (引用來源)過度高於Trust Flow (信任來源) ,表示該網址只是叫座但是不叫好,好像票房不錯,但是得不了電影獎項,但是如果Trust Flow (信任來源)過度高於Citation Flow (引用來源),表示可以得獎,該網址只是叫好但是不叫座,也就是票房冷淡。

所以兩者不相上下比較正常,當然越高越好,以0~100分計算。

如下圖:



所以要怎麼樣才會具有高的Trust Flow 以及 Citation Flow呢?

當然就是要被許多網站 (最好具備多個root domain)連結,並且這些root domain是可以信任的來源。

這個Trust Flow 以及 Citation Flow其實就是網頁信賴度與熱門度的具體表現,但是這些數據如果是透過人為的製造,其實很容易被抓出來的。

轉載自《SEO關鍵解碼

2012年5月11日 星期五

什麼是Negative SEO? 網站應該如果預防?


什麼是Negative SEO? 網站應該如果預防?

許多網站操作SEO都希望可以對於網站產生正面效果,也就是使用Positive SEO (正面SEO)的方式,但是你認為的Positive SEO卻很可能會變成Negative SEO (負面SEO),為什麼呢? 我們應該如何避免呢?

這篇"Negative SEO What it Is & How to Protect Yourself"提到了一個非常重要的概念,但是跟我們這篇"Google是否會區分Paid Link與Sponsor Link?"講的又有些類似~ 「Google說對於大網站或是小網站都一視同仁,只要發現一律都會處罰,但是因為處罰大站可能對於搜尋排名不會有太明顯的影響,所以外界會認為對於大的網站過於寬容。但是其實根據觀察,Google對於大流量並且知名的網站,通常看不太到處罰的效果。」

文章中並說到,大網站可以容許的負面SEO就如同一個大的杯子一樣,越大的網站就有越大的負面SEO容許值,同樣的,越大的網站也越具有正面SEO的磁吸效應,所以對於小網站而言,這是非常不利的情況。

對於小網站或是新網站來說,就很容易陷入~內容空洞、過多的頁內SEO、人為作出來的連結 ... 等等情況。

所以大網站就如同大的戰艦或是航空母艦一樣,可以承受較大的風浪,而小的網站就好像小艇一般,如果沒有注意就很容易滅頂。

但是,是否較大的網站的搜尋排名就會容易比較有優秀的表現呢?

其實也不是的,上面的意思只是針對spam的影響,而較大的網站必須要在良好的架構下,才會越來越容易具有優秀的搜尋排名,如果架構不好的話,就未必能夠有大網站的好處。

所以對於小網站而言,如果競爭對手針對Negative SEO來攻擊你的網站,就很可能會有很大的影響了,因此小網站必須有預防的方案才能夠保障搜尋排名。

以下就是建議的方向:

(1) 定期監看各類SEO指標,例如: backlink profile、搜尋排名、流量、Pagerank ... 等等。這些指標如果有任何異常現象,必須儘早進行瞭解,例如backlink急速增加或是減少、搜尋排名消失、流量驟降、Pagerank下滑,都可能是受到Negative SEO的影響。

(2) 分散流量的風險,也就是必須更積極的引進社交流量。至於如何引進社交流量,這個實在沒有捷徑,只有花錢或是花時間經營,並且及早經營更可以節省日後更大的花費。

(3) 隨時注意Google抓取網站的頻率。網站的抓取頻率代表了Google對網站的重視程度,如果突然降低了回訪率,是一件非常可怕的事情。

(4) 針對Google品質指南進行逐步品質改善。當然每個小網站都可能或多或少有違反Google品質指南規定的項目,但是必須逐步進行改善。

(5) 穩定的增加網站內容。小網站因為內容較少,所以穩定的增加網站內容,反而比大網站更容易看出差異。

(6) 連結建立必須使用更廣泛而相關的關鍵字當錨點文字。所謂廣泛而相關的關鍵字,就是指不要只鎖定主要關鍵字,必須同時考慮次要關鍵字以及相關的關鍵字。

(7) 使用搜尋引擎支援的語意標籤,並且注意健全網站架構

轉載自《SEO關鍵解碼

2012年5月3日 星期四

什麼才是自然連結 (Natural links)?


什麼才是自然連結 (Natural links)?

自從JCPenney以及BuildMyRank事件之後,許多網站開始一陣恐慌,再加上之前Google Panda UpdateOver Optimization Penalty,以及近期的Google Penguin Update,大家可能已經不知道該怎麼進行連結策略了 ...

因為好像所有的連結都可能被判斷成作弊的連結 ... 不可以在側邊欄加上連結、不可以在頁尾加上一串連結、不可以在重覆的板面上加上連結、不可以有付費連結、不可以交換連結、不可以使用剛好符合關鍵字的錨點文字、錨點文字不可以過度重覆,一大堆的不可以,那麼到底啥才是可以的呢?

仔細想起來,真的好像任何連結都不能做了。那麼,到底什麼才是自然連結 (Natural links)呢?

我們看看下圖的連結圖 (link graph),左邊是自然連結,右邊是作弊連結。這個圖是來自於~ Smx March 2010 Bing Realtime Social


左邊跟右邊的圖有什麼差別? 左邊的連結是細密但是每個來源都不會太多,右邊的連結是稀鬆而集中,也就是來源不多,但是每個來源的連結卻不少。

如果你從Open Site Explorer來看,就可以大概知道網站的連結是集中還是分散的。
如下圖,搜尋引擎不只看連結總數量,還需要看連結來源的root domain數據等等。


再如下圖,底下網頁B的連結數據最多只能算四個,並且如果被判斷為非自然連結,可能全部都不計算,還可能遭受處罰。

所以,什麼才是自然連結? 其實問題不在於連結來自於側邊欄、重覆的樣板、或是網頁頁尾 ... 而是以比例來看,如果你的連結狀態是~ 稀鬆而集中,僅來自於少數沒有太大變化的網域的話,就算你的連結總數非常龐大,也是沒有太大作用的。

轉載自《SEO關鍵解碼