2013年5月3日 星期五

使用Liquid Helium技術的搜尋引擎Samuru.com


使用Liquid Helium技術的搜尋引擎Samuru.com

又出現了一個特別的搜尋引擎Samuru.com,據說它並不使用連結來判斷網站的重要性,而是使用一種稱為Liquid Helium的技術。我們來看看究竟,到底這個搜尋引擎跟其他的搜尋引擎有什麼不同吧 ...

如下是在Samuru進行搜尋的畫面:


Liquid Helium原本的意思是液態氦,但是這裡談到的跟原意完全沒有關係。

Liquid Helium使用在網站上,並不是新的話題,Forbes在去年的這篇"Is This The Future Of Search?"就談過這個技術,他說這個Liquid Helium遠超過Google使用的技術,因為Google雖然索引了億萬的網頁,但是卻不懂這些網頁的意思,而Liquid Helium則是完全瞭解。

如果真的如Forbes所說的,Samuru不是已經提前完成了Google的願望了嗎?

我們透過StremorLiquid Helium資料來看看: It converts written content into mathematical values and algorithms for predictable analysis, extraction, and manipulation. 它轉換書寫的內容變成數學的數值與演算法,來進行可以預測的分析萃取以及處理。

所以透過Liquid Helium技術,他們產生了幾個用途,包括搜尋、總結、撰寫、資料萃取。搜尋的應用就是Samuru.com,總結的應用就是TLDR (Too Long; Didn’t Read),撰寫的應用就是Create toolset,資料萃取的應用就是Stremor Enterprise Suite

例如我們透過TLDR,把Forbes的內容,兩千兩百個英文字,縮短總結成為以下的三百多字的內容:

Currently, Stremor has focused Liquid Helium on helping users find relevant political content – but this Engine could eventually change the way we approach search entirely, providing relevant results for any and all topics. Though Stremor’s Unpartial is just about politics, its revolutionary approach to content analysis with Liquid Helium may soon just be the future of search.

還真的確實把該文章的內容總結抓出來了。但是我們再透過TLDR來抓出幾篇中文內容,就有時候有些脫線的行為。

Liquid Helium的技術其實也沒有跳脫其他搜尋引擎太多,其中有幾個比較特別的是:

(1) 所得到的搜尋結果會以群組排序的方式,而不是只以排序的方式。讓使用者更容易找到需要的資料。

(2) 目前網站眾多情況下,以連結熱門度已經無法代表網站的重要性,以authority(權威度)才能夠表示網站的真正價值

(3) 重要的是concept而不是keyword,這個概念下不能再以少數的meta來瞭解網頁,而必須以全文方式來進行。

(4) 網頁越來越多的情況下,應該以page的評估而非domain方式,也就是說重要的站台下,並非所有頁面都是重要的。

所以Samuru的出現,雖然未必對於搜尋市場會有多大的改變,但是其所使用的技術與概念,一定會開始影響其他搜尋引擎。背後代表的是,我們以前所說的道理,會慢慢的在各種搜尋引擎中反應出來。

節錄自《台灣搜尋引擎優化與行銷研究院》

沒有留言:

張貼留言