在沒有電腦及網路的時代,人類處理資訊所遭遇到的最大問題之一是資訊不足。隨著具有快速計算能力的電腦、以及能夠連接每部電腦的網路問世之後,一方面資訊量大大的增加,另一方面,處理資訊的速度也高度的提升。

因此,從前人類的資訊問題是患寡,但是隨著資訊科技的發展,資訊問題慢慢的轉化成為患不準。

網路搜尋引擎的崛起
舉例來說,當WWW開始流行之後,透過瀏覽器來瀏覽網頁上的多媒體內容所提供的便利性,受到人們的歡迎,因此,不論是一般的個人或是企業組織,都開始利用製作網頁的方式來提供各種內容,於是,網頁上的資訊開始大幅的成長,甚至呈現爆炸的態勢。於是,原先初始是內容不足的情況,突然在很短的時間內,因為人們開始大量製作內容,反而演變成為內容多到人們不知道如何在網路上找到自己所需要的。

所以,你看到了在歷史上的發展趨勢,接下來人們努力的建立搜尋引擎,為的就是從茫茫大海般、散落在全世界各地伺服器上的網頁,找到自己所需的內容及資訊。各家搜尋引擎間的大戰,也緊接在WWW揭開序幕之後。

從搜尋引擎對網路化後的人們的重要性,就能夠明白,當資訊的問題不再是不足,而是超量之後,如何從大量資訊中,找到符合人們需求的資訊,就成了一個極為關鍵的議題。

眾所皆知,Google從搜尋引擎的大戰中獲得最後的勝利,脫穎而出,成了廣受人們倚賴的搜尋引擎。以精準、能快速協助使用者找到所需網頁資訊的搜尋引擎為基礎,Google逐步建立起它的網路帝國。這同時也印證了在這個時代,誰能幫助人們從龐雜的資訊中,精準過濾出有價值的部份,誰就能從中獲得成功的機會。

隨著網路的發達,資訊交換、擴散、複製的速度遠遠超過以前的任何一個世代。不過,存在資訊爆炸問題的不僅僅是網頁,許許多多的資訊都有類似的問題,都需要透過資訊技術來協助人們處理,以便精準找出人們真正需要資訊。

搜尋引擎是人們解決資訊爆炸問題的一個方式,某種程度上來說,精準的搜尋引擎很有效果。不過,它有一個先天的局限,就是基於搜尋引擎的操作模式下,使用者必須提供一組查詢的條件,例如搜尋的關鍵字、網頁的更新日期、網頁所使用的語言、等等。也就是說,使用者必須對要查詢的事物有基本的認知,並且懂得、甚至是擅長將此一認知轉換成為搜尋條件。

在這種情況下,能否精準取得所需資訊,除了受到搜尋引擎是否足夠好的限制之外,也受到使用者本身對待查資訊的認知,以及搜尋技巧所影響。正因為有上述的諸般限制,人們會需要在搜尋引擎之外的其他工具,來和搜尋引擎一起搭配、解決問題。搜尋引擎並不是不好用,而是對於某些特定的應用,它還是有其局限之處,此時,就需要搭配其他的工具一起運用了。

推薦系統的出現,補足搜尋機制的不足

舉例來說,一個線上購物的商店,由於是網路化的模式,所以,基本上可以陳列幾乎無限多的商品供消費者挑選,因為傳統櫃位的成本在網路商店的模式下,幾乎降到了很接近零的水準。一個在線上商店中的商品,或許只會佔掉幾百KB的磁碟空間而已。當然,這麼一來,很多型態的商店,其陳列的商品就會往盡可能多的方向發展,最終就會來到商品資訊爆炸的情況。消費者光靠線上的分類型錄想要找到自己想買的商品,可能就要大費力氣。所以,可以想見的,線上商店接著必然要提供搜尋的功能,例如最常看到的就是利用商品的文字描述來做為搜尋的條件,來幫助使用者找到所需的商品,而這對消費者找到所需的商品,也的確能夠提供極大的助益。

就在線上商店的電子商務開始蓬勃的發展之際,有一個被稱為「長尾理論」的概念被提出來。「長尾理論」的提出者Chris Anderson指出,長尾是一種機率的分布方式,如果將這種分布的方式繪製成圖,就會像是一條拖得長長的尾巴,故以長尾予以命名。

這種長尾的分布的方式,在很多應用中都可以看到,而Chris Anderson在他所著的《長尾理論》一書中最關心的長尾分布,便是在線上商店商品的「銷售排名」及「商品銷售量」的分布關係。

在繪製「銷售排名」及「商品銷售量」的分布關係時,X軸是依據銷售量排名後的商品別,而Y軸則是該商品對應的銷售量。在過去,人們在處理銷售議題時喜歡依照所謂的80/20法則來進行。這是因為過去人們相信,銷售時80%的收益會來自於20%的商品,而這20%的商品,也就是所謂的暢銷商品。在這個思維底下,既然大部分的收益會來自於少部分的商品,那麼自然要將比較稀少因而重要的銷售資源,例如陳列的架位,花在這樣的商品上。

但是線上商品將陳列架位的成本降到極低的情況下,使得這種局面有所不同。

商店不需要因為實體架位的限制,而僅能將銷售資源投注在能暢銷的商品之上,相反的,不論商品暢銷或不暢銷,都可以盡可能將它們提供給消費者做為選擇。

而長尾理論的重點,便是在於告訴我們,即使有很多的商品都無法造成暢銷,但是,只要有人願意購買,那麼即使是極少數的銷售量,也會因為此類的商品數目繁多,而形成了一個長尾,其總和也就是總銷售金額,還是會十分可觀。為什麼冷門商品還是會有人願意掏錢出來購買,這是因為人的喜好其實是很多樣化的。暢銷商品反映出來的是大眾的偏好,但是它同時也將個人的偏好給平均、給稀釋。那麼,個人的偏好會反映在何處呢?有很大的比例就會在長尾上。

不過,另一方面,也因為商品數量繁多,對於消費者來說,如何在茫茫的商品大海中找到所需、或有意願購買的商品,其難度也就比僅有有限架位的實體商店來得困難許多。因此,在長尾理論中認為,需要有一個「過濾器(filter)」的工具。

漫長的長尾就像是一大堆的沙子,裡頭雖然也藏有對消費者而言有價值的黃金(而每個消費者的?金都不同),但雜質更多,因此,必須倚靠這個過濾器來將黃金自沙中濾出。

就像線上商店的搜尋引擎一樣,即使有龐大數量的商品可供消費者選擇,但是透過搜尋引擎所提供的搜尋功能,消費者很快的就能確認商品中有沒有自己需要的商品,並且進一步完成購買的行為。因此,我們可以說搜尋引擎就是個有用的「過濾器」。

然而,正如前段文字中所提到的,搜尋引擎本身有其能力的局限。對於線上商品來說,除了搜尋引擎之外,還需要發展其他的「過濾器」,來協助消費者發掘出那位在長尾之中符合消費者個人偏好的商品。

尤其是當消費者根本不自覺自己有那樣的需要時,搜尋引擎是沒有辦法幫助消費者找出這類的商品的,因為它倚靠消費者主動輸入的查詢條件來運作。這個時候,就是所謂「推薦系統(Recommendation System)」能派上用場的時候。

在這一回中,我們對推薦系統的需求起源做了一個概略式的介紹,而在下一回,我們就要開始探討和推薦系統有關的各項議題。

正如在線上商店的例子中所看到的,此一資訊科技將會提供極大的益處。

 

專欄作者


熱門新聞

Advertisement