2012年5月16日

Social Tagging - Personalized Tagging Recommendation System


網站像是Delicious, BibSonomy, Flickr提供讓使用者加入tag的功能,或是稱為大眾分類法(folksonomy),這是一個利用crowd-wisdom的典型,這種social tagging主要目的通常不是增加網站內容的豐富程度,而是讓使用者可以更好的使用網站資源,比如tag search, related resources (recommendation)

這個功能遇到的問題是,這些得到的tag的量和質往往和經營者的預期大相逕庭,而且這些tag往往有重複(redundant)如海賊王和航海王或是某些語言的單複數,或語意不清(ambiguous, polysemy)如apple,太個性化用字如awesome,打錯字也是個問題。



我們先想想,如何得到這些tag呢?

1.專家提供: 精確、量少、昂貴

2.遊戲提供: 藉由比賽活動來讓群眾提供,得到最多選擇重複的tag者獲勝,這個方法很棒,有一些被惡意操作的風險

3.內容搜尋(content-based): 藉由搜尋先關內容,再萃取重要字詞當作tag,便宜但是不精確

4.social tagging就是一般的大眾分類,缺點如上述,加上cold start也是一個問題



如果我們能夠提供使用者一些他們可能會用到的tag呢?

我們讓使用者先看到他很可能會需要的tag,讓他用選的,減少使用者輸入是否有幫助減少字詞重複、語意不清和打錯字問題並且增加使用者參與程度。

我們重新定義這個問題,給定一個使用者和一個資源(文章、圖片等需要被tag的東西),我們如何推薦相關的標籤清單(tag list)?

這些是目前的研究主要的幾個可能的方法

1. Collaborative Filtering(不太適用,在social tagging裡是一個三方問題)

2. Ranking based on Tensor Factorization(accurate, scalable)

3. FolkRank(accurate, multi-mode recommendation, online update)

4.Content-based, Image-based, Audio-based

任何一種方法都不是一兩天的功夫,並且蘊含許多種變化,如RTF已經有TD、CD型和PITF型等。


"I don’t use the word 'folksonomy'. Tagging in delicious is about 1/3 classification and 2/3 functionality. Something easy to do that let's you recall the item. The goal isn't to classify, it’s to remember." - Joshua Schachter