2009年7月24日 星期五

[Blog Mining]部落格探勘架構(下)

探勘架構(The Framework)續

l 部落格內容(Blog content analyzer)與網路分析器(Blog network analyzer)

誠如上述,我們可以運用文字探勘(Text Mining)的技術(自動分類與分群)來擷取與部落格中的關鍵詞彙,如可以根據其內容與意見判斷部落客的對某些事物的偏好(正向或負向)。如果以正向的詞彙為例,部落格分析器會聚集這些正面價值的詞彙,如好、棒、開心等。並進一步構成一個文件的向量值(Document vector),其包括每個詞的出現頻率(term frequencies)、各詞彙的權重(entry’s weight)。這樣一來部落格分析器就可以根據這些向量值去將部落格進行「有意義」的分類或分群。

2009年7月16日 星期四

[Blog Mining]部落格探勘架構(上)

blog mining framework

圖的來源同書目資料!
這算是這系列的第一篇!基本上就是詳細的翻譯與摘要XD
因為我也不是專業,只是邊看邊學,所以有錯請多指證!
因為寶煖老師有說過網路上的文章不能太長,所以我會稍微拖稿一下XDD
大概都分兩三集來分吧(上、下或上中下)