2010年5月15日 星期六

用Python也能輕鬆玩自然語言處理(1.4)

1.4 回到Python:怎麼做選擇?怎麼控制流程

目前為止,我們已經學會去使用一些簡單的程式來處理語言,記住!我們正在學得是省去人力的自動方式唷!這種方式我們必須要告訴電腦更多的事情來讓他能夠根據我們給的指示去完成任務,如面臨不同狀況時能夠精準地進行決策、根據不同的條件反覆地執行迴圈內的工作等等,這些工作叫做「流程控制」,也是本節的重點!

2010年5月8日 星期六

用Python也能輕鬆玩自然語言處理(1.3)

1.3 開始計算語言吧:簡單的統計

現在我們再把焦點拉回大量文本的計算方法(就像1.1),在開始進行前,希望你對之前兩節談到的一些基本指令與資料結構有所瞭解,而且也可以預測執行了程式後Python直譯器會有什麼反映:

>>> saying = ['After', 'all', 'is', 'said', 'and', 'done',
...           'more', 'is', 'said', 'than', 'done']
>>> tokens = set(saying)
>>> tokens = sorted(tokens)
>>> tokens[-2:]
這行會跑出什麼呢?
>>>

2010年5月4日 星期二

用Python也能輕鬆玩自然語言處理(1.2)

1.2 再離Python近一點吧:文本只是一個文字組成的列表

從上一節的洗禮你應該已經越來越瞭解Python這個程式語言了,不過這部份我們要介紹更多重要的元素!它將會在未來實際執行自然語言處理時扮演關鍵角色。

Lists(列表或串列)

文本到底是什麼?某些程度上,它只是一些字詞與符號排列而成的一頁頁序列;某星程度上,整個文本只是由每個章節組成的序列,每個章節又只是由一些段落所組成的序列...。總之,要用電腦來搞定文本的首要概念就是把它當成:一個由文字與符號組成的玩意兒!一開始我們來先利用文本1(Moby Dick)的開頭來進行測試吧:

2010年5月3日 星期一

用Python也能輕鬆玩自然語言處理(序言+1.1)


Steven Bird, Ewan Klein, and Edward Loper. (2009)Natural Language Processing with Python--- Analyzing Text with the Natural Language Toolkit. O'Reilly Media.

這本書就像是我的課本一樣,超貼心的作者群還把他貢獻在網站上!
我想說既然也要看,乾脆順便翻譯整理一下~
順便讓「自然語言處理」在中文世界多點東西!
不過我也還在學習中啦..對內容有疑義的話請盡量提出來討論!謝謝
我會一小節一小節發表,因為內容實在太豐富了
ps.歐萊禮應該不會來騷擾我才是...XD