要在本教學中成功建立和執行範例程式碼,我們需要一個環境Python開發環境組態,它既包含通用python,也包含資料科學所需的特殊包。 我們首先看一下安裝python 2或python 3的通用python。但本教學更多地使用python 2,主要是因為python 2的成熟度和對外部包的更廣泛的支援。
最新的原始碼,二進位制檔案,文件,新聞等,可在Python官方網站 - https://www.python.org/ 上找到。
也可以從 https://www.python.org/doc/ 下載Python文件。 該文件以HTML,PDF和PostScript格式提供。
Python發行版適用於各種平台。只需下載適用於您的平台的二進位制程式碼並安裝Python。
如果您的平台的二進位制程式碼不可用,則需要C編譯器手動編譯原始碼。編譯原始碼在選擇安裝所需的功能方面提供了更大的靈活性。
有關Python開發環境的安裝和組態,請參考:
NLTK是很容易融入python環境的。 使用以下命令將NLTK新增到Python環境中。
sudo pip install -U nltk
# Windows 系統使用以下命令
pip install -U nltk
當想要將其他庫在python程式中使用時,也可通過類似的方法新增,在後續文章中用到時再做詳細講解。