[ML-02] 機器學習基礎環境安裝與使用

2020-08-10 01:12:37

一、庫的安裝

整個機器學習基礎階段會用到Matplotlib、Numpy、Pandas等庫,爲了統一版本號在環境中使用,將所有的庫及其版本放到了檔案requirements.txt當中,然後統一安裝

新建一個用於人工智慧環境的虛擬環境

mkvirtualenv ai
matplotlib==2.2.2
numpy==1.14.2
pandas==0.20.3
tables==3.4.2
jupyter==1.0.0

注意:

  • 每個包安裝的過程中,儘量指定穩定版本進行安裝

使用pip命令安裝

pip3 install -r requirements.txt

二、jupyter notebook使用

1 Jupyter Notebook介紹

Jupyter專案是一個非盈利的開源專案,源於2014年的ipython專案,因爲它逐漸發展爲支援跨所有程式語言的互動式數據科學和科學計算

  • Jupyter Notebook,原名IPython Notbook,是IPython的加強網頁版,一個開源Web應用程式
  • 名字源自Julia、Python 和 R(數據科學的三種開源語言)
  • 是一款程式設計師和科學工作者的程式設計/文件/筆記/展示軟體
  • .ipynb檔案格式是用於計算型敘述的JSON文件格式的正式規範

在这里插入图片描述

2 爲什麼使用Jupyter Notebook?

  • 傳統軟件開發:工程/目標明確
    • 需求分析,設計架構,開發模組,測試
  • 數據挖掘:藝術/目標不明確
    • 目的是具體的洞察目標,而不是機械的完成任務
    • 通過執行程式碼來理解問題
    • 迭代式地改進程式碼來改進解決方法

實時執行的程式碼、敘事性的文字和視覺化被整合在一起,方便使用程式碼和數據來講述故事

對比Jupyter Notebook和Pycharm

  • 畫圖

在这里插入图片描述

  • 數據展示

在这里插入图片描述

  • 總結:Jupyter Notebook 相比 Pycharm 在畫圖和數據展示方面更有優勢。

3 Jupyter Notebook的使用-helloworld

3.1 介面啓動、建立檔案

  • 3.1.1 介面啓動

環境搭建好後,本機輸入jupyter notebook命令,會自動彈出瀏覽器視窗開啓Jupyter Notebook

# 進入虛擬環境
workon ai
# 輸入命令
jupyter notebook

本地notebook的預設URL爲:http://localhost:8888

想讓notebook開啓指定目錄,只要進入此目錄後執行命令即可

在这里插入图片描述

  • 3.1.2 新建notebook文件
    • notebook的文件格式是.ipynb

在这里插入图片描述

  • 3.1.3 內容介面操作-helloworld

    **標題列:**點選標題(如Untitled)修改文件名

    編輯列:

在这里插入图片描述

3.2 cell操作

  • 什麼是cell?
    • cell:一對In Out對談被視作一個程式碼單元,稱爲cell
    • cell行號前的 * ,表示程式碼正在執行

Jupyter支援兩種模式:

  • 編輯模式(Enter)
    • 命令模式下回車Enter滑鼠雙擊cell進入編輯模式
    • 可以操作cell內文字或程式碼,剪下/複製/貼上移動等操作
  • 命令模式(Esc)
    • Esc退出編輯,進入命令模式
    • 可以操作cell單元本身進行剪下/複製/貼上/移動等操作
3.2.1 滑鼠操作

在这里插入图片描述

3.2.2 快捷鍵操作
  • 兩種模式通用快捷鍵

    • Shift+Enter,執行本單元程式碼,並跳轉到下一單元
    • Ctrl+Enter,執行本單元程式碼,留在本單元
  • 命令模式:按ESC進入

    • Y,cell切換到Code模式
    • M,cell切換到Markdown模式
    • A,在當前cell的上面新增cell
    • B,在當前cell的下面 下麪新增cell
  • 其他(瞭解)

    • 雙擊D:刪除當前cell
    • Z,回退
    • L,爲當前cell加上行號 <!–
    • Ctrl+Shift+P,對話方塊輸入命令直接執行
    • 快速跳轉到首個cell,Crtl+Home
    • 快速跳轉到最後一個cell,Crtl+End -->
  • 編輯模式:按Enter進入

    • 補全程式碼:變數、方法後跟Tab鍵
    • 爲一行或多行程式碼新增/取消註釋:Ctrl+/(Mac:CMD+/)
  • 其他(瞭解):

    • 多遊標操作:Ctrl鍵點選滑鼠(Mac:CMD+點選滑鼠)
    • 回退:Ctrl+Z(Mac:CMD+Z)
    • 重做:Ctrl+Y(Mac:CMD+Y)

3.3 markdown演示

掌握標題和縮排即可

在这里插入图片描述

一級標題

二級標題

三級標題

四級標題

五級標題
  • 縮排
    • 二級縮排
      • 三級縮排

4 Jupyter Notebook中自動補全程式碼等相關功能拓展【瞭解】

效果展示:

在这里插入图片描述

4.1 安裝jupyter_contrib_nbextensions庫

安裝該庫的命令如下:

python -m pip install jupyter_contrib_nbextensions

然後執行:

jupyter contrib nbextension install --user --skip-running-check

在原來的基礎上勾選: 「Table of Contents」 以及 「Hinterland」

部分功能:

在这里插入图片描述