十分鐘可以跟著Docker學分層複用思想

2022-01-19 19:00:54
本篇文章給大家帶來了關於docker中映象分層、容器分層和容器在磁碟佔用空間的相關問題,希望對大家有幫助。

Docker是如何組織儲存的

dokcer在組織儲存內容時很巧妙的應用了分層複用的思想。所以我們可以以此為案例學習一下該思想。

1.映象分層

一個Docker映象在構建的過程中分了很多層,每一層都是唯讀的。結合下面例子進行說明:

# syntax=docker/dockerfile:1
FROM ubuntu:18.04
LABEL org.opencontainers.image.authors="[email protected]"
COPY . /app
RUN make /app
RUN rm -r $HOME/.cache
CMD python /app/app.py

這個Dockerfile中會有4條指令改變了檔案系統並建立了新層。

  • FROM指令從ubuntu:18.04的映象中建立了基礎層。
  • LABEL指令僅僅修改了映象的後設資料,不會建立新層。
  • COPY指令將執行本次構建的當前目錄中的內容新增到映象當中,會建立一個新層記錄改變。
  • 第一個RUN指令,構建了程式並將結果輸出到映象中,會建立一個新層記錄改變。
  • 第二個RUN指令,刪除了快取目錄,會建立一個新層記錄改變。
  • CMD指令定義了容器中執行的指令,只是修改了映象的後設資料,並不會建立新層。

這裡每層都只記錄與其上一層的不同。當我們建立一個容器的時候,這是就會建立一層可寫層,也叫容器層。對於正在執行中的容器的內容的變化都會記錄在該層中。下圖描述了該關係:

2.容器分層

容器和映象的不同主要是最頂層的可寫層的不同,所有對於容器的寫操作都會記錄在這層中,如果容器被刪除,那麼這個可寫層也會被刪除,但是映象會被保留。

注意:如果想要多個容器共用相同的資料,可以通過Docker Volumes實現。

每個容器都有其自己的可寫層,所有的變換都會被存放在其中,所以多個容器可共用同一個映象。下圖描述了該關係:

注意 :此處還有個細節,多個映象可能共用相同的層,比如兩個映象中有相同的層,那麼在構建或是拉取的時候發現本地以存在,則不會再次構建或拉取。所以計算映象大小的時候,不能僅通過 docker images命令顯示出的大小來彙總求和,該值有可能大於實際值。

3.容器在磁碟佔用的空間

可以通過 docker ps -s命令,來看正在執行中的容器佔用的空間(部分值)。兩個列的不同代表的內容:

  • size: 容器的可寫層佔用的磁碟大小
  • virtual size: 包含了容器可寫層和唯讀映象的大小。

容器佔用磁碟空間的其它途徑:

  • 容器產生的紀錄檔檔案。
  • 使用Volume和bind mounts掛載的內容。
  • 容器的組態檔
  • 記憶體中的內容(如果開啟了swapping)
  • Checkpoints(如果使用了該功能)

4.Copy-on-Write(CoW)策略

Docker中的儲存驅動都是採用該策略。

CoW策略能夠最大效率的共用和複製檔案。如果一個檔案在映象的更低層存在,那麼其上層(包括可寫層)需要讀取該內容則可以直接使用該檔案。當需要對其進行修改時,會複製該檔案到該層並進行修改。這最大限度的減少了IO和每個後續層的大小。

4.1共用使映象更小

當我們使用 docker pull拉取映象或是使用一個本地沒有的映象建立容器的時候,該映象會被分層的儲存到本地Dockers儲存區域中。在linux中通常是 /var/lib/docker

我們可以去 /var/lib/docker/<storage-driver>目錄下看我們已拉取各層映象。比如使用 overlay2儲存驅動。

這麼多層,我們可以通過 docker image inspect來檢視某個映象包含哪些層

docker image inspect --format "{{json .RootFS.Layers}}" redis

docker image inspect --format "{{json .RootFS.Layers}}" mysql:5.7

在這裡插入圖片描述

通過上面檢視我們可以看到redis和mysql5.7運用了同一層,這樣共用相同層就大大節省了儲存映象的空間,同時也提升了拉取映象的速度 。

我們可以通過 docker image history命令來檢視映象分層情況,以redis為例

docker history redis

注意 :

  • 有些步驟的大小為0,是因為他們只改變了後設資料,並不會產生新層,也不會佔用額外的空間(除後設資料本身)。所以上述redis映象中包含了5層。

  • <missing>步驟,這些步驟可能是以下情況中的一種

    • 在另一個系統上構建的
    • 從Docker Hub中提取的
    • 使用BuildKit作為構建器構建的。

4.2複製讓容器更有效率

當我們啟動一個容器的時候,會新增一個可寫層在映象之上,用於儲存所有的變化。當對已有檔案進行修改的時候採用CoW策略。首先會到各層尋找到該檔案,然後複製該檔案到可寫層,然後進行修改並儲存。

這麼做能夠讓我們最大限度地減少I/O操作。

但是,很明顯的是當一個容器中的應用需要進行頻繁的寫操作,那麼會造成可寫層越來越龐大,此時我們可以通過Volume來幫助我們分擔壓力。

容器的後設資料和紀錄檔是單獨存放的,一般是存放在 /var/lib/docker/containers中,我們可以使用 du -sh /var/lib/docker/containers/*來檢視各個容器佔用多少。(容器ID其實就是資料夾名稱的前12位元)。

推薦學習:《》

以上就是十分鐘可以跟著Docker學分層複用思想的詳細內容,更多請關注TW511.COM其它相關文章!