在本篇部落格中,我們將全面、深入地探討Python中的檔案操作。檔案操作在Python程式設計中是不可或缺的一部分,它包含了開啟、讀取、寫入和關閉檔案等各種操作。我們將從基礎的檔案操作講解到高階的檔案處理技巧,以及如何優雅地使用Python進行檔案操作。每一部分我們都會分享一些獨特的用法,並且附有具體的範例程式碼和輸出結果。在文章的最後,我們還將分享一些鮮為人知但非常實用的檔案操作技巧。
Python使用內建的open()
函數來開啟一個檔案,它返回一個檔案物件,常用的模式如下:'r'表示讀取,'w'表示寫入(會先清空原有檔案),'a'表示追加,'b'表示二進位制模式。特別的,我們可以使用with
關鍵字,這樣當我們完成操作後,檔案將自動關閉。
# 以讀取模式開啟一個檔案
with open('file.txt', 'r') as file:
content = file.read()
print(content)
當你執行這段程式碼,假設file.txt
的內容是Hello, Python!
,你會看到以下輸出:
Hello, Python!
除了一次性讀取整個檔案,我們還可以以更小的單位來讀取檔案。這對於處理大檔案時非常有用,可以有效控制記憶體的使用。
with open('file.txt', 'r') as file:
while True:
line = file.readline()
if not line:
break
print(line, end='')
這段程式碼會逐行讀取file.txt
檔案的內容並列印。其中,end=''
是為了防止print
函數在每次列印後都插入一個換行符,因為從檔案中讀取的每一行都已經帶有一個換行符。
我們使用寫入模式('w')或追加模式('a')來寫入檔案。這裡有一個小技巧:如果你的程式需要頻繁寫入檔案,那麼在寫入時使用\n
來換行會比使用write()
函數後再使用write('\n')
函數來插入新行更有效率。
with open('file.txt', 'a') as file:
file.write('Hello, Python!\n')
這段程式碼會在file.txt
檔案的末尾追加一行Hello, Python!
。
os
和shutil
模組Python的os
模組和shutil
模組為我們提供了更高階的檔案操作功能,如重新命名檔案、刪除檔案、建立
目錄、複製檔案等。
import os
import shutil
# 建立一個新的目錄
os.mkdir('new_folder')
# 重新命名檔案
os.rename('old.txt', 'new.txt')
# 複製檔案
shutil.copy2('src.txt', 'dst.txt')
# 刪除檔案
os.remove('file_to_delete.txt')
執行這段程式碼會按順序執行上述檔案操作。
在處理檔案時,我們可能會遇到各種不同的編碼格式,如UTF-8, ASCII, ISO-8859-1等。Python的open()
函數允許我們通過encoding
引數來指定檔案的編碼方式。
with open('file.txt', 'r', encoding='utf-8') as file:
content = file.read()
print(content)
如果你嘗試讀取一個包含非ASCII字元的文字檔案,但沒有提供正確的編碼引數,Python可能會丟擲UnicodeDecodeError
。在這種情況下,你需要知道檔案的正確編碼格式才能正確地讀取檔案。
# 嘗試讀取一個包含非ASCII字元的檔案,但沒有指定正確的編碼格式
try:
with open('file.txt', 'r') as file:
content = file.read()
except UnicodeDecodeError:
print("UnicodeDecodeError occurred!")
這段程式碼會捕獲UnicodeDecodeError
並列印一個錯誤訊息。
在檔案操作中,我們可能會遇到各種異常情況,例如檔案不存在、沒有讀取/寫入許可權等。我們可以使用Python的例外處理機制來捕獲這些異常並作出相應的處理。
try:
with open('nonexistent_file.txt', 'r') as file:
content = file.read()
except FileNotFoundError:
print('File does not exist!')
except PermissionError:
print('No permission to read the file!')
這段程式碼會捕獲FileNotFoundError
和PermissionError
,並分別列印出相應的錯誤訊息。
pickle
進行物件序列化和反序列化Python的pickle
模組提供了將物件轉換為一種可以儲存到檔案或在網路上傳輸的格式(這個過程稱為序列化),以及從這種格式重新構造物件(這個過程稱為反序列化)的功能。這是一種非常方便的方式來儲存和載入Python物件。
import pickle
data = {
'name': 'John',
'age': 30,
'pets': ['cat', 'dog']
}
# 序列化並儲存到檔案
with open('data.pkl', 'wb') as file:
pickle.dump(data, file)
# 從檔案載入並反序列化
with open('data.pkl', 'rb') as file:
loaded_data = pickle.load(file)
print(loaded_data)
執行這段程式碼,你會看到以下輸出:
{'name': 'John', 'age': 30, 'pets': ['cat', 'dog']}
這就是原始的data
字典物件。
在處理檔案路徑時,Python的os.path
模組提供了一系列函數來解析、構造和修改檔案路徑。這些函數都是跨平臺的,因此無論你的程式執行在Windows、macOS還是Linux上,都可以安全地使用它們。
import os
# 獲取檔案的絕對路徑
abs_path = os.path.abspath('file.txt')
print(f'Absolute path: {abs_path}')
# 獲取檔案所在的目錄
dir_name = os.path.dirname(abs_path)
print(f'Directory: {dir_name}')
# 獲取檔案的基本名和擴充套件名
base_name = os.path.basename(abs_path)
print(f'Base name: {base_name}')
root, ext = os.path.splitext(base_name)
print(f'Root: {root}, Extension: {ext}')
假設file.txt
位於/home/user/documents/
目錄下,執行這段程式碼會輸出:
Absolute path: /home/user/documents/file.txt
Directory: /home/user/documents
Base name: file.txt
Root: file, Extension: .txt
Python的os
模組提供了一個os.walk()
函數,這是一個簡單易用但強大的工具,用於在目錄樹中生成檔名。結合fnmatch
模組,我們可以實現對檔案的模式匹配搜尋。
import os
import fnmatch
def find(pattern, path):
result = []
for root, dirs, files in os.walk(path):
for name in fnmatch.filter(files, pattern):
result.append(os.path.join(root, name))
return result
# 查詢當前目錄及其所有子目錄中的所有.txt檔案
print(find('*.txt', '.'))
假設當前目錄及其子目錄下有file1.txt
, file2.txt
, sub/file3.txt
三個檔案,執行這段程式碼會輸出:
['./file1.txt', './file2.txt', './sub/file3.txt']
我們希望你能從這篇部落格中學到Python檔案操作的各種技巧,並能在你的Python程式設計之旅中發揮作用。如果你有任何問題或想法,歡迎留言交流。
如有幫助,請多關注
個人微信公眾號:【Python全視角】
TeahLead_KrisChang,10+年的網際網路和人工智慧從業經驗,10年+技術和業務團隊管理經驗,同濟軟體工程本科,復旦工程管理碩士,阿里雲認證雲服務資深架構師,上億營收AI產品業務負責人。