哈嘍大家好我是鹹魚,今天給大家分享一個能夠提升運維效率的 python 指令碼
鹹魚平常在工作當中通常會接觸到下面類似的場景:
對於 Linux 機器,鹹魚可以寫個 shell 指令碼或者直接批次使用 sed 命令就能很好的解決
但對於 Windows 機器,上面的方法就不管用了,我們就需要想其他的辦法
這裡鹹魚給大家分享一個由 python 編寫的指令碼,這個指令碼能夠去替換指定文字檔案中的指定內容,而且還能一次替換多個內容
我們先看效果,目標檔案:name.txt
python sed.py c:\name.txt Kanye Edison
python sed.py c:\name.txt Kanye,male Edison,female
原始碼在文末哦
首先我們匯入模組
import sys
import os
import time
from shutil import copy
然後我們來看一下指令碼中的第一個函數——data_preprocess()
def data_preprocess():
file_name, old_str, new_str = sys.argv[1:4] #接收輸入的引數:目標檔名,舊內容、新內容、字元編碼
try: # 傳入字元編碼引數
encoding = sys.argv[4]
except IndexError: # 沒有傳入字元編碼引數的話就預設使用 'utf-8' 字元編碼
encoding = 'utf-8'
old_str_list = [i.encode(encoding) for i in old_str.split(',')] # 將舊內容轉換成列表形式
new_str_list = [i.encode(encoding) for i in new_str.split(',')] # 將新內容轉換成列表形式
assert len(old_str_list) == len(new_str_list) # 判斷使用者輸入的 old_str 和 new_str 是不是一一對應
trans_tabs = list(zip(old_str_list, new_str_list)) # 將要舊內容列表(old_str_list)和新內容列表( new_str_list)中的元素一一對應
return file_name, trans_tabs # 返回目標檔名,以及一箇舊內容元素和新內容元素一一對應的列表
這個函數實現的功能是接收輸入的引數(目標檔名、要替換的內容,替換的內容、字元編碼格式),然後將要替換的內容與替換的內容分別轉換成列表形式
注意:替換多個內容時在多個內容之間用逗號隔開
例如我們敲如下命令替換一個內容:
python sed.py c:\test.txt Edison Kanye
這個函數就會返回下面內容(由於命令裡沒有傳入字元編碼引數,採取預設的 UTF-8)
file_name = c:\test.txt
trans_tabs = [(Edsion, Kanye)]
如果我們需要替換多個內容(例如將首字母改成大寫)
python sed.py c:\test.txt edsion,kanye,fish Edsion,Kanye,Fish utf-8
這個函數就會返回下面內容(命令傳入了字元編碼引數)
file_name = c:\test.txt
trans_tabs = [(edsion, Edsion), (kanye,Kanye), (fish,Fish)]
接下來我們來看第二個函數—— backup()
def backup(file_name):
time_mark = time.strftime('%Y%m%d_%H%M%S') #時間戳
bak_dir = r'C:\Users\Administrator\Desktop' #備份路徑
basename = os.path.basename(file_name)
os.makedirs(bak_dir) if not os.path.isdir(bak_dir) else True
copy(file_name, os.path.join(bak_dir, basename + '_' + time_mark))
print("備份 %s 成功" %file_name)
這個函數的功能就是在修改檔案之前先把檔案備份,防止後期我們需要回滾復原
最後我們來看最後一個函數—— sed()
這個函數便是整個指令碼的核心,它負責去執行修改替換檔案內容的操作
def sed(file_name, trans_tabs):
with open(file_name + '.swap', 'wb') as swap_fs, open(file_name, 'rb') as file_names: #開啟一個臨時檔案和目標檔案
for line in file_names: # 逐行讀取
for tab in trans_tabs:
line = line.replace(tab[0], tab[1]) if tab[0] in line else line # 修改替換操作
swap_fs.write(line) # 將修改後的內容寫入到臨時檔案當中
os.remove(file_name) # 刪除舊目標檔案
os.rename(file_name + '.swap', file_name) # 將臨時檔案重新命名,就變成了新的目標檔案
首先先開啟一個臨時檔案(file_name.swap)和目標檔案(file_name)
然後對目標檔案(file_name)進行逐行讀取到記憶體上,再去對內容進行修改,最後將修改後的內容寫入到這個臨時檔案(file_name.swap)中
修改完畢之後,把臨時檔案重新命名一下、把舊目標檔案刪掉,這個臨時檔案就變成了修改內容後的目標檔案了
import sys
import os
import time
from shutil import copy
def data_preprocess():
file_name, old_str, new_str = sys.argv[1:4]
try:
encoding = sys.argv[4]
except IndexError:
encoding = 'utf-8'
old_str_list = [i.encode(encoding) for i in old_str.split(',')]
new_str_list = [i.encode(encoding) for i in new_str.split(',')]
assert len(old_str_list) == len(new_str_list)
trans_tabs = list(zip(old_str_list, new_str_list))
return file_name, trans_tabs
def backup(file_name):
time_mark = time.strftime('%Y%m%d_%H%M%S')
bak_dir = r'C:\Users\Administrator\Desktop'
basename = os.path.basename(file_name)
os.makedirs(bak_dir) if not os.path.isdir(bak_dir) else True
copy(file_name, os.path.join(bak_dir, basename + '_' + time_mark))
print("備份 %s" %file_name)
def sed(file_name, trans_tabs):
with open(file_name + '.swap', 'wb') as swap_fs, open(file_name, 'rb') as file_names:
for line in file_names:
for tab in trans_tabs:
line = line.replace(tab[0], tab[1]) if tab[0] in line else line
swap_fs.write(line)
os.remove(file_name)
os.rename(file_name + '.swap', file_name)
file_name, trans_tabs = data_preprocess()
backup(file_name)
sed(file_name, trans_tabs)