Python忽略NoData計算多張遙感影像的像元平均值:whitebox庫

2023-05-15 18:00:47

  本文介紹基於Pythonwhitebox模組,對大量長時間序列柵格遙感影像的每一個像元進行忽略NoData值多時序平均值求取。

  在文章Python ArcPy批次計算多時相遙感影像的各像元平均值中,我們介紹了基於PythonArcpy模組實現多時相遙感影像資料的平均值求取方法。但是這一方法具有一個問題,即對於任意一個像元,只要該像元在任意一個時相的影象中是無效值(即為NoData),那麼該像元在最終求出的平均值結果圖中畫素值也將會是無效值NoData。這就導致在我們最終計算得到的平均值結果圖層中,具有很多空白區域(畫素值為NoData的區域)。

  為了解決這一問題,這裡我們再介紹一種基於Python中另一個地理空間資料分析庫——whitebox,實現多時像遙感影像資料逐像元平均值的求取方法。

  首先,需要下載並安裝whitebox這一模組。如果大家電腦中已經有了Anaconda環境,就可以直接按照Python地理分析庫whitebox在Anaconda中的設定這篇文章中介紹的方法下載、安裝whitebox

  本文要實現的需求和文章Python ArcPy批次計算多時相遙感影像的各像元平均值中的一致,這裡就不再贅述。本文所需用到的程式碼如下。

# -*- coding: utf-8 -*-
"""
Created on Sun Apr 17 15:04:29 2022

@author: fkxxgis
"""

import glob
from whitebox import WhiteboxTools

tif_file_path="E:/LST/Data/MODIS/test/"
average_file_path="E:/LST/Data/MODIS/06_Average/"

wbt=WhiteboxTools()
wbt.work_dir=tif_file_path

tif_file_name=glob.glob(tif_file_path+"*.tif")
tif_file_year=tif_file_name[0][-18:-14]
one_year_tif_list=[]

for tif_file in tif_file_name:
    if tif_file[-18:-14]==tif_file_year:
        one_year_tif_list.append(tif_file)
        tif_file_temp=tif_file
        if tif_file==tif_file_name[len(tif_file_name)-1]:
            wbt.average_overlay(inputs=';'.join(one_year_tif_list),
                                output=average_file_path+tif_file_year+"_Ave.tif")
    else:
        wbt.average_overlay(inputs=';'.join(one_year_tif_list),
                            output=average_file_path+tif_file_year+"_Ave.tif")
        one_year_tif_list=[]
        one_year_tif_list.append(tif_file)
        tif_file_year=tif_file[-18:-14]

  其中,tif_file_path是原有計算平均值前遙感影象的儲存路徑,average_file_path是我們新生成的求取平均值後遙感影像的儲存路徑,也就是結果儲存路徑。

  上述程式碼的整體思路其實和文章Python ArcPy批次計算多時相遙感影像的各像元平均值這篇文章是非常類似的。首先,同樣需要在資源管理器中,將tif_file_path路徑下的各檔案以「名稱」排序的方式進行排序;隨後,利用arcpy.ListRasters()函數,獲取路徑下原有的全部.tif格式的影象檔案,並擷取第一個檔案的部分檔名,從而獲取其成像時間的具體年份。

  接下來,遍歷tif_file_path路徑下全部.tif格式影象檔案。其中,我們通過一個簡單的判斷語句if tif_file[0:4]==tif_file_year:,來確定某一年的遙感影像是否已經讀取完畢——如果已經讀取完畢,例如假如2001年成像的8幅遙感影像都已經遍歷過了,那麼就對這8景遙感影像加以逐像元的平均值求取,並開始對下一個年份(即2005年)成像的遙感影像繼續加以計算;如果還沒有讀取完畢,例如假如2001年成像的8幅遙感影像目前僅遍歷到了第5幅,那麼就不求平均值,繼續往下遍歷,直到遍歷完2001年成像的8幅遙感影像。

  這裡相信大家也看到了為什麼我們要在前期先將資料夾中的檔案按照「名稱」排序——是為了保證同一年成像的所有遙感影像都排列在一起,遍歷時只要遇到一個新的年份,程式就知道上一個年份的所有影象都已經遍歷完畢了,就可以將上一個年份的所有柵格影象加以平均值求取。

  本文程式碼和前期部落格中程式碼不一樣的部分就在於,這裡是用到whitebox模組而非arcpy模組來實現同一年份遙感影像的逐像元平均值求取。在這裡,wbt.average_overlay()函數就是我們實現這一步驟的關鍵,其中inputs參數列示需要進行平均值計算的同一年份的所有遙感影像,output表示求取平均值後得到的結果影象。

  最後,通過if tif_file==tif_file_name[len(tif_file_name)-1]:這個判斷,來確認是否目前已經遍歷到資料夾中的最後一個影象檔案。如果是的話,就需要將當前成像年份的所有影象進行平均值的求取,並宣告程式碼完成執行。

  這裡需要注意,由於我們在此沒有用到arcpy模組,因此程式碼也就不一定非要在 IDLE (Python GUI) 中執行了,常見的編譯器都可以執行。在程式碼執行過程中,還可以看到具體執行情況與進度。

  程式碼執行完畢後,即可得到求解平均值後的結果圖層。

  最後還有一個問題——在我用這一程式碼進行實踐後發現,如果計算平均值前的圖層具有兩個或兩個以上的波段,那麼得到的結果圖層整體看還好,如下圖所示。

  但放大後,會發現得到的結果呈現出如下所示的條帶狀。

  而如果計算平均值前的圖層僅具有一個波段的話,就不會出現這種問題;如下圖所示。

  因此,大家在使用本文的程式碼對大量長時間序列柵格遙感影像的每一個像元進行忽略Nodata值多時序平均值求取時,一定注意輸入圖層要僅含有一個波段;否則結果就會出現條帶狀的錯誤。