Matlab資料匯入


在MATLAB中匯入資料意味著從外部檔案載入資料。importdata函式允許載入不同格式的各種資料檔案。它有以下五種形式 -

序號 函式 描述
1 A = importdata(filename) 從檔案filename中將資料載入到陣列A中。
2 A = importdata('-pastespecial') 從系統剪貼簿而不是從檔案載入資料。
3 A = importdata(___, delimiterIn) 解析delimiterIn作為在ASCII檔案,檔案名或剪貼簿資料中的列分隔符。可以使用delimiterIn與上述語法中的任何輸入引數。
4 A = importdata(___, delimiterIn, headerlinesIn) 從ASCII檔案,檔案名或剪貼簿載入資料,從行頭標題In + 1開始讀取數位資料。
5 [A, delimiterOut, headerlinesOut] = importdata(___) 返回在delimiterOut中檢測到的輸入ASCII檔案的分隔符字元,並使用前面語法中的任何輸入引數檢測headerlinesOut中檢測到的標題行數。

預設情況下,Octave不支援importdata()函式,因此必須搜尋並安裝此軟體包,以使以下範例與Octave安裝配合使用。

範例 - 1

下面載入並顯示一個影象檔案。 建立指令碼檔案並在其中鍵入以下程式碼:

filename = 'mydog.jpg';
A = importdata(filename);
image(A);

執行上面範例程式碼,得到以下結果 -

執行檔案時,MATLAB顯示影象檔案。但是,必須將其儲存在當前工作目錄(F:\worksp\matlab)中。

範例 - 2

在這個例子中,匯入一個文字檔案並使用指定分隔符和列標題。下面用列標題建立一個空格分隔的ASCII檔案,名稱為weeklydata.txt

文字檔案weeklydata.txt的內容如下 -

周一  週二  週三  週四  週五  週六  週日
95.01   76.21   61.54    40.57       55.79    70.28   81.53
73.11   45.65   79.19    93.55       75.29    69.87   74.68
60.68   41.85   92.18    91.69       81.32    90.38   74.51
48.60   82.14   73.82    41.03       0.99     67.22   93.18
89.13   44.47   57.63    89.36       13.89    19.88   46.60

建立指令碼檔案並在其中鍵入以下程式碼 -

Trial>> filename = 'weeklydata.txt';
delimiterIn = ' ';
headerlinesIn = 1;
A = importdata(filename,delimiterIn,headerlinesIn);
% View data
for k = [1:7]
   disp(A.colheaders{1, k})
   disp(A.data(:, k))
   disp(' ')
end
周一
   95.0100
   73.1100
   60.6800
   48.6000
   89.1300


週二
   76.2100
   45.6500
   41.8500
   82.1400
   44.4700


週三
   61.5400
   79.1900
   92.1800
   73.8200
   57.6300


週四
   40.5700
   93.5500
   91.6900
   41.0300
   89.3600


週五
   55.7900
   75.2900
   81.3200
    0.9900
   13.8900


週六
   70.2800
   69.8700
   90.3800
   67.2200
   19.8800


週日
   81.5300
   74.6800
   74.5100
   93.1800
   46.6000

範例 - 3

在這個例子中,從剪貼簿中匯入資料。

將以下行複製到剪貼簿 -

Matlab is simple,I like it.

建立指令碼檔案並鍵入以下程式碼 -

A = importdata('-pastespecial')

執行上面範例程式碼,得到以下結果 -

Trial>> A = importdata('-pastespecial')

A =

  1×1 cell 陣列

    {'Matlab is simple,I like it.'}

低階檔案I/O

importdata函式是一個高階函式。 MATLAB中的低階檔案I/O函式允許對檔案讀取或寫入資料控制。但是,這些函式需要更多關於檔案的詳細資訊才能有效地工作。

MATLAB為位元組或字元級別的讀寫操作提供以下函式 -

函式 描述
fclose 關閉一個或所有開啟的檔案
feof 測試檔案結尾
ferror 有關檔案I/O錯誤的資訊
fgetl 從檔案讀取行,刪除換行符
fgets 從檔案讀取行,保留換行符
fopen 開啟檔案,或獲取有關開啟檔案的資訊
fprintf 將資料寫入文字檔案
fread 從二進位制檔案讀取資料
frewind 將檔案位置指示器移動到開啟檔案的開頭
fscanf 從文字檔案讀取資料
fseek 移動到檔案中的指定位置
ftell 在開啟檔案中的位置
fwrite 將資料寫入二進位制檔案

匯入具有低階別I/O的文字資料檔案

MATLAB提供以下函式,用於低階匯入文字資料檔案 -

  • fscanf函式讀取文字或ASCII檔案中的格式化資料。
  • fgetlfgets函式一次讀取檔案的一行,換行符分隔每行。
  • 讀取函式以位元組或位級別讀取資料流。

範例

假設有一個文字資料檔案myfile.txt儲存在工作目錄中。此檔案存放三個月的降雨資料: 2012年6月,7月和8月降雨量。

myfile.txt中的資料在五個地方包含重複的時間,月份和降雨量測量。標題資料儲存月數M; 所以有M個集合測量值。

檔案內容看起來如下 -

Rainfall Data
Months: June, July, August

M=3
12:00:00
June-2012
17.21  28.52  39.78  16.55 23.67
19.15  0.35   17.57  NaN   12.01
17.92  28.49  17.40  17.06 11.09
9.59   9.33   NaN    0.31  0.23 
10.46  13.17  NaN    14.89 19.33
20.97  19.50  17.65  14.45 14.00
18.23  10.34  17.95  16.46 19.34
09:10:02
July-2012
12.76  16.94  14.38  11.86 16.89
20.46  23.17  NaN    24.89 19.33
30.97  49.50  47.65  24.45 34.00
18.23  30.34  27.95  16.46 19.34
30.46  33.17  NaN    34.89  29.33
30.97  49.50  47.65  24.45 34.00
28.67  30.34  27.95  36.46 29.34
15:03:40
August-2012
17.09  16.55  19.59  17.25 19.22
17.54  11.45  13.48  22.55 24.01
NaN    21.19  25.85  25.05 27.21
26.79  24.98  12.23  16.99 18.67
17.54  11.45  13.48  22.55 24.01
NaN    21.19  25.85  25.05 27.21
26.79  24.98  12.23  16.99 18.67

從此檔案匯入資料並顯示此資料。請按照以下步驟 -

  • 使用fopen函式開啟檔案並獲取檔案識別符號。
  • 使用格式說明符描述檔案中的資料,例如字串的%s,整數%d或浮點數%f
  • 要跳過檔案中的文字,請將其包含在格式說明中。要跳過資料欄位,請在說明符中使用星號(*)。例如,要讀取標頭檔案並返回M的單個值,可以書寫為:
    M = fscanf(fid, '%*s %*s\n%*s %*s %*s %*s\nM=%d\n\n', 1);
    
  • 預設情況下,fscanf會根據格式描述讀取資料,直到找不到資料的匹配,或到達檔案的末尾。這裡使用for迴圈讀取3組資料,每次讀取7行和5列。
  • 將在工作空間中建立一個名為mydata的結構來儲存從檔案讀取的資料。這個結構有三個欄位 - 時間,月份和雨天陣列。

建立指令碼檔案(readraindata.m)並在其中鍵入以下程式碼 -

filename = 'myfile.txt';
rows = 7;
cols = 5;

% open the file
fid = fopen(filename);

% read the file headers, find M (number of months)
M = fscanf(fid, '%*s %*s\n%*s %*s %*s %*s\nM=%d\n\n', 1);

% read each set of measurements
for n = 1:M
   mydata(n).time = fscanf(fid, '%s', 1);
   mydata(n).month = fscanf(fid, '%s', 1);

   % fscanf fills the array in column order,
   % so transpose the results
   mydata(n).raindata  = ...
      fscanf(fid, '%f', [rows, cols]);
end
for n = 1:M
   disp(mydata(n).time), disp(mydata(n).month)
   disp(mydata(n).raindata)
end

% close the file
fclose(fid);

執行上面範例程式碼,得到以下結果 -

Trial>> readraindata
12:00:00
June-2012
   17.2100   17.5700   11.0900   13.1700   14.4500
   28.5200       NaN    9.5900       NaN   14.0000
   39.7800   12.0100    9.3300   14.8900   18.2300
   16.5500   17.9200       NaN   19.3300   10.3400
   23.6700   28.4900    0.3100   20.9700   17.9500
   19.1500   17.4000    0.2300   19.5000   16.4600
    0.3500   17.0600   10.4600   17.6500   19.3400

09:10:02
July-2012
   12.7600       NaN   34.0000   33.1700   24.4500
   16.9400   24.8900   18.2300       NaN   34.0000
   14.3800   19.3300   30.3400   34.8900   28.6700
   11.8600   30.9700   27.9500   29.3300   30.3400
   16.8900   49.5000   16.4600   30.9700   27.9500
   20.4600   47.6500   19.3400   49.5000   36.4600
   23.1700   24.4500   30.4600   47.6500   29.3400

15:03:40
August-2012
   17.0900   13.4800   27.2100   11.4500   25.0500
   16.5500   22.5500   26.7900   13.4800   27.2100
   19.5900   24.0100   24.9800   22.5500   26.7900
   17.2500       NaN   12.2300   24.0100   24.9800
   19.2200   21.1900   16.9900       NaN   12.2300
   17.5400   25.8500   18.6700   21.1900   16.9900
   11.4500   25.0500   17.5400   25.8500   18.6700