圖書機讀目錄MARC簡介,ISO格式目錄資料生成

2023-05-29 15:01:51

一、簡介

機讀目錄(Machine-Readable Catalogue,MARC),是利用計算機讀取和處理書目資訊,是計算機編目的產品。
它以程式碼形式和特定的結構將書目資訊記錄在計算機的儲存載體上,能夠被計算機識別並編輯輸出書目資訊。

MARC起源於美國國會圖書館於1965年1月提出的「標準機器可讀目錄記錄款式的建議」。1973年國際標註化
組織將MARC格式作為國際標準正式頒佈,即USMARC格式,現改名為MARC21。

1986年,由於USMARC和UNIMARC的問世,中國機讀目錄的研製工作提到議事日程,我國開始參照UNIMARC編寫中國的MARC格式。1992年,北京圖書館自動化發展部編寫的《中國機讀目錄通訊格式》(China MARC format,簡稱CNMARC)問世。1996年2月6日,中華人民共和國文化行業標準《中國機讀目錄格式》(China MARC Format)正式釋出,1996年7月1日起實施。該標準根據我國文化部科技司於1993年3月向北京圖書館下達的研究任務而制定,目的是推進書目資料的規範與統一、加速我國文獻資訊網路的建設以及實現國內外書目資訊的共建共用。2004年,北京圖書館出版社出版了國家圖書館編的《新版中國機讀目錄格式使用手冊》(New China MARC Format Manual)。

2005年7月,在《新版中國機讀目錄格式使用手冊》基礎上修訂而成的《中國機讀目錄格式》(China MARC Format)國家標準通過專家評審,現已上報全國資訊與文獻工作標準化技術委員會和國家標準化管理委員會(the Standardization Administration of China)。《中國機讀目錄格式》國家標準雖然是依據UNIMARC編寫的,但兩者仍有差異。首先,CNMARC不是對UNIMARC的簡單照抄照搬,而是中國化的MARC格式。第二,它根據資訊資源的發展和使用者需求增加或刪減了一些欄位和附錄。第三,在編排格式和體例結構上,它不僅遵循我國國家標準的編寫法,而且兼顧了MARC格式的特殊要求。儘管兩者存在差異,但CNMARC最大限度地方便了國內外書目資訊的交換與共用。

二、中國檔案機讀目錄格式

中國檔案機讀目錄格式標準:GB/T 20163-2006
可在國家標準全文公開系統檢視:中文標準名稱:中國檔案機讀目錄格式

我們檢視檔案知道這個標準就像計算機協定一樣,只要按照這種標準生成的資料,在支援該標準讀取資訊的系統中就能很方便的匯入匯出資料。
我們先看一個MARC21樣例資料:

00922nam0 2200205   450 
0010040882936
00520230413133611.0
010  |a978-7-01-025251-3|dCNY68.00
100  |a20230222d2022    em y0chiy0110    ea
1010 |achi
102  |aCN|b110000
105  |ay   z   000yy
106  |ar
2001 |a學習中國化時代化的馬克思主義立場觀點方法|9xue xi zhong guo hua shi dai hua de ma ke si zhu yi li chang guan dian fang fa|b專著|f本書編輯組[編]
210  |a北京|c人民出版社|d2022
215  |a308頁|d24cm
330  |a本書從「不斷開闢馬克思主義中國化時代化新境界」「充分彰顯強大真理力量和實踐偉力」「為豐富和發展馬克思主義作出原創性貢獻」。
6060 |a馬克思主義|x思想政治教育|x研究
690  |aD641|v5
801 2|aCN|b58marc.cn|c20230525

這就是一條書名為「學習中國化時代化的馬克思主義立場觀點方法」的MRAC資訊,這主要是顯示對應欄位值。在標準中實際一本書目資訊就是一條資料以ISO檔案字尾儲存。
00922nam0 2200205 450 001001100000005001700011010003200028100004100060101000800101102001500109105001800124106000600142200014700148210002700295215001600322330030300338606003500641690001200676801002800688004088293620230413133611.0 a978-7-01-025251-3dCNY68.00 a20230222d2022 em y0chiy0110 ea0 achi aCNb110000 ay z 000yy ar1 a學習中國化時代化的馬克思主義立場觀點方法9xue xi zhong guo hua shi dai hua de ma ke si zhu yi li chang guan dian fang fab專著f本書編輯組[編] a北京c人民出版社d2022 a308頁d24cm a本書從「不斷開闢馬克思主義中國化時代化新境界」「充分彰顯強大真理力量和實踐偉力」「為豐富和發展馬克思主義作出原創性貢獻」。0 a馬克思主義x思想政治教育x研究 aD641v5 2aCNb58marc.cnc20230525

其中無法顯示的框框符號實際是ASCII碼的非列印字元,主要是分割符,稍後再講。

然後我們看CNMARC對資料記錄的說明

  • 一條資料就由如上格式組成,頭標識24位元,
  • 然後記錄目次區記錄的是資料欄位的欄位標識號(比如100),然後是資料欄位的長度,資料在資料欄位區的位置最後,形式=資料+RS。
  • 接著就是資料欄位區,記錄的就是各欄位的資料,以及該欄位的子欄位資料,有兩種形式 。
    001-009 欄位=資料+RS;
    其它欄位=2位指示符+資料+RS (資料中子欄位之間由 US字元+1位子欄位標識隔開)
  • 最後是記錄結束符GS


而各個欄位和子欄位的規範就去看檔案吧。

3、製作ISO格式MARC資料

如果把標準研究清楚了可以自己寫一個程式,我目前找到一個程式可以從外部匯入資料生成ISO,也可以匯入ISO轉其它格式,也可以編輯ISO檔案。
下載連線:marcpro2.rar
解壓后里面有三種操作方式的說明,照著來就行了。

我們開啟marcpro.exe 從mdb匯入資料生成ISO檔案。

  • 點工程,新建一個測試工程,然後點測試工程選單會切換,在工程下新建一個範例。

  • 點範例,然後選單點設定範例

  • 選擇你的mdb,選擇表,在設定範例裡面設定對映欄位

  • 設定完成後儲存,在主介面點選工程,然後點選執行生成檔案

  • ISO資料