資料庫是什麼?資料庫的概念

2020-07-16 10:05:17
本節介紹資料庫的基本概念,包括資料庫儲存方式、資料庫技術的發展歷史、資料庫的儲存結構以及資料庫在開發中的作用。

資料儲存方式

計算機資料(Data)的儲存一般以硬碟為資料儲存空間資源,從而保證計算機內的資料能夠持續儲存。對於資料的處理,一般會採用資料庫相關的技術進行處理,從而保證資料處理的高效性。

採用資料庫的管理模式不僅提高了資料的儲存效率,而且在儲存的層面上提高了資料的安全性。通過分類的儲存模式讓資料管理更加安全便捷,更能實現對資料的呼叫和對比,並且方便查詢等操作的使用。

什麼是資料庫

資料庫是資料管理的有效技術,是由一批資料構成的有序集合,這些資料被存放在結構化的資料表裡。資料表之間相互關聯,反映客觀事物間的本質聯絡。資料庫能有效地幫助一個組織或企業科學地管理各類資訊資源。

資料是資料庫中儲存的基本物件,是按一定順序排列組合的物理符號。資料有多種表現形式,可以是數位、文字、影象,甚至是音訊或視訊,它們都可以經過數位化後存入計算機。

資料庫是資料的集合,具有統一的結構形式並存放於統一的儲存媒介內,是多種應用資料的整合,並可被各個應用程式所共用。

在日常生活中,人們可以直接用中文、英文等自然語言描述客觀事物。在計算機中,則要抽象出對這些事物感興趣的特徵,並組成一個記錄來描述。

例如,在學生檔案中,學生資訊是由學號、姓名、性別、年齡、籍貫、聯絡電話等特徵組成的,那麼這些具體的特徵值所構成的一條記錄就是一個學生的資訊資料,例如“2016010102,張三,男,26,山西,計算機學院,185********”。

值得注意的是,資料的描述形式還不能完全表達其內容,需要經過解釋。例如,對於上面這條學生記錄,了解其含義的人會得到這樣的資訊:張三的學號是 2016010102,今年 26 歲,山西人,就讀於計算機學院,他的聯絡電話是 185********;而不了解其語意的人則無法理解其含義。所以,資料和對資料的解釋是不可分的,資料的解釋是指對資料含義的說明,資料的含義也稱資料的語意,因此資料與其語意密不可分,沒有語意的資料是沒有意義和不完整的。

資料庫的儲存結構

資料庫的儲存結構是指資料庫中的物理資料和邏輯資料的表示形式、物理資料和邏輯資料之間關係對映方式的描述。在資料庫技術中,可以使用兩種形式描述客觀現實的資料:物理資料描述和邏輯資料描述。物理資料和邏輯資料之間的轉換通過資料庫管理系統實現。

物理資料描述

物理資料描述是指資料在儲存裝置上的儲存方式,物理資料是實際存放在儲存裝置上的資料,這些資料也稱為物理記錄。根據物理記錄儲存的位置,又可以分為有序儲存和無序儲存。

在物理資料描述中,使用的資料描述術語包括以下各項。
  • 位(bit):二進位制的一個單位稱為位,位只能取 1 或 0。
  • 位元組(byte):8 個位稱為一個位元組,可以存放對應 ASCII 碼的一個字元。
  • 字(word):若干個位元組組成一個字。一個字所含的二進位制的位數稱為字長,許多計算機的字長是不同的,例如計算機的字長可以是 8 位、16 位、24 位、32 位等。
  • 塊(block):記憶體儲器和外記憶體交換資訊的最小單位,又稱為物理塊或物理記錄,每塊的大小通常為 256 位元組、512 位元組、1024 位元組等。
  • 捲(volume):一台輸入輸出裝置所能裝載的全部有用資訊,例如磁帶機的一盤磁帶即為一卷,磁碟裝置的一個盤組也是一捲。
  • 無序儲存(unordered):資料記錄按照插入的順序進行儲存。

邏輯資料描述

邏輯資料描述是指使用者或程式設計師用於操作的資料形式,邏輯資料是一種抽象的概念,是對客觀現實世界的反映和記錄,這些資料也可以稱為邏輯記錄。

邏輯資料包含兩個層次,一個層次是對客觀現實資訊世界的描述,另一個層次是對資料庫管理系統中資料的描述。

在對客觀現實資訊世界的描述中,使用的術語包括以下幾項。
  • 實體(entity):客觀現實存在的東西使用實體來描述。實體既可以是具體的、有形的物件,也可以是抽象的、無形的物件。例如,一本書是一個有形物件,一次借書過程則是一個無形的物件。
  • 實體集(entities):特性完全相同的同類實體的集合稱為實體集。例如,一個圖書館所有的書籍是一個實體集,該圖書館的所有借書過程也是一個實體集。
  • 屬性(attribute):實體的特性稱為屬性。每個屬性都有一個值域,這些值域可以是整數型別、浮點數型別、字元型別或日期型別等。例如,實體書的屬性包括書名、書號、出版日期、頁數、價格以及出版社等,這些屬性對應的值域分別為字元型別、字元型別、日期型別、整數型別、浮點數型別和字元型別等。
  • 識別符號(identifier):能夠唯一地標識每個實體的屬性或屬性集。例如,書的書號屬性是實體書的識別符號,借書過程實體的識別符號包括借書證號、書號兩個屬性。

這些邏輯資料最終要通過資料庫管理系統來轉換成物理資料。在資料庫管理系統中,描述邏輯資料的術語包括哪些呢?

下面以關係型資料庫管理系統為例進行介紹。
  • 資料項(data item):也稱為欄位(field),標記實體屬性的可以命名的最小資訊單位,資料項的命名一般採用屬性的描述性名稱。這些名稱可以是中文、英文或漢語拼音。
  • 元組(tuple):也稱為記錄(record),資料項的集合稱為元組。一個元組表示一個具體的實體。
  • 關係(relation):在關係型資料庫系統中,同一類元組所在的集合稱為關係。關係適用於描述實體集,它包括一個實體集的所有元組。例如,所有的圖書可以組成一個 books 關係。
  • 鍵碼(key):在關係型資料庫系統中,能夠唯一地標識關係中每個元組的資料項或資料項的組合稱為關係的鍵碼。

客觀實體經過兩層邏輯資料的描述,最後轉變成實際儲存的物理資料。

資料庫在開發中的作用

從資料庫系統應用角度來看,資料庫系統常見的執行與應用結構有:用戶端/伺服器結構、瀏覽器/伺服器結構。

在用戶端/伺服器(Client/Server,C/S)結構中,資料庫的使用者(如 DBA、程式設計者)通過命令列用戶端、圖形化介面管理工具或應用程式等連線到資料庫管理系統,可以通過資料庫管理系統查詢和處理儲存在底層資料庫中的各種資料。

資料庫使用者與命令列用戶端、圖形化介面管理工具或應用程式等直接互動,而不與資料庫管理系統直接聯絡。

在這種結構中,命令列用戶端、圖形化介面管理工具或應用程式等稱為“用戶端”或“前台”,主要完成與資料庫使用者的互動任務;而資料庫管理系統則稱為“伺服器”或“後台”,主要負責資料管理。這種結構經常被稱為“C/S”結構。

在用戶端/伺服器模式中,用戶端和伺服器可以同時工作在同一台計算機上,這種工作方式稱為“單機方式”;也可以“網路方式”執行,即伺服器被安裝和部署在網路中某一台或多台主機上。

對於用戶端應用程式的開發,目前常用的語言工具主要有 Visual C++、Delphi、.NET 框架、Visual Basic、Python 等。

資料庫能有效儲存資料,讀取資料、查詢資料更是方便,其實那些管理軟體就是通過軟體的介面向內部的資料庫進行資料的增、刪、改、查操作。