Git基礎概念


本章關於開始學習 Git。這篇文章將從介紹有關版本控制工具的一些背景知識開始,然後講解如何在系統執行 Git,最後是關於如何設定 Git 開始工作。 通過本章的學習,了解為什麼 Git 這麼流行,為什麼要使用 Git 以及應該如何設定以便使用 Git。

關於版本控制

什麼是「版本控制」?為什麼要關心它呢? 版本控制是一種記錄一個或若干檔案內容變化,以便將來查閱特定版本修訂情況的系統。在本書所展示的例子中,我們對儲存著軟體原始碼的檔案作版本控制,但實際上,可以對任何型別的檔案進行版本控制。

如果你是點陣圖形或網頁設計師,可能會需要儲存某一幅圖片或頁面布局檔案的所有修訂版本(這或許是你非常渴望擁有的功能),採用版本控制系統(VCS)是個明智的選擇。 有了它就可以將某個檔案回溯到之前的狀態,甚至將整個專案都回退到過去某個時間點的狀態,可以比較檔案的變化細節,查出最後是誰修改了哪個地方,從而找出導致怪異問題出現的原因,又是誰在何時報告了某個功能缺陷等等。 使用版本控制系統通常還意味著,就算你亂來一氣把整個專案中的檔案改的改,刪的刪了,這也沒有關係,你也照樣可以很容易地就恢復到原先的樣子。但額外增加的工作量卻微乎其微。

本地版本控制系統

許多人習慣用複製整個專案目錄的方式來儲存不同的版本,或許還會改名加上備份時間以示區別。 這麼做唯一的好處就是簡單,但是特別容易犯錯。 有時候會混淆所在的工作目錄,一不小心會寫錯檔案或者覆蓋意想外的檔案。

為了解決這個問題,人們很久以前就開發了許多種本地版本控制系統,大多都是採用某種簡單的資料庫來記錄檔案的歷次更新差異。

其中最流行的一種叫做 RCS,現今許多計算機系統上都還看得到它的蹤影。 甚至在流行的 Mac OS X 系統上安裝了開發者工具包之後,也可以使用 rcs 命令。 它的工作原理是在硬碟上儲存修補程式集(修補程式是指檔案修訂前後的變化);通過應用所有的修補程式,可以重新計算出各個版本的檔案內容。

集中化的版本控制系統

接下來人們又遇到一個問題,如何讓在不同系統上的開發者協同工作? 於是,集中化的版本控制系統(Centralized Version Control Systems,簡稱 CVCS)應運而生。 這類系統,諸如 CVSSubversion(SVN) 以及 Perforce 等,都有一個單一的集中管理的伺服器,儲存所有檔案的修訂版本,而協同工作的人們都通過用戶端連到這台伺服器,取出最新的檔案或者提交更新。多年以來,這已成為版本控制系統的標準做法。

這種做法帶來了許多好處,特別是相較於老式的本地 VCS 來說。 現在,每個人都可以在一定程度上看到專案中的其他人正在做些什麼。 而管理員也可以輕鬆掌控每個開發者的許可權,並且管理一個 CVCS 要遠比在各個用戶端上維護本地資料庫來得輕鬆容易。

事分兩面,有好有壞。 這麼做最顯而易見的缺點是中央伺服器的單點故障。 如果宕機一小時,那麼在這一小時內,誰都無法提交更新,也就無法協同工作。 如果中心資料庫所在的磁碟發生損壞,又沒有做恰當備份,毫無疑問您將丟失所有資料——包括專案的整個變更歷史,只剩下人們在各自機器上保留的單獨快照。本地版本控制系統也存在類似問題,只要整個專案的歷史記錄被儲存在單一位置,就有丟失所有歷史更新記錄的風險。

分散式版本控制系統

於是分散式版本控制系統(Distributed Version Control System,簡稱 DVCS)面世了。 在這類系統中,像 GitMercurialBazaar 以及 Darcs 等,用戶端並不只提取最新版本的檔案快照,而是把程式碼倉庫完整地映象下來。 這麼一來,任何一處協同工作用的伺服器發生故障,事後都可以用任何一個映象出來的本地倉庫恢復。 因為每一次的克隆操作,實際上都是一次對程式碼倉庫的完整備份。如下圖所示 -

更進一步,許多這類系統都可以指定和若干不同的遠端程式碼倉庫進行互動。藉此,你就可以在同一個專案中,分別和不同工作小組的人相互共同作業。可以根據需要設定不同的共同作業流程,比如層次模型式的工作流,而這在以前的集中式系統中是無法實現的。