在 MongoDB 中,核心程序主要包含了 mongod、mongos 和 mongosh 三個。
其中最主要的是 mongod 程式,其在不同的部署方案中(單機部署、副本集部署、分片叢集部署),通過不同的設定,可以扮演多種不同的角色:
在一臺伺服器上,可以啟動多個 mongod 服務。但在實際生產部署中,通常是建議一臺伺服器部署一個 mongod 範例,這樣不僅減少資源競爭,而且伺服器故障也不會同時影響到多個服務。
mongos 在分片叢集中扮演路由的角色,提供使用者端和分片之間的介面。
mongosh 是 MongoDB 整合的互動式 shell 工具。
MongoDB 資料庫工具是用於處理 MongoDB 部署的命令列實用程式的集合。資料庫工具包括以下二進位制檔案:
MongoDB 資料邏輯結構分為資料庫 database、集合 collection、檔案 document 三層 :
一個資料庫中可以建立多個集合,原則上應把邏輯相近的集合都放在一個資料庫中。
在 MongoDB 中,會有以下幾個內建的資料庫:
和 SQL 的表不同,集合是動態模式,不需要在讀寫資料前建立模式就可以使用,集合中的檔案也可以擁有不同的欄位,隨時可以任意增減某個檔案的欄位。
預設情況下,集合不要求其檔案具有相同的模式,但這是一種很好的實踐。可以通過使用 MongoDB 的檔案驗證功能和可用於多種程式語言的物件–檔案對映(object-document mapping)庫來實現檔案驗證。
集合由其名稱進行標識,集合名稱可以是任意 UTF-8 字串,但有以下限制:
""
)。\0
(空字元),這個字元用於表示集合名稱的結束system.
開頭,該字首為內部集合保留集合名稱使用 .
字元可以建立子集合,用與區分不同組織集合。雖然子集合沒有任何特殊屬性,但它們很有用,許多 MongoDB 工具整合了子集合。
檔案是 MongoDB 中資料的基本儲存單元,以一種叫作 BSON 的檔案結構表示。
檔案中的鍵值對是有序的,不同序則是不同檔案。並且鍵是區分大小寫的,否則也為不同檔案。
檔案的鍵是字串,而值除了字串,還可以是 Int
、Long
、Double
、Boolean
、陣列、嵌入檔案等多種型別。
每個檔案都有一個預設的 _id
鍵,它相當於關係型資料庫中的主鍵,這個鍵的值在同一個集合中必須是唯一的。
_id
鍵的值預設是 ObjectId
型別,在插入檔案的時候,如果使用者不設定檔案的 _id
值的話,MongoDB 會自動生成一個唯一的 ObjectId
值進行填充。
MongoDB 在 3.2 版本已經將 WiredTiger 作為預設的儲存引擎。其作為儲存引擎的時候,資料庫會有以下儲存檔案:
collection-*.wt
: 儲存集合的資料index-*.wt
: 儲存索引的資料WiredTiger
: 儲存基本設定資訊WiredTiger.wt
: 儲存所有其他集合的後設資料資訊WiredTiger.lock
: 儲存程序 ID,用於防止多個程序連線同一個 WiredTiger 資料庫WiredTiger.turtle
: 儲存 WiredTiger.wt
的後設資料資訊journal
: 儲存資料庫的寫紀錄檔MongoDB 提供的 mongosh 是一個 JavaScript 的 shell,其提供了許多高階功能和自定義功能。
對於 MongoDB 提供的功能,shell 內建了幫助檔案,可以輸入 help
命令進行存取,使用 db.help()
可以檢視資料庫級別的幫助檔案,使用 db.foo.help()
可以檢視集合級別的幫助檔案。
在 shell 中使用函數之前,在不使用括號的情況下輸入函數名,這樣會列印出函數的原始碼,這是一個可以檢視函數具體行為的好方法。
shell 不止可以直接執行 JavaScript 的指令碼程式碼,還可以用於執行 JavaScript 的指令碼檔案,簡單執行 mongo script.js
即可。
如果已經進入到 shell 中,可以使用 load()
函數載入 JavaScript 指令碼檔案。
對於需要頻繁被載入的指令碼,可以將它們新增到 .mongorc.js
中,此檔案會在啟動 shell 時自動執行。
在更實際一些的場景中,使用此指令碼可以設定全域性變數,或者為長名稱設定一個簡短的別名,也可以重寫內建函數。
通過將 prompt
變數設定為一個字串或函數,可以重寫預設的 shell 提示,如下範例:
prompt = function() {
if (typeof db == 'undefined') {
return '(nodb)> ';
}
// 檢查最後的資料庫操作
try {
db.runCommand({getLastError: 1});
} catch (e) {
print(e);
}
return db+"> ";
};
提示函數應該返回一個字串,通常應該包含對 getLastError
的呼叫,這樣可以捕獲輸入時的錯誤,並在 shell 斷開連線時自動重新連線。
使用 shell 時,編輯多行的時候不能再編輯前面的行,這對於較大的程式碼塊或物件非常不友好。
為此,可以在 shell 中設定 EDITOR
變數,則可以使用 edit varname
的方式編輯一個變數,完成更改後只需儲存並退出編輯器,變數將被重新解析並載入回 shell 中。
大多數情況下可以使用 db.collectionName
語法來獲得一個集合的內容,但如果集合名稱是保留字或是無效的 JavaScript 屬性名稱時,那麼此方法就不能正常工作了。
對於上述的情況,可以使用 db.getCollection()
的方式繞過無效屬性。