MongoDB基礎

2023-03-23 06:03:08

優質部落格網站:IT-BLOG-CN

一、簡介

MongoDB是一個強大的分散式檔案儲存的NoSQL資料庫,天然支援高可用、分散式和靈活設計。由C++編寫,執行穩定,效能高。為WEB應用提供可延伸的高效能資料儲存解決方案。主要解決關係型資料庫資料量大,並行高導致查詢效率低下的問題,通過使用記憶體代替磁碟提高查詢效能。

MongoDB特點:
【1】模組自由:可以把不同結構的檔案存在在同一個資料庫裡;
【2】面向集合的儲存:適合儲存JSON風格檔案的形式;
【3】完整的索引支援:對任何屬性都可以加索引;
【4】複製和高可用性:支援伺服器之間的資料複製,支援主-從模式及伺服器之間的相互複製。從而提供冗餘備份及自動故障轉移;
【5】自動分片:支援雲級別的伸縮性,自動分片功能支援水平的資料庫叢集,可動態新增額外的機器;
【6】豐富的查詢:支援豐富的查詢表達方式,查詢指令使用JSON形式的標記,可輕易查詢檔案中內嵌的物件及陣列;
【7】快速更新查詢:查詢優化器會分析查詢表示式,並生成一個高效的查詢計劃;
【8】高效的傳統儲存方式:支援二進位制資料及大型物件(如圖片);

二、基本操作

MongoDB將資料儲存在一個檔案,資料結構由鍵值key:value對組成,類似於JSON物件,欄位值包含其他檔案、陣列、檔案陣列。

SQL術語 MongoDB術語 說明
DataBase DataBase 資料庫
Table Collection 資料庫表/集合:儲存多個檔案,結構不固定{'name':'zzx','gender':'男'}{'class':'一班','count':'10'}
Row Document 資料記錄行/檔案就是一個物件,由鍵值對構成,是JSON擴充套件的BSON格式{'name':'zzx','gender':'男'}
Column Field 資料欄位/域
Index Index 索引
Table Joins 表連線,MongoDB不支援
Primary Key Primary Key 主鍵,MongoDB自動將_id設定為主鍵

集合操作

// 建立
db.createCollection(name, options)
// 檢視集合
show collections
// 刪除
db.集合名稱.drop()

name要建立的集合名稱,options是一個檔案,用於制定集合的設定,選項引數是可選的:引數capped:預設為false表示不設定上限;引數size:當capped值為true時,需要指定此引數,表示設定上限的大小,會覆蓋之前的值,單位為位元組。

db.createCollection("stu")
db.createCollection("stu", { capped: true, size: 20})

資料型別

型別 說明
Object ID 檔案ID,每個檔案都有一個屬性,為_id保證一個檔案的唯一性,可以自己設定,如果沒有設定自動提供一個特別的_id,型別為objectID:12位元組的十六進位制數,前4個位元組時時間戳,接下來3個位元組是機器ID,接下來2個位元組服務程序ID最後三位是增量值
String 字串UTF-8
Boolean 布林
Integer 整形
Double 布林
Arrays 陣列或列表
Object 嵌入式的檔案,MongoDB是不能維護關係的,可以通過嵌入檔案的形式來維護這個關係
Null 空值
Timestamp 時間戳
Date 日期UNIX時間格式

檔案操作

// 插入
db.集合名稱.insert(document)

//案例1
db.stu.insert({name:'zzx',gender:1}) //自動生成_id
//案例2
s1={_id:'43444433',name:'zzx'}
s1.gender=0
db.stu.insert(s1)

// 修改
db.集合名稱.update(
    <query>, // 查詢條件,類似sql中的where部分
    <update>,  // 類似sql中的 set部分
    {$multi:<boolean>} // 預設false值改第一條記錄,true表示修改滿足的所有資料
)

//案例
db.stu.update({name:'zzx'},{name:'fj'}) // 整個檔案的結構都會發生變化
db.stu.update({name:'zzx'},{$set:{name:'fj'}}) // 只會修改 name的屬性

// 儲存:如果資料存在進行修改,不存在進行插入
db.集合名稱.save(document)

// 刪除
db.集合名稱.remove(
    <query>,
    {
        justOne:<boolean> //預設false會刪除多條
    }
)

查詢操作

// 查詢
db.集合名稱.find(條件檔案)
// 查詢一條資料
db.集合名稱.findOne(條件檔案)

//案例 and和or一起使用。運演演算法符:$lt小於 $lte小於等於 $gt大於 $gte大於等於 $ne不等於 使用//或者$regex編寫正規表示式
db.stu.find({$or:[{age: {$gte: 18}}, {gender: 1}], name: 'zzx'})
db.stu.find({name:{$regex:'^黃'}})
db.stu.find({name:/^黃/})

// ** 自定義查詢:使用 $where後面寫一個函數
db.stu.find({$where:function(){return this.age > 20}})

// limit()用於讀取指定數量的檔案
db.集合名稱.find().limit(NUMBER) //NUMBER表示檔案的條數
// skip()用於跳過指定數量的檔案,配合limit實現分頁功能,與limit同時使用的時候不分先後順序。
db.集合名稱.find().skip(NUMBER)

//投影:查詢的結構集只選擇必要的欄位
db.集合名稱.find({},{欄位名稱:1,...}) // 對需要顯示的欄位設定為1,id預設會返回,如果不想返回可以設定為0

// 排序 sort()
db.集合名稱.find().sort({欄位:1,...}) // 1升序,-1降序
// 統計 count()
db.集合名稱.find().count({條件}) //find可以省略
db.stu.count({age:{$gt:20},gender:1})

// 去重distinct()
db.集合名稱.distinct({去重欄位,{條件}})

聚合

主要用於計算資料,類似sql中的sum()avg()

常用的管道:$group將集合中的檔案分組,可用於統計結果;$match過濾資料,只輸出符合條件的檔案;$project修改輸入檔案的結構,如重新命名、增加、刪除欄位、建立計算結果;$sort將輸入檔案排序後輸出;$limit限制聚合管道返回的檔案數;$skip跳過指定數量的檔案,返回剩餘檔案;$unwind將陣列型別的欄位進行拆分;

常用的表示式:$sum計算綜合,$sum:1count表示計數;$avg計算平均值;$min獲取最小值;$max獲取最大值;$push在結果檔案中插入值到下一個陣列中;$first根據資原始檔的排序獲取第一個檔案資料;$last根據資原始檔的排序獲取最後一個檔案資料。

db.集合名稱.aggregate([{管道:{表示式}}]) //管道在Linux中一般用於將當前命令的輸出結果作為下一個命令的輸入,在MongoDB中是同樣的作用

分組$group

// 統計男女的總人數 _id表示組分的依據,使用某個欄位的格式為'$欄位',如果需要得到整個檔案可以使用 '$$ROOT' 替換 '$age'
db.stu.aggregate([
    {$group:{
        _id:'$gender',
        counter:{$push:'$age'}
    }}
])
// 輸入
{"_id":男,"counter":[12,45]}
{"_id":女,"counter":[22,15]}

過濾資料$match

db.stu.aggregate([
    {$match:{age:{$gt:20}}},
    {$group:{_id:'$gender',counter:{$sum:1}}}
])

投影$project:只顯示某個欄位

db.stu.aggregate([
    {$group:{_id:'$gender',counter:{$sum:1}}},
    {$project:{_id:0,counter:1}}
])

排序$sort

db.stu.aggregate([
    {$group:{_id:'$gender',counter:{$sum:1}}},
    {$sort:{counter:-1}}
])

$limit 和 $skip

db.stu.aggregate([
    {$group:{_id:'$gender',counter:{$sum:1}}},
    {$sort:{counter:-1}},
    {$skip:1},
    {$limit:1}
])

$unwind 將陣列型別的欄位進行拆分,如果不是陣列是一個屬性,就單獨輸出該屬性

db.集合名稱.aggregate([{$unwind:'$欄位名稱'}])

db.stu.insert({name:'zzx',size:['S','Z','L']})
db.stu.aggregate([
    $unwind:'$size'
])

// 處理是空陣列,無欄位,null的情況使用上述 $unwind資料會丟失,可以使用下面表示式,防止資料丟失
db.stu.aggregate([
    {$unwind:{
        path:'$欄位名稱',
        preserverNullAndEmptyArrays:<boolean> //防止資料丟失
    }}
])

三、索引

MongoDB通過索引提升查詢速度

// 使用explain()命令分析查詢效能
db.stu.find({name:'zzx100000'}).explain('executionStats')
// 分析結果如下:
"executionStats": {
    "executionSuccess": true,
    "nReturned": 1,
    "executionTimeMillis": 96,
    "totalKeysExamined": 0,
    "totalDocsExamined": 100000,
}

建立索引: 1表示升序,-1表示降序

db.集合.ensureIndex({屬性:1})
db.stu.ensureIndex({name:1})

// 對索引屬性查詢
db.stu.find({name:'zzx100000'}).explain('executionStats')
// 分析結果如下:
"executionStats": {
    "executionSuccess": true,
    "nReturned": 1,
    "executionTimeMillis": 1,
    "totalKeysExamined": 0,
    "totalDocsExamined": 100000,
}

// 唯一索引
db.stu.ensureIndex({'name':1},{'unique':true})
// 聯合索引
db.stu.ensureIndex({name:1,age1})
// 檢視索引
db.stu.getIndexes()
// 刪除所以
db.stu.dropIndexes('索引名稱')

四、安全

為了更安全的存取MongoDB,需要建立使用者。採用角色、使用者、資料庫的安全管理方式。常用的角色如下:root只在admin資料庫中可用,超級賬號,超級許可權。Read使用者唯讀許可權,readWrite使用者讀寫許可權。

// 建立超級管理員
use admin // admin是資料庫
db.createUser({
    user:'admin',
    pwd:'123',
    roles:[{role:'root',db:'admin'}]
})

啟用安全認證:修改組態檔

sudo vi /etc/mongod.conf

啟用身份認證:keys and values之間一定要有空格,否則解析錯誤。修改完組態檔後,必須重啟服務。

security:
    authorization: enable

資料庫連線

mongo -u admin -p 123 --authenticationDatabase admin

五、備份與恢復

複製提供資料冗餘備份,並在多個伺服器上儲存資料副本,提高資料的可用性,並保證資料的安全性,允許從硬體故障和服務中斷中恢復資料。常見的搭配是一主多從。主節點記錄所有操作,從節點定期輪詢主節點獲取這些操作,然後對自己的資料副本執行這些操作,從而保證資料的一致性。

優點:
【1】資料備份;
【2】資料災難恢復(自動故障轉移,自動恢復);
【3】讀寫分離;
【4】高資料可用;
【5】無宕機維護;
【6】副本集對應用程式是透明的;

設定複製節點:

mongod --bind_ip 192.168.113.122 --port 27017 --dbpath ./mongdb/file1 --replSet rs0 // rs0副本集,master和slave的副本集相同
mongod --bind_ip 192.168.154.132 --port 27017 --dbpath ./mongdb/file1 --replSet rs0

通過使用者端連線MongoDB master,並在master上面進行初始化,同時新增其他副本集(也就是備份的伺服器資訊)。如果在從伺服器上進行讀操作,需要設定rs.slaveOk()

mongo --host 192.168.113.122 --port 27017 // 主伺服器

rs.initiate()  //rs是mongodb提供的副本集管理物件

rs.add('192.168.154.132:27017') // 從伺服器

rs.salveOk()

手動備份:

mongodump -h dbhost -d dbname -o dbdirectory

恢復:

mongorestore -h dbhost -d dbname --dir dbdirectory