Django ORM:最全面的資料庫處理指南

2023-07-10 15:01:12

深度探討Django ORM的概念、基礎使用、進階操作以及詳細解析在實際使用中如何處理資料庫操作。同時,我們還討論了模型深入理解,如何進行CRUD操作,並且深化理解到資料庫遷移等高階主題。為了全面解讀Django ORM,我們也討論了其存在的不足,並對其未來發展進行了展望。這篇文章旨在幫助讀者全面掌握Django ORM,理解其如何簡化資料庫操作,並透過表象理解其內部工作原理。

Django ORM簡介

在深入討論Django的ORM(Object-Relational Mapping,物件-關係對映)之前,讓我們先理解一下什麼是ORM。

ORM是一種程式設計技術,用於在物件導向的軟體和關聯式資料庫之間建立一種可相容的系統。簡單來說,ORM能夠讓你使用Python(或其他程式語言)來運算元據庫,就像你在操作Python物件一樣。

Django的ORM是一個非常強大的工具,它幫助你管理和查詢資料庫。基於Django ORM的主要優勢,你可以:

  • 利用Python的物件模型進行資料庫查詢,無需編寫複雜的SQL語句。
  • 實現資料庫的平臺獨立性,因為Django ORM可以在多種資料庫系統上執行。

下面我們用一個簡單的例子來說明這個概念。假設我們有一個名為"Blog"的模型,其中有一個名為"title"的欄位。使用Django ORM,我們可以輕鬆地查詢所有標題包含"Django"的部落格。

# 匯入模型
from myapp.models import Blog

# 使用ORM進行查詢
blogs = Blog.objects.filter(title__contains='Django')

# 輸出查詢結果
for blog in blogs:
    print(blog.title)

如果你在資料庫中有名為"Learning Django"和"Django ORM basics"的部落格,上面的程式碼將會輸出:

Learning Django
Django ORM basics

看到這裡,你可能會發現Django ORM的強大之處:它把複雜的資料庫操作轉化為Python物件操作,這極大地提高了我們的程式設計效率。


Django ORM執行機理與模型介紹

Django ORM執行機理

Django ORM將類(class)對映到資料庫表(table),將類的範例(instance)對映到表的記錄(record),將類的欄位(field)對映到資料庫的欄位(column)。通過這種方式,你可以使用Python程式碼對資料庫進行操作,而無需寫任何SQL語句。

在Django ORM中,每個模型(model)對應一個資料庫表,模型的欄位對應表的列,模型的範例對應表的行。

Django模型介紹

在Django中,模型是對資料庫表的一種高階抽象。通過定義一個模型,你可以明確地指定資料庫的結構,包括資料表的名稱、欄位的名稱和型別,以及可能的索引等。

讓我們看一個簡單的例子,定義一個名為「Blog」的模型:

from django.db import models

class Blog(models.Model):
    title = models.CharField(max_length=200)
    content = models.TextField()
    pub_date = models.DateTimeField(auto_now_add=True)

在這個例子中,我們定義了一個名為Blog的模型,它有三個欄位:titlecontentpub_date。每個欄位都對應一種資料庫的列型別:CharField對應字元型別,TextField對應文字型別,DateTimeField對應日期時間型別。


Django模型Model深入理解

定義模型

在Django中,模型是資料存取層的核心組成部分,它為你的資料定義了最重要的行為。模型是一個Python類,子類於django.db.models.Model。每個模型都對應一個資料庫表。

from django.db import models

class Blog(models.Model):
    title = models.CharField(max_length=200)
    content = models.TextField()
    pub_date = models.DateTimeField(auto_now_add=True)

上面的例子中,我們定義了一個名為Blog的模型,它有三個欄位:titlecontentpub_date

模型欄位型別

Django提供了許多內建的欄位型別,可以滿足大部分的資料庫設計需求。例如:

  • CharField:字元欄位,用於儲存較短的字串,如標題。
  • TextField:文字欄位,用於儲存大量文字,如部落格內容。
  • DateTimeField:日期時間欄位,用於儲存日期和時間。

每種欄位型別都有其特定的引數,例如CharField需要一個max_length引數,指定該欄位的最大長度。

模型關聯關係

Django的模型還可以定義複雜的關聯關係,包括一對一(OneToOne)、一對多(ForeignKey)和多對多(ManyToMany)關係。

例如,我們可以定義一個Author模型,並將其與Blog模型關聯:

class Author(models.Model):
    name = models.CharField(max_length=100)

class Blog(models.Model):
    title = models.CharField(max_length=200)
    content = models.TextField()
    pub_date = models.DateTimeField(auto_now_add=True)
    author = models.ForeignKey(Author, on_delete=models.CASCADE)

這裡我們為Blog模型新增了一個author欄位,它是一個外來鍵欄位(ForeignKey),指向Author模型。這意味著每篇部落格都有一個作者,而每個作者可以寫多篇部落格。

當我們刪除一個作者時,on_delete=models.CASCADE引數將確保所有關聯的部落格也會被刪除。


Django ORM增刪改查CRUD操作

在瞭解了Django模型後,我們來看看如何使用Django ORM進行常見的資料庫操作:建立(Create)、讀取(Retrieve)、更新(Update)和刪除(Delete),通常被稱為CRUD操作。

建立記錄

在Django ORM中,我們可以通過建立模型的範例來建立新的記錄。以下是一個建立新的Blog記錄的範例:

from myapp.models import Blog

# 建立新的Blog範例
blog = Blog(title='My first blog', content='This is my first blog post.')
blog.save()  # don't forget to call save method

save()方法會將新的Blog範例儲存到資料庫中。

讀取記錄

Django ORM提供了多種方法來讀取資料庫中的記錄。我們可以使用all()方法獲取所有記錄,也可以使用filter()方法獲取滿足特定條件的記錄。

from myapp.models import Blog

# 獲取所有Blog記錄
blogs = Blog.objects.all()

# 輸出所有Blog的標題
for blog in blogs:
    print(blog.title)

如果有一個名為"My first blog"的部落格,上面的程式碼將會輸出:

My first blog

更新記錄

更新資料庫中的記錄也很簡單。我們可以獲取一個記錄的範例,修改它的屬性,然後呼叫save()方法:

from myapp.models import Blog

# 獲取第一個Blog記錄
blog = Blog.objects.first()

# 更新標題
blog.title = 'My updated blog'
blog.save()

這段程式碼將更新資料庫中第一個部落格的標題。

刪除記錄

要刪除資料庫中的記錄,我們可以獲取一個記錄的範例,然後呼叫delete()方法:

from myapp.models import Blog

# 獲取第一個Blog記錄
blog = Blog.objects.first()

# 刪除記錄
blog.delete()

這段程式碼將刪除資料庫中的第一個部落格。


Django ORM資料庫進階操作

在掌握了Django ORM的基礎操作後,接下來我們來看看一些更高階的資料庫操作,包括複雜查詢、查詢優化等。

複雜查詢

在Django ORM中,我們可以使用filter()exclude()order_by()等方法進行復雜查詢。

例如,我們可以找到所有標題包含"django"的部落格,並按照發布日期降序排序:

from myapp.models import Blog

# 獲取所有標題包含'django'的Blog記錄,並按照發布日期降序排序
blogs = Blog.objects.filter(title__contains='django').order_by('-pub_date')

# 輸出這些Blog的標題
for blog in blogs:
    print(blog.title)

如果存在標題包含'django'的部落格,上述程式碼將會按照發布日期的降序列印它們的標題。

查詢優化

對於大型資料庫,優化查詢是非常重要的。Django ORM提供了幾種工具來幫助你優化查詢,包括select_related()prefetch_related()

select_related()可以一次性獲取與查詢物件有ForeignKey關聯的物件,這可以減少資料庫查詢次數:

from myapp.models import Blog

# 獲取所有Blog記錄,並一次性獲取每個Blog的author資訊
blogs = Blog.objects.select_related('author').all()

# 輸出Blog的標題和作者名
for blog in blogs:
    print(blog.title, blog.author.name)

如果有作者名為'John'且標題為"My first blog"的部落格,上述程式碼將會輸出:

My first blog John

prefetch_related()對於ManyToMany關聯和一對多關聯也非常有用,它可以一次性獲取所有相關物件,減少資料庫查詢次數。


利用資料庫約束保證資料一致性

Django ORM提供了多種資料庫約束,如uniquecheck等,可以幫助我們確保資料庫的資料一致性。

# 例子:使用unique約束確保每個作者的email是唯一的
class Author(models.Model):
    name = models.CharField(max_length=100)
    email = models.EmailField(unique=True)

使用批次操作提升效能

Django ORM提供了bulk_createbulk_update等方法,可以讓我們以更高效的方式進行批次建立和更新。

# 例子:使用bulk_create方法批次建立物件
authors = [Author(name=f'Author {i}') for i in range(1000)]
Author.objects.bulk_create(authors)  # 這個操作只需要一次資料庫查詢

使用原生SQL

儘管Django ORM提供了許多強大的查詢工具,但有時候你可能需要直接執行SQL語句。Django ORM允許你執行原生SQL,你可以使用raw()方法或者cursor()方法來執行原生SQL:

from django.db import connection

# 使用cursor()執行原生SQL
with connection.cursor() as cursor:
    cursor.execute("SELECT title FROM myapp_blog")
    row = cursor.fetchone()

print(row)

這段程式碼將直接執行SQL查詢,並列印出第一個部落格的標題。雖然Django ORM提供了.raw()方法允許我們直接執行SQL查詢,但是這個方法應該儘量避免使用,因為它可能會引發SQL隱碼攻擊等安全問題,同時也失去了Django ORM的許多優點。


Django資料庫遷移

Django的資料庫遷移系統能夠自動地將你對模型的更改(增加欄位、刪除模型等)轉換為SQL命令,並在資料庫中執行這些命令。這是一種對資料庫進行版本控制的方式,讓你能夠更改你的模型並保持資料庫的更新。

建立遷移

當你更改了你的模型(例如,新增一個欄位、改變一個欄位的型別等),你需要建立一個遷移來將這些更改應用到資料庫。你可以使用makemigrations命令來建立遷移:

python manage.py makemigrations your_app_name

上述命令將會檢查你的模型與資料庫的當前狀態,然後建立一個新的遷移,該遷移包含了將資料庫更新至新狀態所需的所有操作。

應用遷移

建立了遷移之後,你需要使用migrate命令來應用這些更改到資料庫:

python manage.py migrate

該命令將執行所有未應用的遷移,將你的資料庫更新至最新狀態。

檢視遷移狀態

你可以使用showmigrations命令檢視所有遷移的狀態(已應用的和未應用的):

python manage.py showmigrations

執行上述命令將會列出所有的遷移以及它們的狀態,這可以幫助你瞭解資料庫的當前狀態。

回滾遷移

有時,你可能需要復原某個遷移。你可以使用migrate命令和遷移名(或遷移名之前的遷移名)來回滾遷移:

python manage.py migrate your_app_name 0001

該命令將會復原名為0002的遷移(以及在其之後的所有遷移),並將資料庫回滾至0001的狀態。


Django ORM的不足點

儘管Django ORM是一個強大且方便的工具,但它並不是無懈可擊的。瞭解這些侷限性可以幫助我們更加理智地決定何時以及如何使用它。

效能開銷

Django ORM需要額外的處理來將資料庫的行轉換為Python物件。這意味著使用Django ORM通常會比直接使用SQL語句慢一些。然而,這種效能開銷通常是可以接受的,除非你正在處理極大量的資料。

不支援某些複雜的SQL查詢

雖然Django ORM支援許多SQL功能,但有一些複雜的SQL查詢可能無法通過Django ORM的查詢API來實現。例如,對於某些資料庫的特定特性或高階SQL功能,可能需要寫原生的SQL語句。

需要額外的學習和理解

雖然Django ORM可以幫助我們避免直接編寫SQL,但是要有效地使用它,仍然需要理解資料庫的基本概念。而且,Django ORM自身的API和特性也需要一些學習和理解。

對資料庫的隱藏可能導致誤解

Django ORM隱藏了資料庫的許多細節,這使得程式設計變得更簡單,但也可能導致開發者對正在執行的資料庫操作有誤解。例如,一個看似簡單的操作可能實際上引發了多次資料庫查詢。

# 例子:看似簡單的操作實際上引發了多次資料庫查詢
for book in Book.objects.all():
    print(book.author.name)  # 這個操作對每本書都會引發一個資料庫查詢

在這個例子中,列印每本書的作者名字的操作實際上對每本書都會引發一個資料庫查詢,如果有大量的書籍,那麼這個操作將會非常慢。這是因為Django ORM預設是懶載入的,也就是說,它只在需要的時候才會去資料庫查詢資料。


Django ORM總結與展望

經過這篇文章的學習,我們深入瞭解了Django ORM的工作原理,實現了一些基礎和進階的資料庫操作,同時也瞭解了它的一些最佳實踐和侷限性。

Django ORM作為Python Web開發中的一個重要部分,它以其簡潔和強大的功能贏得了許多開發者的喜愛。儘管它有一些侷限性,比如某些複雜查詢的支援不是很好,以及它對資料庫操作的隱藏可能會導致效能問題,但是總體來說,Django ORM是一個非常有效的工具,可以幫助我們更快更好地進行Web開發。

在未來,我們可以期待Django ORM將會持續改進,提供更多的功能和更好的效能。同時,我們也可以通過深入學習和實踐,更好地利用Django ORM,提高我們的開發效率。

如有幫助,請多關注
個人微信公眾號:【Python全視角】
TeahLead_KrisChang,10+年的網際網路和人工智慧從業經驗,10年+技術和業務團隊管理經驗,同濟軟體工程本科,復旦工程管理碩士,阿里雲認證雲服務資深架構師,上億營收AI產品業務負責人。