一文講懂IPFS

2020-10-06 11:00:29

IPFS

什麼是IPFS?

星際檔案系統是一個旨在建立持久且分散式儲存和共用檔案的網路傳輸協定。它是一種內容可定址的對等、點到點 的超媒體分發協定。在IPFS網路中的節點將構成一個分散式檔案系統,它嘗試為所有計算裝置連線同一個檔案系統,可以讓我們的網際網路速度更快,更加安全,並且更加開放,IPFS協定的目標是取代傳統的網際網路協定HTTP
在這裡插入圖片描述

什麼是超媒體?超媒體對應之前的超文字,超文字意思就是我們建立文字與文字之間的連線,超媒體的意思是它要建立的是文字、圖片、視訊之間的連線。http這個協定就是一個超文字協定。

IPFS(InterPlanetary File System,星際檔案系統)是一個將分散式雜湊表(Distributed Hash Tables (DHTs))、BitTorrent、版本控制系統Git、自認證檔案系統(Self-Certified Filesystems - SFS)與區塊鏈相結合的檔案儲存和內容分發網路協定。這些系統的綜合優勢給它帶來的顯著特性:

  1. 永久的、去中心化儲存和共用檔案 (區塊鏈模式下的儲存DHTs)
  2. 對等超媒體:P2P 儲存各種各樣型別的資料(BitTorrent)
  3. 版本化:可追溯檔案修改歷史(Git - Merkle DAG默克爾有向無環圖))
  4. 內容可定址:通過檔案內容生成獨立雜湊值來標識檔案,而不是通過檔案儲存位置來標識。相同內容的檔案在系統中只會存在一份,節約儲存空間。

在某些方面,IPFS類似於全球資訊網,但它也可以被視作一個獨立的BitTorrent群、在同一個Git倉庫中交換物件。換種說法,IPFS提供了一個高吞吐量、按內容定址的塊儲存模型,及與內容相關超連結。這形成了一個廣義的Merkle有向無環圖(DAG)。IPFS結合了分散式雜湊表、鼓勵塊交換和一個自我認證的名稱空間。IPFS沒有單點故障,並且節點不需要相互信任。分散式內容傳遞可以節約頻寬,和防止HTTP方案可能遇到的DDoS攻擊。

IPFS基於什麼產生的呢?為什麼會有IPFS?

大家都知道網際網路是建立在HTTP協定上的. HTTP協定是個偉大的發明,讓我們的網際網路得以快速發展.但是網際網路發展到了今天HTTP逐漸出現了不足:

  1. 現在http協定的效率非常低,並且成本還很高。一旦使用HTTP協定每次需要從中心化的伺服器下載完整的檔案(網頁,視訊,圖片等),速度慢,效率低,如果改用P2P的方式下載,可以節省近60%的頻寬,P2P將檔案分割為小的塊,從多個伺服器同時下載,速度非常快.

  2. web檔案經常被刪除。我們可能在上網的過程中會遇到,收藏某個網頁,在使用的時候瀏覽器網頁會顯示404。原因有很多,有可能是伺服器停了,有可能是伺服器受到一些外部的干擾壞掉。所以會發現web檔案經常被刪除。IPFS提供了檔案的歷史版本回溯功能(就像git版本控制工具一樣),可以很容易的檢視檔案的歷史版本,資料可以得到永久儲存。

  3. 網際網路的中心化會抑制了web的成長,我們的現有網際網路是一個高度中心化的網路,網際網路是人類的偉大發明,也是科技創新的加速器,各種管制將對這網際網路的功能造成威脅,例如: 網際網路封鎖,管制,監控等等。這些都源於網際網路的中心化。

  4. 網際網路非常依賴於其他網路,如果說因為一些不可抗拒的因素,比如說自然災害這些,把主幹網路給破壞了,那一切真的就完了,起碼說網際網路會損失很多,當然這種機率是比較小的,還會受到各種病毒網路的攻擊,會造成中心化伺服器的斷機。

怎麼解決HTTP的缺點?

那麼為了解決以上問題,ipfs就出來了,它怎麼解決的呢,當我們利用ipfs上傳檔案的時候,系統會先對檔案進行一個加密,得到一個數值,這個數值很重要,我們叫做雜湊值,它是唯一的,一個檔案對應一個雜湊值,隨後系統會將檔案進行分割,分割成很多份,然後複製,最後分散式地存到若干區塊當中。

在未來,使用ipfs網存取東西或者下載東西的時候,系統會從離我們最近的距離的一個節點傳輸資料,或者說檔案的碎片來給到我,最終呈現的是整個檔案。

上面講到的【雜湊值】:在ipfs網路里的檔案會被賦予一個雜湊值,那麼這個雜湊值就類似於我們的身份證,獨一無二的,一個檔案一個雜湊值,這個雜湊值是從檔案內容中計算出來的。即使說檔案裡面它有一個標點符號被改動計算出的雜湊值也完全不一樣,所以就像我們說的一個人對應一個身份證,一個檔案就對應一個雜湊值,沒辦法改動。所以說ipfs網路中的檔案只存在獨一無二的一份,檔案自然不會重複地去儲存,不會被惡意篡改,大大降低了儲存的成本,減少了儲存的資源浪費,這也是為什麼說ipfs的目標是補充http的不足或者是完全取代http。

IPFS如何儲存檔案?

我們將一個檔案放到IPFS系統中,會得到根據內容計算出的加密雜湊值。雜湊值直接反映檔案的內容,哪怕只修改1位元組,雜湊值也會完全不同。當使用IPFS存取一個檔案的雜湊值時,它會使用一個分散式雜湊表找到檔案實際儲存節點,同時存取多個位元組來提高存取速度,下載檔案並校對檔案的雜湊。由於每個檔案的雜湊值全網唯一,查詢(存取)將很容易進行。如果被儲存過,直接從其它節點讀取它,不需要重複儲存。

儲存塊

資訊可以儲存進IPFS系統中的物件(塊)裡,這些塊可以儲存至多256KB的資料,它們還可以連結其他IPFS物件。

儲存小於256KB的檔案時,只需將這個檔案放進一個物件內就可以了。而大於256KB的檔案會被分成多個256KB然後放進物件中,之後IPFS將建立一個空物件,該物件將連結到檔案的所有其他部分。這個空塊就類似於一個大信封,裡面會涵蓋整個檔案的所有部分。

在這裡插入圖片描述

系統會給同一個檔案的每一個塊計算一次雜湊值一,所有物件的雜湊值一計算完畢之後,會將所有的雜湊值一拼湊成一個陣列B,再計算一次雜湊值,從而得到最終的雜湊值下進行。最後把最終的雜湊值和原檔案捆綁起來,組成一個物件,從而形成一個索引結構d。把塊和最終的索引結構d上傳至IPFS節點,檔案便同步到網路了。

如何存取IPFS?

IPFS的做法只關注檔案中可能出現的內容。比如,我們把照片檔案cat.jpg放到IPFS節點,它會得到一個新名字Qjhash23jhJhjhf56j65h,這是一個由檔案內容計算出的加密雜湊值。當IPFS被請求一個檔案雜湊時,它會使用一個分散式雜湊表找到檔案所在的節點,取回檔案並驗證檔案資料。

如果僅僅使用雜湊值來區分檔案的話,會給傳播造成困難,因為雜湊值不容易記憶,就像IP地址一樣不容易記憶,於是人類便發明了域名。與之類似,IPFS使用一個叫強脈衝中子源的分散式命名系統,將難於記憶的資料雜湊值對映為易於記憶的字串。這可以類比於域名與IP地址的對映關係。

舉個具體場景的例子,假設我想要看「碟中諜6」這部電影,A同學之前下載過這部電影,他啟動了IPFS節點,將這個視訊檔加入了IPFS網路。他會得到一個雜湊指紋b,同時釋出到公共閘道器,通過IPNS對映得到了一個/IPFS/b的路徑名。

他把雜湊指紋和路徑名都告訴我,我要做的事情是啟動一個本地節點,對該閘道器發一個定址PIN的請求,IPFS自動索引分散式雜湊表的雜湊值,找到指紋b所對應的節點列表。

如何解決無人保種的問題?

針對問題的解決方案:Filecoin

分散式儲存就意味著需要在全球都有足夠多的節點,上面提出的問題,實際就是如何才能讓這些節點願意貢獻自己的硬碟和頻寬。這當然少不了一套合理的獎勵機制,此時就需要Filecoin出場了。

通過使用代幣(FileCoin)的激勵作用,讓各例程有動力去儲存資料。按照各節點的貢獻大小,它們會獲得相應數量的Filecoin作為獎勵,即礦工(儲存資源貢獻者)通過為網路提供開放的硬碟空間獲得Filecoin,其他使用者想在IPFS裡儲存檔案時,也需要支付Filecoin作為成本。
在這裡插入圖片描述
儲存礦工的挖礦行為可以理解為是共用出自己的硬碟資源並獲得酬勞。

通過Filecoin的獎勵機制,IPFS激勵公眾參與進來貢獻出自己的儲存資源。這就在全球範圍內極大的增加了網路的節點數量,讓整個分散式儲存網路變成了一個巨大的儲存空間。在整套機制的配合下,IPFS在跟HTTP的競爭中擁有了更強的發展優勢。

參考資料

https://baijiahao.baidu.com/s?id=1647038148693057911&wfr=spider&for=pc
https://zhuanlan.zhihu.com/p/92895578?utm_source=wechat_session