聊聊VSCode中的歷史儲存策略

2022-04-07 22:00:07
VSCode增加了保留檔案本地歷史功能,本篇文章就來帶大家聊聊中的歷史儲存策略,希望對大家有所幫助!

昨天更新 VSCode,發現 VSCode 也增加了保留檔案本地歷史功能。回想起前不久為了給 Yank Note 增加歷史記錄功能,摳破了腦袋,構思了好久歷史記錄儲存策略。感嘆要是 VSCode 早釋出幾個月,我還能有個參考。【推薦學習:《》】

不過當我看了 VSCode 的歷史儲存策略後:這麼粗暴?

VSCode 的策略

VSCode 1.66 版本的時間軸中可以展示檔案本地歷史了,效果是這樣

Img

針對這個功能,VSCode 也增加了一些設定:

There are also new settings to work with local history:

  • workbench.localHistory.enabled - Enable or disable local history (default: true).
  • workbench.localHistory.maxFileSize - File size limit when creating a local history entry (default: 256 KB).
  • workbench.localHistory.maxFileEntries - Local history entries limit per file (default: 50).
  • workbench.localHistory.exclude - Glob patterns for excluding certain files from local history.
  • workbench.localHistory.mergeWindow - Interval in seconds during which further changes are added to the last entry in local file history (default 10s).

右鍵點選歷史條目,有選單可以直接在系統管理器中找到檔案某個歷史記錄的副本。

因此可以推斷出,VSCode 為每一個儲存/復原等操作,在一定時間視窗(預設10s)內,儲存一個檔案到資料夾。通過特殊的檔案命名(保留時間資訊)來定位歷史記錄。

這也太粗暴了,一個檔案就是一個版本唄。

Typora 的策略

然後說下當時調研的 Typora 的策略。Typora 在 macOS 上有非常精美的檔案歷史回溯介面

2.gif

看樣子它應該是用的系統的「時間機器」來實現版本回溯的。所以這個功能在 Windows 上也就沒有了。

Yank Note 的策略

我設想中的歷史版本,有幾個目標:

  • 最重要的目標是儘量避免資料丟失。

  • 歷史記錄不要佔用太多體積,最好能增量記錄。

  • 極端情況下要方便使用者還原資料。

  • 歷史記錄應該可以標記和備註

針對第一個目標,我希望能保留使用者最近的編輯版本,不要捨棄。而 Yank Note 有自動儲存功能,也就有了第二個目標,不要佔用太多空間,也不要生成太多檔案。所以最開始想的類似 VSCode 那種,時間視窗+檔案儲存的策略,就不行了。

針對第三個目標,我不想引入自定義的格式,如 Git,或者資料庫。因為如果使用者丟失了資料,在軟體也不方便找到歷史記錄的情況(軟體損壞,檔案誤刪等),使用者要可以進入歷史目錄,把檔案找回來。

後續:有個使用者誤刪了一個檔案,回收站也找不到了,就通過這種方法恢復的。

再考慮第四個目標,最終我選擇了使用 zip 檔案的方式來儲存檔案歷史版本,雖然在寫入和讀取歷史上會消耗一點計算效能(10多兆大檔案歷史記錄也基本沒感知),但最終效果還是很好的。

最終方案:

  • 每個檔案由檔名和路徑 Hash 拼出一個 zip 包檔名

  • 每次寫入檔案,同時往這個 zip 檔案中寫入一個新版本檔案

  • 移動和重新命名檔案時候同步更改 zip 檔案的名字

  • 最大歷史版本數可以做一個限制。

  • 版本備註和標記資訊可以存在壓縮的備註欄位中。

通常編輯一個檔案的時候,由於自動儲存的機制,當前版本和上一個版本之間的差異很小,因此理論上往壓縮檔案中新增一個新的版本檔案,壓縮檔案整體大小增加應該很小才對。不過後來發現並非如此,這時我才意識到 Zip 檔案壓縮的特性:每個檔案分別壓縮,再合起來打包。也即是說往壓縮包新增檔案的時候,並不會和其他檔案一起壓縮。

針對這種情況,我採取兩次壓縮的策略:第一次把壓縮率設定為 0,僅僅打包,這樣 zip 包內都是檔案的原始資訊。第二次將整個打包檔案壓縮一次,這下壓縮程式就可以考慮整體的資訊來做壓縮了,這就實現了「增量更新」的目的。

後面編寫指令碼測試,一個普通長度的檔案,儲存 1000 個版本,也才佔用 50KB。

使用了幾個月下來,我的歷史檔案目錄也才佔用 700 多 KB 的空間,裡面大部分歷史記錄檔案只有幾 KB 大小。反觀 VSCode,使用這兩天曆史目錄就佔用了 2M。

3.gif

進一步

針對歷史儲存,我還進一步想了一些儲存策略

相對於最後一次儲存時間,保留:

  • 過去10分鐘內的每一個版本
  • 過去1小時內每分鐘一個版本
  • 過去24小時每小時一個版本
  • 每日保留一個版本
  • 已標記的備份

不過目前看來是不需要了,目前的策略簡單,各方面也達到我的預期了。

更多關於VSCode的相關知識,請存取:!!

以上就是聊聊VSCode中的歷史儲存策略的詳細內容,更多請關注TW511.COM其它相關文章!