獨闢蹊徑:逆推Krpano切圖演演算法,實現在瀏覽器切多層級瓦片圖

2022-10-04 06:01:54

前言

  • 此文我首發於CSDN(所以裡面的圖片有它的水印)
  • 趁著隔離梳理一下之前做的一個有用的功能:在瀏覽器中去切割多解析度瓦片圖
  • 這是一個有趣的過程,跟我一起探索吧
  • 閱讀本文需具備前置知識:對krpano有所瞭解,如:使用krpano去開發全景

本著故弄玄虛的原則,最精彩的會放到最後揭曉,由淺入深,層層遞進!


1.功能簡介

  1. 減輕伺服器壓力,krpano切圖比較消耗CPU和記憶體,我們團隊的伺服器曾經因為太多人同時切圖導致卡頓、宕機
  2. 提升切圖速度,在js切圖速度會比後端快,前端切圖與後端切圖可以同時使用,這樣切圖速度可以快100%以上
  3. 無水印,krpano是需要花錢註冊的,沒有註冊的情況下去切圖會有無數水印,使用本工具可以解決這個問題
  4. 提升使用者體驗,立方體切圖僅需要幾秒鐘,在行動端APP中,切圖可以立馬生成全景且僅保留在本地,點選儲存的時候才上傳到雲端
  5. ......

DEMO: https://irispro.github.io/krpanoJSToolDemo/dist/index.html
GitHub原始碼地址:https://github.com/IrisPro/KrpanoToolJS
NPM地址:https://www.npmjs.com/package/@krpano/js-tools

2.回顧krpano切圖

  • 在以往,咱們最常用的切圖方式是使用krpanotools命令列工具在伺服器切圖,如果是手動切圖的話,就會在本地使用 MAKE VTOUR (MULTIRES) dropletMAKE VTOUR (NORMAL) droplet,在1.20開始使用krpano Tools應用程式可以進行視覺化操作,除了切圖外,還能方便還原全景圖。

3.krpano切圖最常用的方式

  • 第一,普通切圖,即立方體切圖,將全景圖切為上、下、左、右、前、後6張圖。優點:切圖速度快,佔用儲存少。缺點:場景啟動時間不夠快,放大模糊。
  • 第二,多解析度切圖,跟瓦片地圖原理類似。優點:啟動速度快,圖片清晰。缺點:佔用儲存較多,切圖時間較久,一般用於航拍、風景等大範圍場景的需求,室內樣板間預覽,幾乎不太需要。比較著名的應用案例大家可以看看720雲上的何同學六百萬粉絲合影,這一個場景的圖片超過了百萬張。在地圖領域中是必用的技術.(如此就能夠根據不同的縮放等級來顯示不同的清晰度的影象,這樣的好處是如果要載入一張4k的全景圖,不需要一次性就將整個全景圖都載入進來,可以先載入一個縮放等級低的全景,然後當使用者進行縮放檢視細節的時候再載入清晰度更高的影象,這樣就可以明顯提高載入速度,避免因為圖片過大使得載入時間過長和不必要的流量浪費。不足之處就是需要為一張全景圖額外準備不同清晰度的圖片,增加了圖片處理的工作量,也增加了圖片儲存的空間佔用。)

4.瓦片地圖金字塔模型

瓦片地圖金字塔模型是一種多解析度層次模型,從瓦片金字塔的底層到頂層,解析度越來越低,但表示的地理範圍不變。首先確定地圖服務平臺所要提供的縮放級別的數量N,把縮放級別最高、地圖比例尺最大的地圖圖片作為金字塔的底層,即第0層,並對其進行分塊,從地圖圖片的左上角開始,從左至右、從上到下進行切割,分割成相同大小(比如256x256畫素)的正方形地圖瓦片,形成第0層瓦片矩陣;在第0層地圖圖片的基礎上,按每畫素分割為2×2個畫素的方法生成第1層地圖圖片,並對其進行分塊,分割成與下一層相同大小的正方形地圖瓦片,形成第1層瓦片矩陣;採用同樣的方法生成第2層瓦片矩陣;…;如此下去,直到第N一1層,構成整個瓦片金字塔。

  • 其實,krpano多解析度就是借鑑這種原理。

正片開始


5.前置知識介紹:ImageData


  • ImageData是圖片的資料化,儲存了圖片每個畫素的資訊,它有以下屬性:

    • data:包含影象隱藏畫素的 Uint8ClampedArray 陣列。如果陣列沒有給定,指定大小的黑色矩形影象將會被建立。
    • width: 描述圖片寬度
    • height:描述圖片高度
  • ImageData中的data,是一個陣列,每四個元素描述一個畫素,分別表示rgba,所以一張100x100px的圖片,data的陣列長度為 100 x 100 x 4 = 40000。我們平時用全景圖渲染精度一般在10000點~20000點。

  • data陣列會隨著解析度的提高指數級增長,如10000x10000的全景圖與20000*20000的全景圖,前者陣列長度為4億,後者16億。所以,在處理ImageData的時候,如此複雜的計算,我們需要使用多執行緒技術web worker,否則會阻塞渲染程序。

  • canvas這個就不多介紹了,大家都懂。

6.普通切圖(立方體切圖)


其實切立方體圖網上很多現成的方案,難點在於如何切瓦片圖。
我使用了現成的方案,在我倉庫地址中最底部有提及。

原理:將輸入的圖片使用canvas畫出來,然後轉為ImageData,通過球體轉立方體的演演算法,將對應畫素對映到每一個面上,最終再通過ImageData轉回圖片。

https://jaxry.github.io/panorama-to-cubemap/

demo中有三個選項:

  • Liner(柔和的細節)
  • Cubic(鋒利的細節,我選擇這一種,與krpano一致)
  • Lanczos(畫質最好,耗時是第二種的3.5倍,太耗時且結果肉眼感知不明顯)

7.多解析度瓦片圖演演算法(重頭戲)


01.通過krpano切圖結果推理多解析度切圖高清的原因

一張全景圖,可以切出幾百上千張碎圖,越放大就越清晰,並且初次縮放和旋轉場景,可以看到控制檯一直在載入圖片。

首先,我們來看看krpano切出來的圖片的目錄結構:

(圖一)多解析度切圖:

(圖二)普通切圖:

普通切圖我們好理解。除了preview.jpg和thumb.jpg,其它以pano_開頭的圖片都代表立方體其中一個面。

通過對比,我猜測多解析度每一個資料夾對應立方體每一個面。

為了探究這些碎圖是什麼東西,我開啟Photoshop,將圖一中資料夾b->l1裡面資料夾的圖片都放在畫布中,如下圖三所示:

圖三:

緊接著,我把剩下l2、l3資料夾裡面的所有圖片,按照上文同樣的操作,放在Photoshop中把圖片合併,驚奇地發現l1、l2、l3這三個資料夾每個資料夾合併的圖片都是一樣的,除了解析度不一樣以外,解析度等級:l3 > l2 > l1,層級越高解析度越高。如下圖所示:

02.小結krpano切圖規律

  1. 每一面圖片的多個資料夾(l1、l2、l3)代表多張不同解析度的圖片
  2. 資料夾名稱l1、l2、l3,其中的英文字母l是level的縮寫,數位代表圖片的層級
  3. 每一層級裡面的資料夾表示這張圖片的第幾行,按順序把每一行都拼起來就可以變成一面完整的圖
  4. 多解析度瓦片圖高清的原因:普通切圖解析度為2048x2048,而的解析度切圖最高解析度可以達到3200x3200,解析度越高肯定越清晰

03.演演算法思路推理與實現

小思路:

  1. 每一面的圖片我們可以通過普通切圖拿到
  2. 把每一面的圖使用canvas轉成不同解析度的圖片,然後逐行對它進行切割

問題:

  1. 一張全景圖需要分多少層級?
  2. 每一層級的解析度是多少?
  3. 每一張瓦片圖的最大尺寸和最小尺寸是多少?

為了能找出規律,我製作了非常多不同解析度的全景圖,使用krpano Tools去切圖,並根據輸出記錄不同解析度的層級、每一層級的解析度,試圖找出他們的規律。

如圖所示,這是krpano Tools 1.20.10:

從上圖中可以發現,每次切圖的時候控制檯會輸出幾個引數:

  • 全景圖的解析度
  • 一共多少層級,如圖中所示 levels=3,表示有3個層級
  • 每一層級的解析度,如圖中所示,3200x3200 1664x1664 768x768,由高到低

根據這些資料,我製成了一個表格:

為了讓樣本更具參考意義,全景圖的解析度我從1000x500 一直到 60000x30000。
為什麼知道了6萬就不往上測試了呢?因為我電腦Photoshop的極限就在這裡了,沒辦法輸出更高解析度的圖片了,從10個樣本中,我依舊可以得出以下規律:

  1. 相鄰層級解析度之比約等於 2,波動為0.2
  2. 全景圖的解析度與最高層級的解析度之比為 3.125 ,幾乎所有都一樣,僅有一個波動為0.012

3.125 這個數值我會把它當成一個突破口,
即最高層級圖片的分辨 = 全景圖解析度 / 3.125。

接著我檢視vtour-multtires.config檔案,即多解析度切圖的組態檔,這是一份krpano Tools預設的組態檔,可以手動去修改切圖的設定。一般幾乎不會去改動這裡,我們團隊生產過幾十萬個場景都沒有改過這裡,所以預設的設定已經是符合絕大部分使用場景。故,我把其中的設定作為標準來參考。

以下僅列舉了部分設定,完整設定可以參考krpano官網檔案

// 多解析度切圖設定
multires=true //  是否是多解析度
tilesize=512 // 瓦片圖大小
levels=auto // 自動層級
levelstep=2 // (重點)每一層與上一層
maxsize=auto // 最高層級解析度(自動計算)
maxcubesize=auto // 每一面最大的尺寸
stereosupport=true 
adjustlevelsizes=true // 允許調節每一層級的尺寸
adjustlevelsizesformipmapping=true
<!-- XML中image節點資訊 -->
<image>
	<cube url="panos/IMG_1914.tiles/%s/l%l/%0v/l%l_%s_%0v_%0h.jpg" multires="512,1024,2048,3840,7680" />
</image>

再通過官網,檢視 cube節點的multires屬性,第一個值表示單張瓦片圖的大小。

既然單張瓦片圖尺寸是512,那我就開啟檢視生成的圖片,看看到底是不是。
結果發現:幾乎所有的圖片都是512x512,除了最後一張圖片和最後一行。

官網對tilesize=auto的解讀:

  • Size of the multi-resolution tile images.
  • Should be between 256 and 1024.
  • When using 'auto' the tool will automatically try find a good value for 'symmetric tile splitting'.
  • The today recommendation for best rendering performance is using 512 as tilesize.
  • It's a good compromise between the GPU-texture-upload-time and the number of GPU-draw-calls required to fill the screen.
  • Note - the tilesize affects the loading and decoding time and also the rendering performance.

得知:

  • 瓦片圖大小在256 - 1024之間
  • 效能最好的是512。這也是krpano強大和嚴謹之處,他經過大量測試的出來的結果。

另一個屬性:levelstep=2

  • 表示每一層與相鄰一層的比為 2

到此,我們先整理一下已知資訊:

  • 瓦片圖的大小為512x512,但最後一行或者每行的最後一列可能不是512
  • 最高層級解析度 = 全景圖 / 3.125
  • 每一層級的解析度與相鄰層級的比為 2

雖然官方說瓦片圖尺寸為256-512,但是看官方切出來的圖片,最後一行很多都小於256。我通過大量樣本分析,最小值為64。那麼我給瓦片圖尺寸的定義為:大小為64-512,優先切512的圖片,最後假設不足512但也不能小於64。

每一層級的寬度 % 512 % 64 = 0

經過驗證,krpano所有切圖都滿足這樣的條件。

如果餘數不為零,那咋辦?同樣經過大量樣本推算,如果餘數小於64,則捨棄,即當前層級的解析度要減去這個餘數,如果餘數大於64,則相加。

這時候我簡單寫一條演演算法來計算一下我的猜想:

// 設全景圖大小為10000x5000
const panoSize = 10000
// 係數,瓦片圖最高層級的尺寸 = 圖片寬度 / 係數
const coefficient = 3.125
// 瓦片圖最大尺寸
const maxTileSize = 512
// 瓦片圖最小尺寸
const minTileSize = 64
// 相鄰層級的比
const levelstep = 2

// 調整層級的尺寸:控制 faceSize % 512 % 64 = 0
function adjustLevelSize(inputLevelSize: number) {

    if (inputLevelSize % maxTileSize % minTileSize === 0) return inputLevelSize

    const lastTileSize = inputLevelSize % maxTileSize

    // 最後一行小於64則捨棄
    if (lastTileSize < minTileSize) {
        inputLevelSize -= lastTileSize
    } else {
        //  最後一行瓦片的餘數(對64取餘)
        const minRemainder = lastTileSize % minTileSize
        if (minRemainder !== 0) {
            inputLevelSize = inputLevelSize - (minTileSize - minRemainder)
        }
    }
    return inputLevelSize
}

// 最高層級(餘數為0)
let levelSize1 = panoSize / coefficient // levelSize1 = 3200
levelSize1 = adjustLevelSize(levelSize1) // levelSize1 = 3200

// 下一級(餘數為0)
let levelSize2 = levelSize1 / levelstep // levelSize2 = 1600
levelSize2 = adjustLevelSize(levelSize2) // levelSize2 = 1600

// 下一級(餘數為32,800 % 512 % 64 = 32,捨棄,故levelSize3 = 800 - 32 = 768)
let levelSize3 = levelSize2 / levelstep // levelSize3 = 800
levelSize3 = adjustLevelSize(levelSize3) // levelSize3 = 768

...

// 官方1萬-1.5萬畫素的,只有三個層級,故切到第三層,那我就不能再切了,我得找出最低層級的最小解析度。

通過以上的計算,同一張全景圖我的演演算法與krpano切圖進行對比:

level 我的演演算法 krpano演演算法
3 3200 3200
2 1600 1664
1 768 768

第二層級雖然有64畫素的差距,但是我遵循的是層級比為2,krpano第二層級偶爾會略大或者略小,其實這是動態計算的,前面也有講,幾乎約等於2,在正常波動內,所以這沒問題。

2萬px以內的全景圖,每隔1000px我都測試一下,發現沒有問題,完全可用。

04.最終演演算法實現

analyzeImageLevel(panoWidth: number) {

    // 係數,瓦片圖最高層級的尺寸 = 圖片寬度 / 係數
    const coefficient = 3.125
    // 瓦片圖最大尺寸
    const maxTileSize = 512
    // 瓦片圖最小尺寸
    const minTileSize = 64

    // 調整層級的尺寸:控制 faceSize % 512 % 64 = 0
    function adjustLevelSize(inputLevelSize: number) {

        if (inputLevelSize % maxTileSize % minTileSize === 0) return inputLevelSize

        const lastTileSize = inputLevelSize % maxTileSize

        // 最後一行小於64則捨棄
        if (lastTileSize < minTileSize) {
            inputLevelSize -= lastTileSize
        } else {
            //  最後一行瓦片的餘數(對64取餘)
            const minRemainder = lastTileSize % minTileSize
            if (minRemainder !== 0) {
                inputLevelSize = inputLevelSize - (minTileSize - minRemainder)
            }
        }
        return inputLevelSize
    }

    function getLevelConfig(panoSize): ILevelConfig[] {
        let count = 1
        let levels = []
        const minFaceSize = 640
        const topLevelSize = panoSize / coefficient

        // 最高層
        levels.push({
            level: count,
            size: adjustLevelSize(topLevelSize)
        })

        getNextLevelConfig(topLevelSize)

        // 遞迴獲取子層級
        function getNextLevelConfig(topLevelSize) {
            const levelstep = 2
            const nextLevelSize = topLevelSize / levelstep
            if (nextLevelSize + minTileSize >= minFaceSize) {
                count++
                levels.push({
                    level: count,
                    size: adjustLevelSize(nextLevelSize)
                })
                getNextLevelConfig(nextLevelSize)
            }
        }

        // 層級轉為正常從小到大
        levels = levels.map((item, index) => {
            item.level = levels.length - index
            return item
        })
        return levels
    }

    this.levelConfig = getLevelConfig(panoWidth)
}

8.利用canvas分割圖片

上面我們推算出了演演算法,得到了這樣的資料:

// 層級數
// 每一層級的解析度
let levelConfig = [
    {
        level: 1,
        size: 768,
    },
    {
        level: 2,
        size: 1600,
    },
    {
        level: 3,
        size: 3200,
    },
]

把一張圖按照一定的規律風格成碎圖,這很簡單,不在這裡詳細展開,否則篇幅太長,可以去網上搜尋或者我到時候單獨寫個文章。

9.如何在生成目錄結構和下載?


大家在使用我的DEMO的時候可以發現,你傳一張全景圖上去,我可以在瀏覽器給你直接下載整個壓縮包,並且裡面已經分好層級和目錄結構。

如圖所示,這是我在瀏覽器生成的:

01.JSZip

  • 這時候,我給大家推薦一個非常好用的瀏覽器壓縮與解壓工具JSZip官方檔案。效率高,速度快,壓縮2G以內的非常快,有一次我壓縮3700張圖片,每張1m,這是記憶體就爆滿了,不過這種極限條件下一般遇不到,解決方法也很簡單,分塊上傳。

  • 他可以讓我們很方便的去壓縮檔案上傳到伺服器,在前端壓縮檔案再傳到後端的優勢是可以極大減少請求數量,比如上傳1000張需要1000個請求,壓縮成一個檔案僅需要一個請求,並且大檔案上傳速度比傳碎檔案速度快。

  • 做這個demo遇到很多問題:

    • Mac上unix可執行檔案壓縮就再解壓,就不是可執行檔案了,因為在Mac中可執行檔案其實就是可以使用普通文稿去生成,暫時無解;
    • 在vite構建工具中,如果檔案放到了assets中,打包之後的檔案會帶上hash,導致場景無法預覽,如果放在public中又無法使用import,巧妙的解決方法:把所有需要放在assets中的打包成一個壓縮包,單獨匯入這個壓縮包,再把它解壓,最終合併到zip範例中去;
    • ...

02.file-saver

下載的話,我也推薦一個好用的庫,file-saver原始碼連結。下載檔案其實很簡單,但是如果有非常好用、穩定的庫,那直接用就得了,不用自己寫。

在早期,關於檔案的操作,我都是交給後端來處理,我調介面。但現在不一樣,這兩個庫給了我無限的想象空間,很多東西我可以在前端去組裝去做,然後再統一給到後端。

10.生成預覽圖 preview.jpg


前面最核心都做完了,這個小圖片豈能難道我?果不其然!!!

進入場景前會先載入預覽圖,等場景圖片載入完後才顯示原圖,這樣可以提升場景載入速度並且不會耗費太多資源。

預覽圖如下,是一張解析度為256x1536的長條圖。它生成的方式是立方體的六個面,按照「左、前、右、後、上、下」,自上而下拼接成。

我就是這樣去合成的,我測試的時候把場景image節點隱藏掉,僅載入預覽圖,發現沒問題很完美。

錯就錯在我是一個特別細心的人,如下圖,我發現我合成的圖片體積有221kb,而krpano才77kb,體積整整比它大了三倍啊。這裡面到底暗藏了什麼玄機?

通過對比,我們可以直觀的看出來,我的圖片要比krpano清晰的,它的圖片略帶模糊,但是其實觀感並不差,過渡都非常平滑。

那麼我推測,讓圖片變得模糊可以大大降低圖片體積,這跟我們平時壓縮圖片還有點不太一樣,壓縮圖片主要是減少冗餘畫素,壓縮率太高圖片觀感會比較差。

這時候,我又看了組態檔vtour-multries.config

# preview pano settings
preview=true
graypreview=false
previewsmooth=25
previewpath=%OUTPUTPATH%/panos/%BASENAME%.tiles/preview.jpg

其中有一個屬性叫做:previewsmooth

瞬間明白了,krpano是給它做了一個平滑處理。仔細想想,上面已經說了場景的預覽圖是為了提升載入速度和平滑過渡到原圖。那麼,第一預覽圖的體積就不能太大。第二,如果預覽圖沒有做平滑處理的話,載入之後看起來會顆粒感比較嚴重,影響觀感。此刻很想再說一聲Krpano YYDS...

所以,我也需要對預覽圖進行平滑處理。

圖片平滑處理的方式常見的有這幾種:

  • 均值平滑
  • 高斯平滑
  • 中值平滑

通過對比這幾種效果,比較符合的是高斯平滑,其實就是咱們平時所說的高斯模糊

11.縮圖thumb.jpg

krpano已經做到極致了。

krpano的縮圖一般只有17kb左右,但卻如此清晰,觀感也很好。

如果我用高斯模糊的話,會顯得不清晰,可能它應該經過其它的處理。我考慮到縮圖的使用場景,認為沒必要深究縮圖,它的作用僅用來示意。使用我demo切出來的圖,相信你們也看不出差別。

12總結:

01.技術上,我們需要了解:

  1. 核心點在於推理出krpano多解析度切圖的演演算法
  2. canvas 2d
  3. ImageData
  4. web worker
  5. 高斯模糊
  6. 善用jszip
  7. file-saver

02.對於krpano的評價

  1. 我僅僅是實現krpano的部分功能,不難發現krpano做的非常好,很多細節都考慮得很到位,並且自身也做過很多測試;
  2. krpano的價格其實並不貴,一次註冊終身免費,並且我們使用的10年來,它一直在迭代;
  3. ...

03.為什麼我要做這個功能?

  1. 這一定是從使用者體驗出發,從產品出發,從業務中來,再去思考如何與技術結合;
  2. 有點在開篇已經提過了,有一定的使用場景;

04.我為什麼能夠去完成它呢?

  1. 因為這不是一個KPI專案,不是一個公司專案,不是團隊規劃的需求,而是我自己的專案,但它的起因也是源於業務中遇到的問題;
  2. 如果在公司中,一個功能埋頭2天沒有頭緒,那麼大概已經想要放棄了,因為會有期限給你施加壓力。而我自己業餘專案,是每隔一段時間就去想想、看看,一步一步去找規律、求證、驗證、測試,儘量成功,失敗也無所謂;
  3. 做任何事情都需要耐心、沉著冷靜

05.如何還原全景圖?

  1. 這是後面再把它做到krpano-js-tools裡面,敬請期待;
  2. 我的做法不完全沿用現在的做法,會使用 webgl,使用webgl做全景,業界的標杆是貝殼找房