VLQ & Base64 VLQ 編碼方式的原理及程式碼實現

2022-10-13 21:08:30

VLQ

VLQ (Variable-length quantity)是一種通用的,使用任意位數的二進位制來表示一個任意大的數位的一種編碼方式。

編碼實現: ** 對數位137進行VLQ**編碼,以下為分解步驟:

  1. 將137轉成二進位制形式 —— 10001001
  2. 七位一組做分組,不足的補前導0 —— 0000001 0001001
  3. 最後一組開頭補0,其餘補1(1表示連續位) —— 10000001 00001001.
  4. 最終137的VLQ編碼形式為 —— 10000001 00001001
// 1. 將137轉成二進位制形式 —— 10001001
let binary = (137).toString(2);
// 2. 七位一組做分組,不足的補前導0 —— 0000001 0001001
let padded = binary.padStart(Math.ceil(binary.length / 7) * 7, '0');
// 3. 最後一組開頭補0,其餘補1(1表示連續位) —— 10000001 00001001
let groups = padded.match(/[01]{7}/g);
groups = groups.map((item, index) => (index == groups.length - 1 ? '0' : '1') + item);
let vlqCode = groups.join('');
// 4 最終137的VLQ編碼形式為 —— 10000001 00001001
console.log(vlqCode);

Base64 VLQ

  • Base64 是一種可以把二進位制資料編碼成用 ASCII 表示的一種編碼規則,Base64 VLQ 需要能夠表示負數, 於是規定了需要先把數位變成無符號數, 用最後一位來作為符號標誌位。
  • 一個Base64字元只能表示6bit(2^6)的資料,而第一位表示連續位,Base64 VLQ需要能夠表示負數,因此最後一位用作符合標誌位,真正表示數位的只有中間4位元,因此一個單元表示的範圍是[-15,15],如果超過了就要用連續位了
  • 在Base64 VLQ中,編碼順序是從低位到高位,而在VLQ中,編碼順序是從高位到低位
  • 常見用於專案中sourceMap編碼

編碼實現: ** 對數位137進行Base64 VLQ**編碼,以下為分解步驟:

  1. 將137轉成二進位制形式 10001001,如果是負數需要轉成絕對值 Math.abs
  2. 137是正數,末位符號位補0, 100010010 正數末位補0,負數末位補1
  3. 五位一組做分組,不足的補0, 01000 10010
  4. 將陣列倒序排序 [ '10010', '01000' ] ,低位在前,高位在後
  5. 最後一組開頭補0,其餘補1(1表示連續位),110010 001000
  6. 轉成base64,最終137的Base64 VLQ編碼形式為 —— yI
let base64 = [
    'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P',
    'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f',
    'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v',
    'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/'
];

function encode(num) {
    // 1. 將137轉成二進位制形式  10001001,如果是負數需要轉成絕對值 
    let binary = (Math.abs(num)).toString(2);
    // 2. 137是正數,末位符號位補0, 100010010 正數末位補0,負數末位補1
    binary += num >= 0 ? '0' : '1';
    // 3. 五位一組做分組,不足的補0, 01000 10010
    binary = binary.padStart(Math.ceil(binary.length / 5) * 5, '0');
    // 4. 將陣列倒序排序 [ '10010', '01000' ] 低位在前,高位在後
    let parts = binary.match(/\d{5}/g);
    parts.reverse(); 
    // 5. 最後一組開頭補0,其餘補1, 110010 001000 6個位bit
    parts = parts.map((item, index) => (index == parts.length - 1 ? '0' : '1') + item);
    // 6. 轉成base64
    let chars = [];
    for (let i = 0; i < parts.length; i++) {
        let base64Index = parseInt(parts[i], 2);
        chars.push(base64[base64Index]);
    }
    return chars.join('');
}
let result = encode(137); // yI

線上編碼解碼的網站:http://murzwin.com/base64vlq.html