Twitter 的 snowflake 在分散式生成唯一 UUID 應用還是蠻廣泛的,基於 snowflake 的一些變種的演算法網上也有不少。使用 snowflake 生成 UUID 很多都是在分散式場景下使用,我看了下網上有其中有幾篇 PHP 實現的都沒有考慮到執行緒安全。現在 PHP 有了 Swoole 的鎖和協程的加持,對於我們開發執行緒安全和高並行模擬還是很方便的,這裡用 PHP 結合 Swoole 來學習下實現最簡單的 snowflake(好久沒寫 PHP,感覺沒有 IDE 真寫不了 PHP 了)。
先來看以下 snowflake 的結構:
生成的數值是 64 位,分成 4 個部分:
先貼下程式碼:
<?php class Snowflake { const EPOCH = 1543223810238; // 起始時間戳,毫秒 const SEQUENCE_BITS = 12; //序號部分12位元 const SEQUENCE_MAX = -1 ^ (-1 << self::SEQUENCE_BITS); // 序號最大值 const WORKER_BITS = 10; // 節點部分10位 const WORKER_MAX = -1 ^ (-1 << self::WORKER_BITS); // 節點最大數值 const TIME_SHIFT = self::WORKER_BITS + self::SEQUENCE_BITS; // 時間戳部分左偏移量 const WORKER_SHIFT = self::SEQUENCE_BITS; // 節點部分左偏移量 protected $timestamp; // 上次ID生成時間戳 protected $workerId; // 節點ID protected $sequence; // 序號 protected $lock; // Swoole 互斥鎖 public function __construct($workerId) { if ($workerId < 0 || $workerId > self::WORKER_MAX) { trigger_error("Worker ID 超出範圍"); exit(0); } $this->timestamp = 0; $this->workerId = $workerId; $this->sequence = 0; $this->lock = new swoole_lock(SWOOLE_MUTEX); } /** * 生成ID * @return int */ public function getId() { $this->lock->lock(); // 這裡一定要記得加鎖 $now = $this->now(); if ($this->timestamp == $now) { $this->sequence++; if ($this->sequence > self::SEQUENCE_MAX) { // 當前毫秒內生成的序號已經超出最大範圍,等待下一毫秒重新生成 while ($now <= $this->timestamp) { $now = $this->now(); } } } else { $this->sequence = 0; } $this->timestamp = $now; // 更新ID生時間戳 $id = (($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence; $this->lock->unlock(); //解鎖 return $id; } /** * 獲取當前毫秒 * @return string */ public function now() { return sprintf("%.0f", microtime(true) * 1000); } }
其實邏輯並不複雜,解釋一下程式碼中的位運算:
-1 ^ (-1 << self::SEQUENCE_BITS) 就是-1的二進位制表示為1的二補數,其實等同於 : 2**self::SEQUENCE_BITS - 1
最後部分左移後或運算:
(($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;
這裡主要是對除了第一位符號位以外的三個部分進行左移相應的偏移量使其歸位,並通過或運算重新整合成上面 snowflake 的結構,比如我們用 3 部分 4 位來演示一下該歸並操作:
0000 0000 0010 --左移0位--> 0000 0000 0010 0000 0000 0100 --左移4位元--> 0000 0100 0000 --或操作-->1000 0100 0010 0000 0000 1000 --左移8位元--> 1000 0000 0000
下面借助 Swoole 的協程和 channel 來暴力測試一下,看看生成的 ID 是否會出現重複的狀況:
$snowflake = new Snowflake(1); $chan = new chan(100000); $n = 100000; for ($i = 0; $i < $n; $i++) { go(function () use ($snowflake, $chan) { $id = $snowflake->getId(); $chan->push($id); }); } go(function () use ($chan, $n) { $arr = []; for ($i = 0; $i < $n; $i++) { $id = $chan->pop(); // PHP Swoole的channel一定要寫在go(func)的協程裡面!? if (in_array($id, $arr)) { exit("ID 已存在"); } array_push($arr, $id); } }); $chan->close(); echo "ok";
跑了一下,確實不會出現重複的 ID,對了,我用 Golang 同樣實現了 snowflake 並協程式方式跑了同樣的測試,PHP 的執行時間是大約 12 秒左右,Golang 只需要 1 秒。文章有什麼錯誤還請指正,謝謝。
以上就是PHP實現Snowflake生成分散式唯一ID的詳細內容,更多請關注TW511.COM其它相關文章!