1.背景介紹
相信很多人手機上都收到過一些行銷簡訊,簡訊裡面有時候會附帶一些網址,如下圖
這些網址往往都是非常短,但是當我們開啟之後,如果你仔細觀察,中間會有跳轉,最終瀏覽器位址列顯示的網址並不是你簡訊裡面看到的網址,這就是短網址!
2.原理和應用
短網址一般是採用一個非常短域名下,路徑引數一般只有3-6個字元組成,非常簡潔!
使用短網址的前提是先生成短網址,主要是採用某種演算法讓一段短的字元對應一個長的字元,比如說從常用的0-9、a-z、A-Z共62個字元中選擇6個字元,那意味著有62的6次方種組合,大概有568億不重複的短網址可用!
伺服器通過路徑引數查詢到真實的長網址,然後使用301/302跳轉到真實的網址即可!
關於跳轉,301 是永久重定向,302 是臨時重定向。短地址一經生成就不會變化,所以用 301 是符合 http 語意的,瀏覽器會記錄跳轉地址,同時對伺服器壓力也會有一定減少。但是如果使用了 301,我們就無法統計到短地址被點選的次數了,如果對資料統計有要求的話,使用302跳轉可能比較好一些!
短網址的主要好處是方便傳輸記憶,特別是在簡訊裡面使用的時候,簡訊對內容字數有限制,還有比如說微博分享也使用了短網址!
3.市面現有案例
目前市面上有很多免費的短連結服務,功能基本上都一樣,也沒有什麼限制!
(1)百度的短連結(dwz.cn/),百度不僅僅提供了網頁入口,也提供了介面和開發文件,簡單易用!
(2)新浪的短連結(sina.lt/),目前僅提供網頁入口,未發現介面服務!
(3)淘寶的短連結(tb.am/),目前僅提供網頁入口,未發現介面服務!
市面還有很多其它的小的公司提供短連結服務,有些是部分免費,有些短連結是有效期的,這裡不一一介紹!
4.常用演算法
網上比較流行的演算法有進位制演算法、摘要(Hash)演算法、亂數演算法,下面簡單介紹一下:
一.進位制演算法
這個演算法網上也有叫作自增序列演算法,特點就是永不重複,設定 id 自增,一個 10進位制 id 對應一個62進位制的數值,1對1,也就不會出現重複的情況,這個利用的就是低進位制轉化為高進位制時,字元數會減少的特性。
計算機中常見的進位制有2進位制,8進位制,10進位制,16進位制,進位制越大,能夠表示的數越大,佔用的字數也越少。下面舉個例:
10進位制的1000,在8進位制裡面是1750,在16進位制裡面就是3E8,那在62進位制裡面呢?有人說,計算機裡面沒有62進位制。。。雖然沒有,但是我們可以造一個,進位制的轉換演算法是固定的,最常見的就是「除基取餘法」!
我們假設62進位制的字元序列為 0-9a-zA-Z,順序可以打亂,但是應該固定下來,是一個從0角標開始的到61的陣列,我們暫且稱之為字母表!
====> 1000/62 = 16,餘8
====> 16/62 = 0,餘16
餘數得到的數位是16、8,然後找到字母表裡面角標為16和8的字元拼起來,就是g8,非常短,只有2位數!假如說我們想至少產生6位字元,那麼我們可以從一個比較大的數位開始,具體可以看下圖:
1位 62 0 - 61 2位 3844 62 - 3843 3位 約 23萬 3844 - 238327 4位元 約 1400萬 238328 - 14776335 5位 約 9.1億 14776336 - 916132831 6位 約 568億 916132832 - 56800235583 複製程式碼
二.Hash演算法
第一種方式:
簡單的對長連結進行加鹽md5,會生成一個32位元的字串,隨機從裡面取6個字元,或者簡單粗暴取最後6位,但是md5只包含0-9A-Fa-f,比字母表的裡面字元還少,衝突幾率更大!
第二種方式:
1.將長網址 md5 生成 32 位簽名串,分為 4 段, 每段 8 個位元組
2.對這四段迴圈處理, 取 8 個位元組, 將他看成 16 進位制串與 0x3fffffff(30位1) 與操作, 即超過 30 位的忽略處理
3.這 30 位分成 6 段, 每 5 位的數位作為字母表的索引取得特定字元, 依次進行獲得 6 位字串
4.總的 md5 串可以獲得 4 個 6 位串,取裡面的任意一個就可作為這個長 url 的短 url 地址
生成的方式更加複雜,重複的幾率低,但是依然會出現衝突!
三.亂數演算法
這個更簡單,直接對這個62個字元陣列做隨機選擇,選擇其中6個字元當作短連結碼,簡單易用,但是難免會出現重複衝突!
四.演算法對比
第一種演算法只要解決自增id問題就可以避免衝突,自增id可以採用資料庫自增主鍵,每次生成短碼只需一次資料庫操作(insert操作,獲取主鍵id,然後算出短碼即可)
第二種和第三種演算法其實都差不多,都是依賴於程式隨機,容易出現衝突,這就需要每次在插入資料庫的時候判重,效率低一些!
5.安全
短連結雖然方便了傳輸和記憶,但是由於連結組成的字元個數少,更容易被爆破、猜測攻擊,攻擊者可以輕鬆遍歷所有字元組成的連結!
所以不建議使用短連結傳送具有私密性的網址,比如說重置密碼連結,對一些許可權、敏感資訊的連結要做好二次鑑權!
推薦教學:Laravel實戰開發短鏈生成器視訊教學
以上就是PHP如何實現短網址的詳細內容,更多請關注TW511.COM其它相關文章!