SQL視窗函數詳解之排名視窗函數的使用

2022-09-08 18:00:29
本篇文章給大家帶來了關於的相關知識,其中主要介紹了SQL Server主鍵約束(PRIMARY KEY),主鍵是唯一標識表中每一行的一列或一組列,文章圍繞主題展開詳情,下面一起來看一下,希望對大家有幫助。

千萬級資料並行如何處理?進入學習

推薦學習:《》

關於視窗函數的基礎,請看文章SQL視窗函數

取值視窗函數可以用於返回視窗內指定位置的資料行。常見的取值視窗函數如下:

LAG函數可以返回視窗內當前行之前的第N行資料。LEAD函數可以返回視窗內當前行之後的第N行資料。FIRST_VALUE函數可以返回視窗內第一行資料。LAST_VALUE函數可以返回視窗內最後一行資料。NTH_VALUE函數可以返回視窗內第N行資料。

其中,LAG函數和LEAD函數不支援動態的視窗大小,它們以整個分割區作為分析的視窗。

案例分析

案例使用的範例表

下面的查詢中會用到一張表,sales_monthly表中儲存了商品銷量資訊,product表示產品名稱,ym表示年月,amount表示銷售金額(元)。

以下是該表中的部分資料:

這個表的初始化指令碼可以在文章底部獲取。

1.環比分析

環比增長指的是本期資料與上期資料相比的增長,例如,產品2019年6月的銷售額與2019年5月的銷售額相比增加的部分。

以下語句統計了各種產品每個月的環比增長率:

SELECT s.product AS "產品", s.ym AS "年月", s.amount AS "銷售額",
 ( 
    (s.amount - LAG(s.amount,1) OVER (PARTITION BY product ORDER BY s.ym))/
    LAG(s.amount,1) OVER (PARTITION BY product ORDER BY s.ym)
 ) * 100 AS "環比增長率(%)"
FROM sales_monthly s
ORDER BY s.product,s.ym

其中,LAG(amount,1)表示獲取上一期的銷售額,PARTITION BY選項表示按照產品分割區,ORDER BY選項表示按照月份進行排序。

當前月份的銷售額amount減去上一期的銷售額,再除以上一期的銷售額,就是環比增長率。

該查詢返回的結果如下:

2018年1月是第一期,因此其環比增長率為空。

「桔子」2018年2月的環比增長率約為0.2856%((10183-10154)/10154×100),依此類推。

2.同比分析

同比增長指的是本期資料與上一年度或歷史同期相比的增長,例如,產品2019年6月的銷售額與2018年6月的銷售額相比增加的部分。

以下語句統計了各種產品每個月的同比增長率:

SELECT s.product AS "產品", s.ym AS "年月", s.amount AS "銷售額",
 ( 
    (s.amount - LAG(s.amount,12) OVER (PARTITION BY product ORDER BY s.ym))/
    LAG(s.amount,12) OVER (PARTITION BY product ORDER BY s.ym)
 ) * 100 AS "同比增長率(%)"
FROM sales_monthly s
ORDER BY s.product,s.ym

其中,LAG(amount,12)表示當前月份之前第12期的銷售額,也就是去年同月份的銷售額。

PARTITION BY選項表示按照產品分割區,ORDER BY選項表示按照月份進行排序。

當前月份的銷售額amount減去去年同期的銷售額,再除以去年同期的銷售額,就是同比增長率。

該查詢返回的結果如下:

2018年的12期資料都沒有對應的同比增長率,「桔子」2019年1月的同比增長率約為9.3067%((11099-10154)/10154×100),依此類推。

提示:LEAD函數與LAG函數的使用方法類似,不過它的返回結果是當前行之後的第N行資料。

3.複合增長率

複合增長率是第N期的資料除以第一期的基準資料,然後開N-1次方再減去1得到的結果。

假如2018年的產品銷售額為10000,2019年的產品銷售額為12500,2020年的產品銷售額為15000。那麼這兩年的複合增長率的計算方式如下:

以年度為單位計算的複合增長率被稱為年均複合增長率,以月度為單位計算的複合增長率被稱為月均複合增長率

以下查詢統計了自2018年1月以來不同產品的月均銷售額複合增長率:

WITH s (product,ym,amount,first_amount,num) AS (
  SELECT m.product, m.ym, m.amount,
  FIRST_VALUE(m.amount) OVER (PARTITION BY m.product ORDER BY m.ym),
  ROW_NUMBER() OVER (PARTITION BY m.product ORDER BY m.ym)
  FROM sales_monthly m
)
 
SELECT product AS "產品", ym AS "年月",amount AS "銷售額",
       (POWER( amount/first_amount, 1.0/NULLIF(num-1,0)) -1)*100 AS "月均複合增長率(%)"
FROM s
ORDER BY product, ym

首先定義了一個通用表表示式,其中FIRST_VALUE(amount)返回了第一期(201801)的銷售額,ROW_NUMBER函數返回了每一期的編號。

主查詢中的POWER函數用於執行開方運算,NULLIF函數用於處理第一期資料的除零錯誤,常數1.0用於避免由整數除法所導致的精度丟失問題。

該查詢返回的結果如下:

2018年1月是第一期,因此其產品月均銷售額複合增長率為空。

「桔子」2018年2月的月均銷售額複合增長率等於它的環比增長率,2018年3月的月均銷售額複合增長率等於0.4471%,依此類推。

4.不同產品最高和最低銷售額

以下語句統計了不同產品最低銷售額、最高銷售額以及第三高銷售額所在的月份:

  SELECT product AS "產品", ym AS "年月",amount AS "銷售額",
  
         FIRST_VALUE(m.ym) OVER (
           PARTITION BY m.product ORDER BY m.amount DESC
           ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
         ) AS "最高銷售額月份",
         
         LAST_VALUE(m.ym) OVER (
           PARTITION BY m.product ORDER BY m.amount DESC
           ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
         ) AS "最低銷售額月份",
         
         NTH_VALUE(m.ym,3) OVER (
           PARTITION BY m.product ORDER BY m.amount DESC
           ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
         ) AS "第三高銷售額月份"
 
  FROM sales_monthly m
  ORDER BY product, ym;

三個視窗函數的OVER子句相同,PARTITION BY選項表示按照產品進行分割區,ORDER BY選項表示按照銷售額從高到低排序。

以上三個函數的預設視窗都是從分割區的第一行到當前行,因此我們將視窗擴充套件到了整個分割區。

該查詢返回的結果如下:

「桔子」的最高銷售額出現在2019年6月,最低銷售額出現在2018年1月,第三高銷售額出現在2019年4月。

範例表和指令碼

-- 建立銷量表sales_monthly
-- product表示產品名稱,ym表示年月,amount表示銷售金額(元)
CREATE TABLE sales_monthly(product VARCHAR(20), ym VARCHAR(10), amount NUMERIC(10, 2));
 
-- 生成測試資料
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201801',10159.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201802',10211.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201803',10247.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201804',10376.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201805',10400.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201806',10565.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201807',10613.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201808',10696.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201809',10751.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201810',10842.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201811',10900.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201812',10972.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201901',11155.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201902',11202.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201903',11260.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201904',11341.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201905',11459.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('蘋果','201906',11560.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201801',10138.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201802',10194.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201803',10328.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201804',10322.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201805',10481.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201806',10502.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201807',10589.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201808',10681.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201809',10798.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201810',10829.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201811',10913.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201812',11056.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201901',11161.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201902',11173.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201903',11288.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201904',11408.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201905',11469.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('香蕉','201906',11528.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201801',10154.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201802',10183.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201803',10245.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201804',10325.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201805',10465.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201806',10505.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201807',10578.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201808',10680.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201809',10788.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201810',10838.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201811',10942.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201812',10988.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201901',11099.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201902',11181.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201903',11302.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201904',11327.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201905',11423.00);
INSERT INTO sales_monthly (product,ym,amount) VALUES ('桔子','201906',11524.00);

推薦學習:《》

以上就是SQL視窗函數詳解之排名視窗函數的使用的詳細內容,更多請關注TW511.COM其它相關文章!