Hive檢視和索引


本章介紹如何建立和管理檢視。根據使用者的需求建立檢視。可以將任何結果集資料儲存為一個檢視。檢視在Hive的用法和SQL檢視用法相同。它是一個標準的RDBMS概念。我們可以在檢視上執行所有DML操作。

建立一個檢視

可以建立一個檢視,在執行SELECT語句的時候。語法如下:

CREATE VIEW [IF NOT EXISTS] view_name [(column_name [COMMENT column_comment], ...) ]
[COMMENT table_comment]
AS SELECT ...

範例

舉個例子來看。假設employee表擁有如下欄位:Id, Name, Salary, Designation 和 Dept。生成一個查詢檢索工資超過30000盧比的員工詳細資訊,我們把結果儲存在一個名為檢視 emp_30000.

+------+--------------+-------------+-------------------+--------+
| ID   | Name         | Salary      | Designation       | Dept   |
+------+--------------+-------------+-------------------+--------+
|1201  | Gopal        | 45000       | Technical manager | TP     |
|1202  | Manisha      | 45000       | Proofreader       | PR     |
|1203  | Masthanvali  | 40000       | Technical writer  | TP     |
|1204  | Krian        | 40000       | Hr Admin          | HR     |
|1205  | Kranthi      | 30000       | Op Admin          | Admin  |
+------+--------------+-------------+-------------------+--------+

下面使用上述業務情景查詢檢索員的工詳細資訊:

hive> CREATE VIEW emp_30000 AS
   > SELECT * FROM employee
   > WHERE salary>30000;

刪除一個檢視

使用下面的語法來刪除檢視:

DROP VIEW view_name

下面的查詢刪除一個名為emp_30000的檢視:

hive> DROP VIEW emp_30000;

建立索引

索引也不過是一個表上的一個特定列的指標。建立索引意味著建立一個表上的一個特定列的指標。它的語法如下:

CREATE INDEX index_name
ON TABLE base_table_name (col_name, ...)
AS 'index.handler.class.name'
[WITH DEFERRED REBUILD]
[IDXPROPERTIES (property_name=property_value, ...)]
[IN TABLE index_table_name]
[PARTITIONED BY (col_name, ...)]
[
   [ ROW FORMAT ...] STORED AS ...
   | STORED BY ...
]
[LOCATION hdfs_path]
[TBLPROPERTIES (...)]

例子

讓我們舉個索引例子。使用之前的欄位 Id, Name, Salary, Designation, 和 Dept建立一個名為index_salary的索引,對employee 表的salary列索引。

下面的查詢建立一個索引:

hive> CREATE INDEX inedx_salary ON TABLE employee(salary)
   > AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';

這是一個指向salary列。如果列被修改,變更使用的索引值儲存。

刪除索引

下面的語法用來刪除索引:

DROP INDEX <index_name> ON <table_name>

下面的查詢刪除名為index_salary索引:

hive> DROP INDEX index_salary ON employee;