Hive視圖和索引
本章介紹如何創建和管理視圖。根據用戶的需求創建視圖。可以將任何結果集數據保存爲一個視圖。視圖在Hive的用法和SQL視圖用法相同。它是一個標準的RDBMS概念。我們可以在視圖上執行所有DML操作。
創建一個視圖
可以創建一個視圖,在執行SELECT語句的時候。語法如下:
CREATE VIEW [IF NOT EXISTS] view_name [(column_name [COMMENT column_comment], ...) ]
[COMMENT table_comment]
AS SELECT ...
示例
舉個例子來看。假設employee表擁有如下字段:Id, Name, Salary, Designation 和 Dept。生成一個查詢檢索工資超過30000盧比的員工詳細信息,我們把結果存儲在一個名爲視圖 emp_30000.
+------+--------------+-------------+-------------------+--------+
| ID | Name | Salary | Designation | Dept |
+------+--------------+-------------+-------------------+--------+
|1201 | Gopal | 45000 | Technical manager | TP |
|1202 | Manisha | 45000 | Proofreader | PR |
|1203 | Masthanvali | 40000 | Technical writer | TP |
|1204 | Krian | 40000 | Hr Admin | HR |
|1205 | Kranthi | 30000 | Op Admin | Admin |
+------+--------------+-------------+-------------------+--------+
下面使用上述業務情景查詢檢索員的工詳細信息:
hive> CREATE VIEW emp_30000 AS
SELECT * FROM employee
WHERE salary>30000;
刪除一個視圖
使用下面的語法來刪除視圖:
DROP VIEW view_name
下面的查詢刪除一個名爲emp_30000的視圖:
hive> DROP VIEW emp_30000;
創建索引
索引也不過是一個表上的一個特定列的指針。創建索引意味着創建一個表上的一個特定列的指針。它的語法如下:
CREATE INDEX index_name
ON TABLE base_table_name (col_name, ...)
AS 'index.handler.class.name'
[WITH DEFERRED REBUILD]
[IDXPROPERTIES (property_name=property_value, ...)]
[IN TABLE index_table_name]
[PARTITIONED BY (col_name, ...)]
[
[ ROW FORMAT ...] STORED AS ...
| STORED BY ...
]
[LOCATION hdfs_path]
[TBLPROPERTIES (...)]
例子
讓我們舉個索引例子。使用之前的字段 Id, Name, Salary, Designation, 和 Dept創建一個名爲index_salary的索引,對employee 表的salary列索引。
下面的查詢創建一個索引:
hive> CREATE INDEX inedx_salary ON TABLE employee(salary)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';
這是一個指向salary列。如果列被修改,變更使用的索引值存儲。
刪除索引
下面的語法用來刪除索引:
DROP INDEX <index_name> ON <table_name>
下面的查詢刪除名爲index_salary索引:
hive> DROP INDEX index_salary ON employee;