Hive組織表到分割區。它是將一個表到基於分割區列,如日期,城市和部門的值相關方式。使用分割區,很容易對資料進行部分查詢。
表或分割區是細分成桶,以提供額外的結構,可以使用更高效的查詢的資料。桶的工作是基於表的一些列的雜湊函式值。
例如,一個名為Tab1表包含雇員資料,如 id, name, dept 和yoj (即加盟年份)。假設需要檢索所有在2012年加入,查詢搜尋整個表所需的資訊員工的詳細資訊。但是,如果用年份分割區雇員資料並將其儲存在一個單獨的檔案,它減少了查詢處理時間。下面的範例演示如何分割區的檔案和資料:
下面檔案包含employee 資料表。
/tab1/employeedata/file1
id, name, dept, yoj 1, gopal, TP, 2012 2, kiran, HR, 2012 3, kaleel,SC, 2013 4, Prasanth, SC, 2013
上面的資料被劃分成使用年兩個檔案。
/tab1/employeedata/2012/file2
1, gopal, TP, 2012 2, kiran, HR, 2012
/tab1/employeedata/2013/file3
3, kaleel,SC, 2013 4, Prasanth, SC, 2013
可以通過新增分割區表改變所述表。假設我們有一個表叫employee ,擁有如 Id, Name, Salary, Designation, Dept, 和 yoj等欄位。
ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec [LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...; partition_spec: : (p_column = p_col_value, p_column = p_col_value, ...)
以下查詢用於將分割區新增到employee表。
hive> ALTER TABLE employee > ADD PARTITION (year=’2013’) > location '/2012/part2012';
此命令的語法如下。
ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;
以下查詢用來命名一個分割區:
hive> ALTER TABLE employee PARTITION (year=’1203’) > RENAME TO PARTITION (Yoj=’1203’);
下面語法用於刪除分割區:
ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;
以下查詢是用來刪除分割區:
hive> ALTER TABLE employee DROP [IF EXISTS] > PARTITION (year=’1203’);