转载

Hive分区

Hive组织表到分区。它是将一个表到基于分区列，如日期，城市和部门的值相关方式。使用分区，很容易对数据进行部分查询。

表或分区是细分成桶，以提供额外的结构，可以使用更高效的查询的数据。桶的工作是基于表的一些列的散列函数值。

例如，一个名为Tab1表包含雇员数据，如 id, name, dept 和yoj (即加盟年份)。假设需要检索所有在2012年加入，查询搜索整个表所需的信息员工的详细信息。但是，如果用年份分区雇员数据并将其存储在一个单独的文件，它减少了查询处理时间。下面的示例演示如何分区的文件和数据：

下面文件包含employee 数据表。

/tab1/employeedata/file1

 id, name, dept, yoj 1, gopal, TP, 2012 2, kiran, HR, 2012 3, kaleel,SC, 2013 4, Prasanth, SC, 2013

上面的数据被划分成使用年两个文件。

/tab1/employeedata/2012/file2

 1, gopal, TP, 2012 2, kiran, HR, 2012

/tab1/employeedata/2013/file3

 3, kaleel,SC, 2013 4, Prasanth, SC, 2013

添加分区

可以通过添加分区表改变所述表。假设我们有一个表叫employee ，拥有如 Id, Name, Salary, Designation, Dept, 和 yoj等字段。

语法：

 ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec [LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...;  partition_spec: : (p_column = p_col_value, p_column = p_col_value, ...)

以下查询用于将分区添加到employee表。

 hive> ALTER TABLE employee > ADD PARTITION (year=’2013’) > location '/2012/part2012';

重命名分区

此命令的语法如下。

 ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;

以下查询用来命名一个分区：

 hive> ALTER TABLE employee PARTITION (year=’1203’)    > RENAME TO PARTITION (Yoj=’1203’);

删除分区

下面语法用于删除分区：

 ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;

以下查询是用来删除分区：

 hive> ALTER TABLE employee DROP [IF EXISTS]    > PARTITION (year=’1203’);

正文到此结束

所属分类： Hive教程

本文标签： 数据 cat tab 组织 value 时间
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

Hive分区

添加分区

语法：

重命名分区

删除分区

热门推荐

相关文章

Hive教程

说给你听

本文目录

随机标签

书籍教程

近期评论

网站信息

其他链接

关于本站

问题交流