Hive映射HBase表的方法

举报
G-washington 发表于 2019/10/12 12:03:03 2019/10/12
【摘要】 HBase比较适合key-value形式的存储和查询。

HBase比较适合key-value形式的存储和查询,对于多条件查询的情况,查询效率基本依赖rowkey的设计。对于实时性要求不高的情况,可以通过Hive进行离线查询。这时需要在Hive中建立一张可以映射到HBase的表以便进行查询。 假设有张HBase的表queryword,设计如下。 | rowkey | s | | - | :-: | -: | | md5(word)[8:-8] + timestamp | word, pv, uv, date | Hive中建立映射的方式如下 create external table queryword (id string, word string, pv string, uv string, date string) stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with serdeproperties ("hbase.columns.mapping"=" :key, s:word, s:pv, s:uv, s:date"); 需要注意的有下面几点 - 表名前需要指明external,告诉Hive这是一个已经存在的外部表 - 通过org.apache.hadoop.hive.hbase.HBaseStorageHandler指定这是HBase里的表 - HBase和Hive中的字段需要一一对应 执行完创建表语句之后就可以在hive里进行查询了


本文转载自异步社区

原文链接:https://www.epubit.com/articleDetails?id=Nde7e5c0a-2c67-4569-af6b-edefee1640eb 

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。