安装impala
这里介绍使用rpm包安装的方式(需有root或sudo权限),基于源码包安装的方式待后续折腾。
1.2.1 安装前需知
impala能使用的内存无法超过系统的硬件可用内存(GA版,查询需要的内存如果超出硬件内存,则查询将失败),对内存要求高,典型的硬件内存为:32~48G
impala(版本0.4)只支持redhat 5.7/centos 5.7或redhat 6.2/centos 6.2以上(好像还要求是64位的,所以建议安装在64位系统上),不支持ubuntu
假设你已经安装了CDH4(即Hadoop 2.0)
假设你已经安装了Hive,并配置一个外部数据库(如MySQL)供Hive存储元数据。可通过执行下面的命令来判断Hive是否安装正常
$ hive
hive> show tables;
OK
Time taken: 2.809 seconds
这里请原谅我没有提到Hadoop和Hive的安装过程,还请尊驾自行搜索。
Impala不支持的特性:
查询流数据
删除数据
索引(至少当前版本不支持)
YARN集成(至少当前版本不支持)
全文搜索
不具有像Hive SerDe的可扩展机制
不支持线上查询容错,如果查询出错,如机器宕机,Impala将会丢弃本次查询。
不支持表和列级别的授权
impalad实例之间的传输没有加密
不支持Hive UFS
beta版尚不支持JDBC,计划GA版支持
如果我的回答没能帮助您,请继续追问。
转载,仅供参考。