如何在Apache hadoop2.2.0下面部署impala-CSDN论坛

2025-04-28 04:43:03
推荐回答(1个)
回答1:

  安装impala

  这里介绍使用rpm包安装的方式(需有root或sudo权限),基于源码包安装的方式待后续折腾。

  1.2.1 安装前需知

  impala能使用的内存无法超过系统的硬件可用内存(GA版,查询需要的内存如果超出硬件内存,则查询将失败),对内存要求高,典型的硬件内存为:32~48G

  impala(版本0.4)只支持redhat 5.7/centos 5.7或redhat 6.2/centos 6.2以上(好像还要求是64位的,所以建议安装在64位系统上),不支持ubuntu

  假设你已经安装了CDH4(即Hadoop 2.0)

  假设你已经安装了Hive,并配置一个外部数据库(如MySQL)供Hive存储元数据。可通过执行下面的命令来判断Hive是否安装正常
$ hive
hive> show tables;
OK
Time taken: 2.809 seconds

  这里请原谅我没有提到Hadoop和Hive的安装过程,还请尊驾自行搜索。

  Impala不支持的特性:

  1. 查询流数据

  2. 删除数据

  3. 索引(至少当前版本不支持)

  4. YARN集成(至少当前版本不支持)

  5. 全文搜索

  6. 不具有像Hive SerDe的可扩展机制

  7. 不支持线上查询容错,如果查询出错,如机器宕机,Impala将会丢弃本次查询。

  8. 不支持表和列级别的授权

  9. impalad实例之间的传输没有加密

  10. 不支持Hive UFS

  11. beta版尚不支持JDBC,计划GA版支持

  12. 如果我的回答没能帮助您,请继续追问。

  13. 转载,仅供参考。