如何让Hadoop结合R语言做统计和大数据分析

2025-04-05 07:13:07
推荐回答(1个)
回答1:

1).RHadoop是一款Hadoop和R语言的结合的产品,由RevolutionAnalytics公司开发,并将代码开源到github社区上面。RHadoop包含三个R包 (rmr,rhdfs,rhbase),分别是对应Hadoop系统架构中的,MapReduce, HDFS, HBase 三个部分。
  2). RHiveRHive是一款通过R语言直接访问Hive的工具包,是由NexR一个韩国公司研发的。
  3). 重写Mahout用R语言重写Mahout的实现也是一种结合的思路,我也做过相关的尝试。
  4).Hadoop调用R
  上面说的都是R如何调用Hadoop,当然我们也可以反相操作,打通JAVA和R的连接通道,让Hadoop调用R的函数。但是,这部分还没有商家做出成形的产品。