spark1.2.1实现读取hbase的数据后怎么实现实时查询

2025-03-04 05:49:15
推荐回答(1个)
回答1:

  调用parallelize函数直接从集合中获取数据,并存入RDD中;Java版本如下:
  1 JavaRDD myRDD = sc.parallelize(Arrays.asList(1,2,3));
  Scala版本如下:
  1 val myRDD= sc.parallelize(List(1,2,3))
  这种方式很简单,很容易就可以将一个集合中的数据变成RDD的初始化值;更常见的是(2)、从文本中读取数据到RDD中,这个文本可以是纯文本文件、可以是sequence文件;可以存放在本地(file://)、可以存放在HDFS(hdfs://)上,还可以存放在S3上。其实对文件来说,Spark支持Hadoop所支持的所有文件类型和文件存放位置。