大数据设计的知识面非常广泛,首先得对apache全家桶的技术有概要了解,比如hadoop基础上的hive、hbase、spark、mllib等也包含storm实时处理图数据库titan以及etl常用工具r语言