一、大数据前沿知识及hadoop入门
零基础入门,了解大数据的历史背景及发展方向,掌握hadoop的两种安装配置
二、Hadoop部署进阶
熟练掌握hadoop集群搭建;对Hadoop架构的分布式文件系统HDFS进行深入分析
三、Java基础
了解java程序设计的基本思想,熟练利用eclipse进行简单的java程序设计,熟练使用jar文件,了解mysql等数据库管理系统的原理,了解基于web的程序开发流程
四、MapReduce理论及实战
熟悉MapReduce的工作原理及应用,熟悉基本的MapReduce程序设计,掌握根据大数据分析的目标设计和编写基于mapreduce的项目
五、hadoop+Mahout大数据分析
掌握基于hadoop+mahout的大数据分析方法的使用场景,熟练运用mahout的成熟算法进行特定场景的大数据分析
六、Hbase理论及实战
掌握hbase的数据存储及项目实战、掌握Spark、Hive的安装、配置及使用场景
七、Spark大数据分析
Spark、Hive的安装、配置及使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析
八、大数据学习综合知识储备
统计学:多元统计分析、应用回归
计算机:R、python、SQL、数据分析、机器学习
matlab和mathematica两个软件也是需要掌握的,前者在实际的工程应用和模拟分析上有很大优势,后者则在计算功能和数学模型分析上十分优秀,相互补助可以取长补短。
标签: 恶搞java手机版下载
评论列表
安装、配置及使用场景 七、Spark大数据分析 Spark、Hive的安装、配置及使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析 八、大数据学习综合知识储备 统计学:多元统计分析、应用回归