大数据导论、大数据分析与计算、云计算(大数据培训)
1.大数据导论与大数据可视化
(1)大数据及其思维变革
大数据与大数据时代
大数据时代的思维变革
大数据促进社会发展
支撑大数据的技术
(2)大数据可视化
数据可视化之美
数据可视化工具
数据引导可视化设计
Tableau安装、注册与应用初步
Tableau数据可视化设计技术
2.大数据计算技术:体系、平台、模型与计算架构
大数据计算体系:基础平台、存储架构、计算模型、应用系统
大数据计算技术两条主线:Google商业产品 vs. Hadoop开源技术
大数据计算模式:从MapReduce批处理、图并行计算框架、交互式处理、到Spark内存计算
MapReduce计算架构:分布式并行计算模型、算法原理、数据格式、编程模型、软件架构:JobTracker模式 vs. YARN模式
Spark计算架构:内存计算关键技术:数据压缩存储、列存储结构、数据表分区;内存管理机制;RDD数据模型;作业模与任务;Spark双层调度模型
课程作业(project)案例:针对大规模数据处理的MapReduce批处理模型与Spark内存模型的计算性能比较