试题说明
考题数量:共60道
考试时间:120 分钟
试题种类:单选题和多选题
1.大数据技术的基础理论(7道题)
掌握GB/T 35589-2017 大数据技术参考模型
掌握Lambda架构的特点
掌握CAP理论与Base原则的含义
了解大数据开发技术的发展现状与趋势
2、大数据开发流程(15道题)
掌握大数据开发(数据科学)的流程及主要活动;
了解大数据开发中常用的机器学习知识;
了解大数据开发中常用的统计学知识;
了解大数据开发中常用的数据可视化知识;
3、数据采集与加工(15道题)
了解物联网技术的主要特点
了解数据化与量化自我的特点
掌握规整数据(Tidy Data)的特点
掌握数据预处理的常用方法
掌握数据探索型分析(EDA)的特点
4.大数据分析、存储、维护与管理(15道题)
掌握大数据分析的主要类型及内在联系
掌握Analytics1.0、Analytics2.0和Analytics3.0的区别
掌握Google的GFS、 Hadoop的HDFs及其特征
掌握Google的Bigtable、Hadoop的HBase及其特征
掌握常用数据可视化方法
5.大数据开发的应用(8道题)
基于Python的大数据开发常用包及其特征
基于Tableau的数据可视化方法
大数据开发中常见错误及其应对方法
