2022 学长描述
1. 一个很简单的据估计
2. 算一个决策树
3. Cypher图
4.Hadoop和Spark的区别
2023 真题回忆
1. 大数据分析的定义 说出大数据分析三个层次
2.大数据分析流程 预处理部分包含哪几个步骤
3.Spark核心部件和应用库有哪些 并简要说明功能
4. 主成分分析和因子分析的联系和区别
5.数据仓库那个题
6. 文本大数据的基本内容
7.算据估计和极大似然估计
8.计算马氏距离和欧式距离(马氏是课件的原题 根号1.05和根号20那个)
9.Aprior算法 基本和下面的题目类似
10. 算一个朴素贝叶斯(课件原题 是否去打球我记得)
11.画KD树,第二问是利用Kd树写出判断一个点和这个点最邻近的点的判断过程。
12.图数据分析 社交网络 将Cypher图转化成查询语言
笔记
这个是我当时复习的笔记,有需要的学弟学妹可以查看,由于安全问题,查看文档时候请实名申请,格式:学号+姓名 如果不方便的话 姓名部分可以打最后一个字,谢谢
总结 :
大数据分析我觉得本质就是一种机器学习,这门课主要集中的关注点在于机器学习相关的东西,如果想从事人工智能相关方向的同学可以学习学习,当然大数据的同学如果能够选到深度学习的话建议也去学学相互补充。
虽然除了11题复习的都很充分都写上了,但是11题成为我最大的遗憾,因为真的以为不会考结果他真的考了,希望老师多捞捞吧,所以不要以为什么东西不会考,包括以后的任何考试,只要是在范围的一定要看,复习的一定要全面。
记住一句话 努力什么时候都不晚。算是给我自己的自勉吧。