Learning Resources

书籍:

Tinghua Data Mining-LMLPHP

期刊:

Tinghua Data Mining-LMLPHP

业界先驱:

Tinghua Data Mining-LMLPHP

开阔视野,掌握业界最新动态。

工具:

Tinghua Data Mining-LMLPHP

数据挖掘是很多学科的综合体:

Tinghua Data Mining-LMLPHP

甭管叫什么名字,归根到底都是数据挖掘:

Tinghua Data Mining-LMLPHP

Comprehensive Learning:

Tinghua Data Mining-LMLPHP

Learning != Listening

Tinghua Data Mining-LMLPHP

Tinghua Data Mining-LMLPHP

数据

Tinghua Data Mining-LMLPHP

What is Big Data?

Tinghua Data Mining-LMLPHP

Big Data:

Tinghua Data Mining-LMLPHP

Data Mning

Tinghua Data Mining-LMLPHP

Tinghua Data Mining-LMLPHP

Data Integration & Analasis

Tinghua Data Mining-LMLPHP

The Process of Data Mining

Tinghua Data Mining-LMLPHP

DM Techniques -- Classification

Tinghua Data Mining-LMLPHP

Classification Boundaries

Tinghua Data Mining-LMLPHP

Classification -- Overfitting

Tinghua Data Mining-LMLPHP

Confusion Matrix

Tinghua Data Mining-LMLPHP

Receive Operating Charactics

男人 女人 身高

Tinghua Data Mining-LMLPHP

DM Techniques -- Clusting

Tinghua Data Mining-LMLPHP

Hierrachical Clusting

不同层面分组

Tinghua Data Mining-LMLPHP

Association Rule

关联规则

Tinghua Data Mining-LMLPHP

DM Techniques -- Regression

参数和变量之间是线性的 不是说最终的表达式线性的

Tinghua Data Mining-LMLPHP

Overfitting -- Regression

死记硬背

既没有那么简单 也没有那么复杂

Tinghua Data Mining-LMLPHP

Seeing is Knowing

耳听为虚 眼见为实 高维数据直接很难理解 发挥人的知识的储备 主观能动性 领域知识的综合理解能力 可视化 对于用户来说 挖掘出来的东西给 可解释性

Tinghua Data Mining-LMLPHP

Performance Dashborad

Tableau

Tinghua Data Mining-LMLPHP

可视化工具软件

Tinghua Data Mining-LMLPHP

Data Preprocessing

Tinghua Data Mining-LMLPHP

Gabage In Gabage Out

脏数据输入 一定会脏数据输出

预处理很重要 准确性 时效性 完整性

Tinghua Data Mining-LMLPHP

原材料要好 打地基 否则外面再modern也是豆腐渣工程

Privacy Protection

Tinghua Data Mining-LMLPHP

Cloud Computation

Tinghua Data Mining-LMLPHP

买 租 服务器

Tinghua Data Mining-LMLPHP

把软硬件转换成一种服务

Parrelal Compututing

Tinghua Data Mining-LMLPHP

The Big Picture

数据挖掘三要素:数据,模型,算力(支撑平台)

Tinghua Data Mining-LMLPHP

No Free Lunch

分类 聚类 告诉我一个哪一个算法不就行了 不行 没有那么好的事 参数 经验尝试

Tinghua Data Mining-LMLPHP

拿到一个问题,先找简单的,说不定可以,够用就行了。没有必要一味地去追求看起来很复杂或者很高端的算法。

量化交易:克服人内在的性格弱点。更加理性。

Grouping

正相关,负相关,可能存在内在的分组的情形。

Tinghua Data Mining-LMLPHP

看问题要全面

Tinghua Data Mining-LMLPHP

05-11 22:23