课程目录
- 第一章 数据挖掘的概念
- 第二章 数据探索
- 2.1 数据探索的意义
- 2.2 确定数据类型
- 2.3 定量数据探索方法和图形化
- 2.4 定性数据探索方法和图形化
- 2.5 变量相关性分析及图形化
- 第三章 数据预处理
- 3.1 变量粗筛选
- 3.2 异常值处理
- 3.3 缺失值处理
- 3.4 分类变量处理
- 3.5 时间变量处理
- 3.6 数据纠偏
- 3.7 平衡抽样
- 3.8 数据标准化
- 3.9 数据集划分
- 第四章 建立模型
- 4.1 监督学习
- 4.2 常见概念
- 4.3 线性模型
- 4.4 树类模型
- 4.5 集成算法
- 4.6 深度学习
- 4.7 自动建模
- 第五章 模型评估
- 5.1 分类模型评估
- 混肴矩阵
- 准确率表
- roc 与 auc
- gini指数 与 ks指标
- lift图
- recall图
- 5.2 回归模型评估
- 模型误差评估
- 残差图
- 结果对照图
- 第六章 模型调优
- 6.1 衍生变量
- 数据分箱
- 特征变量自身变换
- 结合目标变量的变换
- 变量交互
- 比率
- 日期时间变量
- 其他
- 6.2 算法选择和参数调优
- 算法选择
- 参数调优
- 6.3 附录-常见算法参数介绍
- 第七章 综合案例
- 7.1 分类模型案例
- 7.2 回归模型案例