机器学习入门 Scikit-learn实现经典小案例
- 第1章 机器学习概述
本章讲述了机器学习的基本概念,本门课的内容,以及在本门课中使用的一些工具安装方法和基本使用方法。
- 1-1 机器学习-导学
- 1-2 概述
- 1-3 本门课的内容
- 1-4 IPython Notebook介绍
- 1-5 python 基本语法
- 1-6 条件和循环语句
- 1-7 Python中的函数
-
第2章 回归模型—理论
本章讲述了回归模型的基本原理和算法,并结合回归介绍了交叉验证的方法。
- 2-1 课前须知。
- 2-2 线性回归概述
- 2-3 预测房价
- 2-4 线性回归
- 2-5 加入更高阶的因素
- 2-6 通过训练-测试分离来评估过拟合
- 2-7 训练测试曲线
- 2-8 加入新的特征
- 2-9 其他回归示例
- 2-10 回归总结
-
第3章 回归模型—房价预测进阶案例
通过一个预测房价的实际例子来展示了如何实际的构建和应用回归模型。
- 3-1 进阶案例介绍
- 3-2 探索房屋数据集
- 3-3 可视化数据集的特征
- 3-4 实现回归模型
- 3-5 应用线性回归模型
- 3-6 使用sklearn来构建线性回归模型
- 3-7 评估线性回归模型
- 3-8 MSE和R2评分
- 3-9 多项式拟合
-
第4章 分类模型—理论
本章讲述了分类模型的基本原理和算法,并介绍了一些评估分类器好坏的方法。
- 4-1 分类-分析情感
- 4-2 从主题预测情感
- 4-3 分类器应用
- 4-4 线性分类器
- 4-5 决策边界
- 4-6 训练和评估分类器
- 4-7 什么是好的精度
- 4-8 混淆矩阵
- 4-9 学习曲线
- 4-10 类别概率
- 4-11 分类总结
-
第5章 分类模型—情感分析进阶案例
通过一个情感分析的实际例子来展示了如何实际的构建和应用分类模型。
- 5-1 情感分析进阶案例-读取数据
- 5-2 情感分析进阶案例-TFIDF表示
- 5-3 情感分析进阶案例 – 文本预处理
- 5-4 情感分析进阶案例 – 分词
- 5-5 情感分析进阶案例 – 去除停用词
- 5-6 情感分析进阶案例 – 构建分类器.mp4
-
第6章 聚类和相似度模型—理论
本章讲述了聚类和基于相似度模型的基本原理和算法,并且介绍了文本分析中最重要的一种表示方式TF-IDF。
- 6-1 聚类和相似度-文档检索
- 6-2 检索感兴趣的文档
- 6-3 用于测量相似度的单词计数表示
- 6-4 应用TF-IDF对于重要单词进行优先级排序
- 6-5 TF-IDFf文档表示
- 6-6 检索相似的文档
- 6-7 文档聚类
- 6-8 聚类介绍
- 6-9 k-均值
- 6-10 其他例子
- 6-11 聚类和相似度总结
-
第7章 聚类和相似度模型—维基百科人物相似度案例
通过一个维基百科中的文本分析实际例子来展示了如何实际的构建和应用聚类和相似度模型。
- 7-1 使用pandas来读取维基百科人物数据集
- 7-2 使用sklearn来进行词袋模型表示
- 7-3 使用skearn来进行tfidf表示和相似度计算
-
第8章 推荐系统—理论
本章介绍了推荐系统的基本原理和方法,具体介绍常用的利用协同过滤和矩阵分解来构建推荐系统的方法,并且还介绍了如何来处理冷启动的情况。
- 8-1 推荐商品
- 8-2 我们在哪能见到推荐系统
- 8-3 推荐的分类模型
- 8-4 协同过滤
- 8-5 流行物品的影响
- 8-6 正规化同现矩阵
- 8-7 矩阵补全问题
- 8-8 通过用户和物品的特征进行推荐
- 8-9 利用矩阵形式预测
- 8-10 通过矩阵分解发现隐藏结构
- 8-11 特征+矩阵分解
- 8-12 推荐系统的性能度量
- 8-13 最优推荐
- 8-14 准确率-召回率曲线
- 8-15 推荐系统总结
-
第9章 推荐系统—构建推荐系统案例
通过一个小型的基于用户电影评分推荐系统的实践案例结束课程
- 9-1 读取和探索推荐数据
- 9-2 将样本分成训练集和验证集
- 9-3 基于用户和商品的推荐
- 9-4 推荐结果评估
- 9-5 基于SVD的推荐
-
第10章 深度学习—理论
本章主要对深度学习进行了一个入门的介绍,讲述了在图像检索中运用到的深度学习理论和算法,然后引申到利用深度特征的迁移学习。
- 10-1 深度学习:图像搜索
- 10-2 神经网络
- 10-3 深度学习在计算机视觉中的应用。
- 10-4 深度学习的性能
- 10-5 计算机视觉中的深度学习
- 10-6 深度学习的挑战
- 10-7 迁移学习
- 10-8 深度学习总结
-
第11章 神经网络—案例部分
利用神经网络来计算XOR
- 11-1 神经网络拟合XOR函数
- 11-2 利用神经网络进行手写识别
-
第12章 结尾章
本章是本门课程的最后一章,主要讲述了如何部署机器学习服务,和机器学习以后的发展方向,还有一些机遇和挑战。
- 12-1 部署机器学习应用
- 12-2 部署之后发生了什么?
- 12-3 机器学习的挑战
- 12-4 课程总结。