Python-Real-World-Machine-Learning
前言
本书结构
准备知识以及开源库
第一部分
第一章: 监督学习领域
数据预处理
标签编码
线性回归
计算准确率
模型持久化
创建岭回归
多项式回归
预测房价
计算特征权重
第二章: 构造分类器
构建简单的分类器
创建逻辑回归分类器
创建朴素贝叶斯分类器
拆分数据
使用交叉验证
可视化混淆矩阵
生成报告
根据汽车特性评估
提取学习曲线
估计收入
第三章: 预测建模
使用支持向量机(SVM)构建线性分类器
使用SVM构建非线性分类器
解决类不平衡
置信度检测
寻找最佳超参数
构建事件预测器
估计交通流量
第四章: 聚类(无监督学习)
使用k-means算法聚类数据
使用矢量量化压缩图像
构建均值偏移聚类模型
使用聚集聚类分组数据
评估聚类算法的性能
使用DBSCAN算法自动估计群集数
寻找股票市场数据的模式
构建客户细分模型
第五章: 构建推荐系统
构建数据处理功能组合
构建管道
寻找最近邻
构建k最近邻分类器
构建k-最近邻回归
计算欧氏距离得分
计算Pearson相关系数
在数据集中查找类似的用户
电影推荐
第六章: 文本分析
使用标记化预处理数据
词根
词根归并
使用分块分割文本
建立一个袋子的模型
构建文本分类器
识别性别
分析语句情绪
使用主题建模识别文本中的模式
第七章: 语音识别
第八章: 解析时间序列和顺序数据
第九章: 图像分析
第十章: 人脸识别
第十一章: 深度神经网络
第十二章: 可视化数据
第二部分
第一章: 无监督学习
第二章: 深度信念网络
第三章: 去噪自动编码器
第四章: 卷积神经网络
第五章: 半监督学习
第六章: 文本特征工程
第七章: 特征工程 II
第八章: 合奏方法
第九章: 其他 Python 机器学习工具
第三部分
第一章: 可扩展性
第二章: scikit-learn中的可扩展性
第三章: 快速支持向量机实现
第四章: 神经网络和深度学习
第五章: TensorFlow与深度学习
第六章: 大规模分类与回归树
第七章: 大规模无监督学习
第八章: 分布式环境 Hadoop与Spark
第九章: Spark的实用机器学习
附录
Powered by
GitBook
附录
results matching "
"
No results matching "
"