本章中主要包括如下内容:

介绍

如果你熟悉基础机器学习, 那你应该知道什么是监督学习. 监督学习是指建立一个基于样本标记的样本学习模型. 比如: 如果我们想建立一个基于各种参数的系统来估计房子的售价, 例如打下, 位置, 等等, 我们首先需要建立一个数据库并标记它们. 我们需要告诉算法哪种参数对应哪种价格. 基于这些数据, 我们的算法将学习如何使用这些输入参数计算房子的价格.

无监督学习则刚好相反. 它们没有标记. 假设有一些数据点, 我们只想将它们分成多个组. 我们完全不知道分组的标准. 所以, 无监督学习算法将尝试以最好的方式将给定数据集分成固定数量的组. 我们会在后续的章节中讨论无监督学习算法. 我们会使用各种 Python 包, 例如: Numpy, scipy, scikit-learn和matplotlib, 在本书中构建各种模型. 如果你使用的是windows系统, 建议使用scipy-stack兼容版本的python. 地址在这里: http://www.scipy.org/install.html. 这些发行版已经包含了所有必需的软件包. 如果使用的是Mac或Ubuntu, 需要手工安装这些包. 以下是相关文档:

学习本书前, 请确保已安装以上软件包.

results matching ""

    No results matching ""