在之前的BLOG里,我们学习了无监督学习的聚类算法。在之后的几篇BLOG中,我们将学习第二种无监督学习问题——降维(dimensionality reduction),顾名思义就是降低我们数据集的维度。这篇BLOG,就让我们来看看看看降维吧。 降维 首先先让我们通过一个例子来具体看看什么是降维。 假如我们有一个有很多很多很多特征变量的数据集: 其中有两个特征量,一个某个物体的长度以厘米...
在在之前的BLOG里,我们一同学习了非监督学习的一种主流聚类算法——K-Means算法,在这篇BLOG中,就让我们来一同学习K-Means算法的实现细节吧。 优化目标 在大多数我们已经学到的监督学习算法中,每一个学习算法算法都有一个优化目标函数或者有某个代价函数需要通过算法进行最小化。事实上K-Means算法也有一个优化目标函数或者所是需要最小化的代价函数。在这一部分,就让我们一同学习K...
在之前的BLOG中,我们完成了对监督学习算法的学习,从这篇BLOG开始就让我们迈入无监督学习的殿堂,开始学习无监督学习的相关算法吧! 无监督学习 首先,让我们来复习一下什么是无监督学习?所谓无监督学习,就是我们要从未标记的数据中进行学习, 而不是从已标记的数据中进行学习。现在我想将无监督学习算法与监督学习算法做个对照。 下图是一个典型的监督学习例子: 在监督学习中,我们有一组附标记的训...
在之前的BLOG中,我们学习了SVM的实现原理和让SVM如虎添翼的高斯核函数,在这篇BLOG里,就让我们来看看SVM的实现细节吧。 软件的选择 在之前的BLOG中,我们在比较抽象的层面上讨论了支持向量机 SVM 。在这一部分我们来看看为了运行或者说使用 SVM,我们实际上需要做什么。 支持向量机算法是一个特定的优化问题,其优化目的就是最小化如下代价函数: 但是就如我在之前的BLOG中简...
在之前的BLOG中,我们介绍了支持向量机SVM。在许多运用到SVM的实际问题中,我们往往需要另一个高效的工具来加快运行效率,而这个工具就是我们今天要讲的核函数。 高斯核函数 在之前的BLOG里,我们一起学习了SVM-支持向量机,但是在复杂的非线性拟合的时候,使用多项式去拟合往往效率十分低下,所以现在,就让我们一同学习"kernels(核函数)",来达到简化计算过程的目...