一晃又两个月没有更新了,终于我们不放假大学也放假了,车牌也考完了,博客也可以开始正常更新了。在上学期末,我完成了一些有意思的小工程,下面我就为大家分享我的工程,以供交流学习。 实验要求 项目背景 校园卡管理系统是应用于校园卡管系统和应用的软件,该软件在程序设计中有它不可取代的地位, 校园卡给广大师生的衣食住行带来了极大的便利。 而在这门程序设计课程中,希望同学们为校园卡功能管理系统设计一...
在这一篇BLOG我想向你介绍一种机器学习的应用实例或者说是机器学习在一种叫照片OCR技术中的应用历史,我想介绍这部分内容的原因主要有以下三个:第一我想向你展示一个复杂的机器学习系统是如何被构建起来的;第二我想介绍一下机器学习流水线(machine learning pipeline)的有关概念;最后我也想通过介绍照片OCR问题的机会来告诉你机器学习的诸多有意思的想法和理念。 照片OCR问...
在这篇BLOG中,我们将继续聚焦大数据机器学习,看看在线学习和并行计算这两种全新的优化手段。 在线学习 在这一部分我们将会一起学习一种新的大规模的机器学习机制叫做在线学习。这种在线学习机制让我们可以模型化问题在拥有连续一波数据或连续的数据流涌进来时从中学习模型。 现如今许多大型网站或者许多大型网络公司都在使用不同版本的在线学习机制算法从大批的涌入又离开网站的用户身上进行学习。特别要提及的...
在接下来的两篇BLOG里,我们会一起探讨大规模的机器学习的相关问题。所谓大规模机器学习就是用来处理大数据的算法,如果我们看近5到10年的机器学习的历史,你会发现现在的学习算法比5年前的好很多其中的重要原因之一就是我们现在拥有很多可以训练算法的数据。所以巧妙地运用大量数据可以让我们的算法事半功倍。 大规模机器学习 为什么我们喜欢用大的数据集呢? 我们已经知道得到一个高效的机器学习系统的最好...
在之前的BLOG中,我们学习了一种简单易用的基于内容的推荐系统算法,但上述算法也存在着一些局限性。所以这篇BLOG,就让我们来看一种更全能的推荐系统算法——协同过滤算法(collaborative filtering)吧! 协同过滤 说起协同过滤算法,有一个值得一提的特点,那就是它能实现对特征的学习。也就是说这种算法能够自行学习所要使用的特征。 我们还是通过例子来说明吧。对于我们之前的例...