
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
机器学习技术的应用是程序员在学习人工智能的时候需要重点掌握的一个软件编程开发知识点,而本文我们就通过案例分析来简单了解一席,机器学习都需要掌握哪些技术。
半监督学习(SSL)是一种机器学习技术,其中任务是从一个小的带标签的数据集和相对较大的未带标签的数据中学习得到的。SSL的目标是要比单独使用有标记数据训练的监督学习技术得到更好的结果。
监督学习是机器学习中流行的模式,在这种模式中,可以通过标签的形式获得完整的监督。整个数据集都有标记,即一个标签与训练数据集中的每个样本相关联。机器学习模型使用这个标签数据集训练,并期望对新的样本预测一个标签。
监督学习主要包括两类任务:分类和回归。分类问题要求算法预测一个离散值,而回归任务是需要从输入变量(X)逼近一个映射函数(f)到连续输出变量(y)。
手写数字识别使用(MNIST)数据集。每个样本都有一个图像和对应的数字作为标签。任务是学习从图像中预测标签(即数字)。
每条记录都包含一个评论和一个相应的标签(正面的或负面的)。这里的任务是预测给定评论的情绪。
房价预测是一个回归任务,其中标签(房价)是一个连续变量。
在无监督学习中,没有标记数据可用。训练数据集包含样本,但没有特定的期望结果或标签。机器学习模型试图通过提取有用的特征并对其进行分析来自动地在数据中找到结构。像聚类、异常检测、关联等任务属于无监督学习。
聚类是将数据集划分为多个簇,使同一簇中的数据点与同一簇中的其他数据点更相似,与其他簇中的数据点不相似。
半监督式学习(SSL),正如其名称所示,介于两个极端之间(监督式是指整个数据集被标记,而非监督式是指没有标记)。半监督学习任务具有一个标记和一个未标记的数据集。它使用未标记的数据来获得对数据结构的更多理解。通常,SSL使用小的带标签数据集和较大的未带标签数据集来进行学习。
我们的目标是学习一个预测器来预测未来的测试数据,这个预测器比单独从有标记的训练数据中学习的预测器更好。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。