监督学习是最常见的学习方式机器学习算法。它使用一个已知的数据集(称为训练数据集)来训练一个具有一组已知输入数据(称为特征)和已知响应的算法,以进行预测。训练数据集包括与期望输出或响应值配对的带标签的输入数据。监督学习算法通过发现特征和输出数据之间的关系来创建模型,然后预测新数据集的响应值。
在应用监督学习之前,无监督学习通常用于发现输入数据中的模式,这些模式建议候选特征,特征工程将其转换为更适合监督学习。除了识别特征外,还需要为培训集中的所有观察确定正确的类别或响应,这是一个非常劳动密集的步骤。半监督学习允许您使用非常有限的标记数据训练模型,从而减少标记工作。
一旦算法经过训练,通常会使用一个未用于训练的测试数据集来预测算法的性能并对其进行验证。为了获得准确的性能结果,训练集和测试集都是“真实性”的良好表示(即,来自生产环境和模型的数据都得到了正确验证)至关重要。
您可以在中培训、验证和调整预测监督学习模型MATLAB®具有深度学习工具箱™和统计和机器学习工具箱™.
监督学习算法
分类:用于分类响应值,其中数据可分为特定类。二元分类模型有两类,多类分类模型有更多类。您可以使用MATLAB的classification Learner应用程序训练分类模型。
该类别的常用分类算法包括:
回归:用于数字连续响应值。回归模型可以很容易地使用回归学习应用程序与MATLAB进行训练,了解如何在这个视频在这个文章.
常见的回归算法包括:
监督学习应用
监督学习在金融应用中用于信用评分算法交易和债券分类;用于肿瘤检测和药物发现的生物学应用;能源应用中的价格和价格负荷预测; 在里面模式识别语音和图像应用;在预测性维护中设备寿命估算.