过程中,系统被训练以进行预测。 数据可以是图像、声音、书面文本、网络、GPS位置、表格或任何想到的表示。无论如何,核心思想是机器学习模型从数据中学习。鉴于 21世纪以人工智能形式出现的绝大多数大规模采用的颠覆性技术实际上都使用机器学习方法,因此这一概念在今天很重要。但是这些系统是如何学习的呢? 有不同的学习范式。最常用的一种是监督学习,其中系统接受由注释或标签引导的训练过程。这个想法很简单:我们尝试将数据的特征或模式与相应的标签相关联。也就是说,对数据进行分
析以寻找允许一个类别与另一类别分开的独特模式。举个例子:假设我们要训练一个系统,让它可以告诉我们图像的内容是对应于狗还是猫。在监督学习范式下,我们需要一个由狗 购买企业电子邮件地址列表 和猫的图像组成的数据库,每个图像都有相应的标签。在训练过程中,算法将获取这些图像并开始从中进行预测,将特征(图像信息)与标签相关联。以一种简化的方式,我们可以认为这些特征是由图像中存在的不同图案赋予的,例如颜色、亮度、腿的数量、身体的大小或耳朵的形状。如果我们停下来思考这些特征,有些特征会比
其他特征更有助于区分狗和猫。例如,腿的数量似乎不是区分它们的有用特征;但是,身体的大小可以。这个想法是,通过训练,系统学会将这些特征中的模式与相应的类别相关联。起初,这些联想肯定是不正确的;但随着训练过程的进展,模型会调整并提高其在分配任务上的表现。腿的数量、身体的大小或耳朵的形状。如果我们停下来思考这些特征,有些特征会比其他特征更有