神经网络的最大优势也放大了它们最大的弱点
鉴于它们执行的复杂任务,神经网络和深度学习应用程序经常被误认为或与人类智能进行比较。但是,尽管它们表现出非凡的壮举(以及它们从生物学同行那里继承的名称),但神经网络和深度学习算法与人类思维有很大不同。
神经网络与其训练数据一样好。你提供给神经网络的训练数据越多,它在执行预期任务时就会越好。此外,神经网络处理的问题域越窄,达到准确性所需的数据就越少。因此,缺乏训练数据和广泛的问题领域是深度学习的两个最大敌人。
大型科技公司通常可以访问大量数据来训练他们的人工智能。但语音助手的问题在于他们正在处理一个非常广泛的问题领域,并且他们在用户中产生了错误的期望。他们有人类的名字和类似人类的声音,他们的广告总是给人一种你可以问他们任何事情的印象。
绿野仙踪效果
当您将深度学习应用到一个开放且无限的领域时,您永远不会拥有足够的训练数据。无论你训练多少 AI 模型,总会有边缘情况,即神经网络从未见过的场景。这就是为什么开发这些服务的公司必须不断收集新数据并重新训练他们的人工智能模型。这意味着他们必须监控用户的行为,以发现让他们的 AI 感到困惑的事情。
另一个问题是语音助手中使用的神经网络需要监督学习,这需要人工操作员对训练示例进行注释。当语音助手发现某个命令令人困惑时,它无法弄清楚自己的真正含义。人类操作员必须将其映射到正确的命令并引导 AI 朝着正确的方向前进。
这就是为什么这些公司雇佣人类承包商来收听录音并用正确的标签对其进行注释,然后神经网络将使用这些标签来微调其内部参数。这需要大量的隐私和道德问题。
微软的故事只是“绿野仙踪”效应的最新表现,公司试图使用人工智能技术自动化任务,但最终使用人工来执行相同的任务或训练人工智能以避免重复其错误。
随着人工智能遇到越来越多的边缘情况并被重新训练以处理它们,它会变得越来越好。随着更多的培训,对人类帮助的需求将变得不那么重要。但是,当您的问题领域过于广泛时,追逐边缘案例就会变成一场无休止的消耗战,而人类将永远是等式的一部分。
一个明显的例子是使用 AI 审核在线内容,这需要神经网络所不具备的常识、推理和抽象思维。
这意味着,如果你使用的是 Siri、Cortana 或 Alexa 等通用语音助手,你可以期待它变得更智能。但这些智慧将继续以牺牲您的数据为代价。