新硬件为人工智能提供了更快的计算速度 而且能耗更低
随着科学家不断突破机器学习的界限,训练日益复杂的神经网络模型所需的时间、精力和金钱也在飞速增长。一个名为模拟深度学习的人工智能新领域承诺以更少的能源使用更快的计算。
可编程电阻器是模拟深度学习的关键组成部分,就像晶体管是数字处理器的核心元件一样。通过在复杂层中重复可编程电阻器阵列,研究人员可以创建一个模拟人工“神经元”和“突触”网络,就像数字神经网络一样执行计算。然后可以训练该网络以实现复杂的 AI 任务,例如图像识别和自然语言处理。
一个由麻省理工学院研究人员组成的多学科团队着手推动他们之前开发的一种人造模拟突触的速度极限。他们在制造过程中使用了一种实用的无机材料,使他们的设备运行速度比以前的版本快 100 万倍,这也比人脑中的突触快约 100 万倍。
此外,这种无机材料还使电阻器非常节能。与早期版本的设备中使用的材料不同,新材料与硅制造技术兼容。这一变化使制造纳米级设备成为可能,并可能为集成到深度学习应用的商业计算硬件铺平道路。
资深作者 Jesús A. del Alamo,麻省理工学院电气工程和计算机科学系 (EECS) 的唐纳教授。“这项工作确实使这些设备处于现在看起来对未来应用非常有希望的地步。”
“该设备的工作机制是将最小的离子质子电化学插入绝缘氧化物中以调节其电子导电性。因为我们正在使用非常薄的设备,我们可以通过使用强电加速这种离子的运动领域,并将这些离子设备推向纳秒运行状态,”资深作者、核科学与工程系和材料科学与工程系的 Breene M. Kerr 教授 Bilge Yildiz 解释说。
“生物细胞中的动作电位以毫秒的时间尺度上升和下降,因为大约 0.1 伏的电压差受到水的稳定性的限制,”资深作者、巴特尔能源盟核科学与工程教授 Ju Li 说。材料科学与工程教授,“在这里,我们在纳米级厚度的特殊固体玻璃薄膜上施加高达 10 伏的电压,该薄膜可以传导质子,而不会永久损坏它。电场越强,离子设备的速度就越快。”
这些可编程电阻器极大地提高了神经网络的训练速度,同时大大降低了执行该训练的成本和能量。这可以帮助科学家更快地开发深度学习模型,然后可以将其应用于自动驾驶汽车、欺诈检测或医学图像分析等用途。
“一旦你有了一个模拟处理器,你将不再训练其他人都在研究的网络。你将训练具有前所未有的复杂性的网络,这是其他人无法承受的,因此大大优于所有网络。换句话说,这是不是更快的汽车,而是宇宙飞船,”主要作者和麻省理工学院博士后 Murat Onen 补充道。