国产芯片崛起:云端芯片每秒128万亿次定点运算(2)
2018-05-08 17:13 来源:来源:经济日报综合
智能芯片实现新突破
作为此次发布会焦点,首次正式亮相的Cambricon MLU100云端智能芯片,是我国首款云端AI芯片。
据中科院计算所研究员、寒武纪公司创始人兼CEO陈天石介绍,云端智能芯片是面向人工智能领域大规模数据中心和服务器提供的核心芯片。云端的智能芯片规模更大,结构更加复杂,它和终端芯片的最大区别就在于其运算能力更强。
MLU100云端智能芯片采用寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。
“3年来,我们从研发两颗测试芯片,一直到现在云端智能芯片的最终亮相,我们时刻准备着‘由端入云’。”陈天石说,MLU100基于软硬件协同提升内存带宽利用率,不管是从性能比,还是功耗比来说,寒武纪都将树立智能芯片领域的新标杆。
与寒武纪系列终端处理器一样,MLU100云端芯片仍然延续了寒武纪产品一贯出色的通用性,可支持千万量级用户的大规模商用检验,搭载各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。
此外,这次最新发布的寒武纪1M处理器是公司的第三代IP产品,它延续了前两代产品(寒武纪1H/1A)卓越的完备性,单个处理器核即可支持多样化深度学习模型,并更进一步支持经典机器学习算法和本地训练,为视觉、语音、自然语言处理以及各类经典的机器学习任务提供了灵活高效的计算平台,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域。
“由端入云”协同发展
寒武纪科技公司脱胎于中科院计算所,于2016年发布了全球首款商用深度学习专用处理器——寒武纪1A处理器。它的横空出世打破了多项纪录,并入选了第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。目前,寒武纪处理器也已应用于某知名国产手机新近发布的旗舰机型,实现了集成应用。
近年来,人工智能产业迅猛发展,推动了芯片市场规模的快速增长,也推动了人工智能计算从终端向云端的延伸。陈天石表示,寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独立完成各种复杂的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端在统一的智能生态基础上协同完成复杂的智能处理任务。
陈天石指出,端侧智能处理可以最快速响应用户需求,以非常低小的功耗、成本和延迟,帮助用户理解图像、视频、语音和文本。同时,云侧的智能处理则可以把多个端的信息汇聚在一起。由于终端的数据量有限,只能根据单个用户的数据对机器学习模型进行微调。因此,端云协同的智能处理模式将在数据方面发挥巨大优势,利用海量数据,训练出强大的人工智能模型。
“过去大部分芯片厂商都主攻端,例如芯片巨头ARM公司,或是主攻云,例如英特尔公司。两者兼顾的却很少,因为端云的任务生态区别较大。但是智能时代这个局面会被全面打破。因为端和云的任务是一体的,编程和使用的生态也是一致的。作为一个通用机器学习芯片厂商,寒武纪就是要端云结合,共同推动智能芯片生态的发展。”陈天石说。
中科院上海分院副院长、中科院院士张旭表示,从过去在手机等终端上应用的智能芯片,到今天更高一层的云端人工智能芯片,它可以使人们在手机等终端的应用上升为未来在云端等领域更加广阔的应用,所以这是一个开拓性的突破。
您可能感兴趣的文章