天游ty8线路检测中心登录(中国)有限公司

行业新闻

英特尔新推AI芯片Nervana

    在拉斯维加斯举行的2019年国际消费电子展上,英特尔数据中心集团执行副总裁Navin Shenoy宣布英特尔Nervana神经网络推理处理器将于今年投入生产。早在2016年,英特尔就以4.08亿美元的价格从圣地亚哥收购了拥有48人的AI SAAS初创公司Nervana。 Nervana当时是一家软件公司,提供一个名为Nervana Cloud的全栈软件即服务平台,在一个名为Neon的开源框架基础上支持定制深度学习应用程序的开发。
 
    据报道,Nervana当时正致力于开发用于神经网络处理的定制芯片,他们声称使用这种芯片AI加速器的性能至少会领先GPU10倍。当然,开发自定义处理器对于小型软件团队来说是一项艰巨的任务,但是在它被英特尔收购后,要实现这一想法就变得现实多了。现在,英特尔宣布推出第一款产品,用于推理的英特尔Nervana神经网络处理器,简称NNP-I。该公司还宣布将在今年下半年推出代号为“Spring Crest”的神经网络训练处理器。Nervana Engine最初是采用28nm技术开发的,计划在发布之前升级到14nm。英特尔目前还没有做出回应,但我们推断今年交付的设备将采用英特尔的14nm FinFET技术,未来或许会改用10nm。
 
    英特尔表示Nervana正在与Facebook合作开发,这是一个很有意思的消息,因为Facebook是“超七”数据中心公司,其加速策略一直是不公开的。谷歌开发了自己的处理器,微软,亚马逊和AWS等公司也在基于FPGA的加速方面投入了大量资金。和Facebook成为开发合作伙伴,应该能让Nervana在今年下半年全面上市时获得可靠的端到端认证。
 
    神经网络训练和推理是计算密集型的,涉及矩阵的张量乘法和卷积。多年来,图形处理单元(GPU)一直是人工智能训练加速的首选解决方案,而FPGA一直在努力开拓推理游戏中的竞争优势。就像现成的芯片一样,GPU可以充分利用其高度并行的矢量和线性代数功能,非常适合人工智能任务。但是,由于GPU并非专为人工智能而设计,所以当涉及到人工智能和深度学习的架构优化时,GPU仍然有很多问题需要解决。
 
    类似地,FPGA可以通过更低的功耗为推理任务提供极高的并行性和性能,因为不同于训练,推理任务可以通过降低精度的定点计算来完成。大型数据中心和公有云已经开始利用FPGA集群来加速推理任务,在吞吐量、延迟和计算效率方面取得了显着成果。然而,与GPU类似,典型的FPGA上有许多不涉及AI计算的硬件,许多可编程架构使得FPGA作为通用设备非常棒,但作为AI处理器却不够理想。
 
    Nervana是从GPU内核的深度学习开发人员的角度来解决这个问题的,这让他们深刻地认识到GPU对于AI任务的局限性。该公司表示,Nervana引擎是从头开始设计的,抛弃了GPU架构,重新开始。他们分析了许多深层神经网络,并提出了他们认为的最适合关键操作的架构。他们还提出了一种新的数字格式——FlexPoint,它试图最大化16位存储的精度。
 
    由于人工智能计算可能非常耗费内存,因此Nervana需要能够快速移动大量数据。Nervana设备包括32GB的内置高带宽内存(HBM),可提供8Tb/s的内存访问带宽。HBM存储器通过芯片3D堆叠实现高容量。一个HBM芯片栈可以存储8GB的数据,其中包含8个1GB的独立内存模块。Nervana引擎包括4个HBM栈,提供32GB的存储。英特尔的多模封装技术将HBM与处理器核心阵列连接起来。我们推测这是由英特尔的2.5D嵌入式多模互连桥(EMIB)技术而不是新宣布的FOVEROS 3D封装完成的,不过英特尔并没有给出明确答案。
 
    Nervana引擎由一系列“Tensor Processing Cores”组成,这些核心由HBM基板、内存接口和高速IO组成,旨在将许多Nervana设备组合在一起,以提供超大规模的网络部署。英特尔尚未给出新设备的具体性能或功耗数据,只是说功耗将达到数百瓦,和Movidius和Mobileye等边缘目标AI设备相比,Nervana明显将用于数据中心。
 
    该设备包括六条双向高带宽链路,该公司表示该芯片能够在机箱内部或机箱之间无缝连接。该公司表示,这使用户能够通过简单地分配更多的计算,或者在不降低速度的情况扩展模型规模,从而在当前模型上获得线性加速。将多台设备连接在一起可以作为一个大处理器。
 
    Nervana的目标是在数据中心抢食GPU和FPGA的市场。由于英特尔在其PSG部门(前身为Altera)拥有世界上最好的FPGA技术之一,因此它认为Nervana在推理方面超过FPGA,在训练方面比GPU具有更明显的优势。特别是英伟达(NVIDIA),它在AI训练领域占据着主导地位,显然是Nervana瞄准的目标。
 
    随着更多不同领域的AI设备进入市场,目前的通用处理器芯片无法满足需求,会有越来越多的AI芯片出现,我们将拭目以待。
 
    天游ty8线路检测中心登录拥有国内最资深的芯片解密专家,专注高难芯片的破解, 在AT88SC0104C, STM32F103, 富士通系列, 摩托罗拉系列, 飞思卡尔Freescale系列, Xilinx系列(XC95144,XC9572,XC9536等), C8051系列, TI 系列(MSP430F系列,TMS系列),STC系列(89系列,11系列,12系列,10系列等), SST系列, PIC系列, AT88系列, CYPRESS 系列, DALLAS 系列,PHILIPS 系列,Lattice 系列, Altera 系列, 三菱系列, 瑞萨系列, 新茂SYNCMOS系列(旧版和新版),DSP系列等芯片方面具备震撼性的价格优势和成功率。精通工业控制设备及游戏机板的克隆复制.丰富的芯片解密经验,质量和价格绝对有保障.随时解答客户疑问,我们可以提供相关电子技术支持.能让客户放心做放手做好产品.有需要的请致电:0755-83048995   手机:18923766096       18902856696



首页

电话

地址

到底了~