中国力量崛起
2020年2月16日-20日,第67届IEEE 国际固态电路峰会(ISSCC 2020)于美国旧金山召开,中国共23篇论文获收录,包括中国内地15篇,其中,清华大学5篇,澳门6篇,香港2篇,创造了历年来的新高,全球仅次于美国、韩国位列第三。
ISSCC代表着芯片领域的国际最高学术水平,是国际上规模最大、最权威、水平最高的固态电路国际会议,被称为集成电路行业的芯片奥林匹克大会。国际上最先进的固态集成电路技术通常会在该峰会上首次发布。ISSCC 2020共收录了210篇论文,全部都来自全球的一流大学、研究机构以及AMD、Intel、IBM、TI等顶尖企业。继2019年实现中国首篇人工智能芯片ISSCC论文突破后,清华刘勇攀教授带领的智能传感团队和湃方科技再次贡献2篇人工智能芯片ISSCC论文。
引领低功耗AI领域:从通用到专用架构
ISSCC 2020以“Integrated Circuits Powering the AI ERA”为主题。此外,本届峰会在技术组委会筹建方面新增了一个亮点,“机器学习及人工智能”成立了独立的技术小组分会。新设“High-Performance Machine Learning”和“Low-Power Machine Learning”两个机器学习分会,且六个论坛中有两个与人工智能相关,足以见得该领域的重要性。
随着物联网、大数据、人工智能等技术的迅猛发展,全球数据量呈井喷式增长,相当一部分的运算将在本地终端进行而不是借助云端资源。与此同时,解决这些集成了传感和智能计算的无线终端面临的功耗问题就变成了一大挑战。而“Low-Power Machine Learning”分会正是针对智能无线终端等对功耗有极致要求的领域。该分会全部3篇论文均来自中国内地,分别是针对语音、视频以及稀疏网络等专用智能架构的研究与探索,其中2篇为该团队研究成果。
图1 Program-Session 14
又见低功耗的天际
基于帧间数据计算复用的视频应用AI处理器
在智能汽车自动驾驶、智能无人机目标追踪、智能摄像机主动监测等场景中均使用了机器学习技术,传统AI处理器主攻静态图像处理,难以满足多帧视频图像处理的需求。团队袁哲博士在论文“A 65nm 24.7μJ/frame 12.3mW Activation-Similarity-Aware Convolutional Neural Network Video Processor Using Hybrid Precision, Inter-frame Data Reuse and Mixed-Bit Width Difference-frame Data Codec”(14.2)中,提出了一款面向视频应用的神经网络处理器Sticker-V,包含以下关键技术点:(1)利用视频数据中帧间相似性,在传统帧内数据复用基础上新增了帧间复用维度,实现了在不损失网络精度的前提下提高计算速度的效果;(2)根据神经网络计算的数据复用与稀疏模式,设计了可配置三种卷积模式的计算单元和带累加功能的存储单元,提高了网络层内数据利用效率和帧间数据复用;(3)针对帧间数据复用模式,设计了两通路变比特长度片上片下数据压缩模块,有效降低数据传输量。该芯片在TSMC 65nm工艺上成功流片,最高可节省76%的单帧处理能量,将MobileNet-16网络模型的单帧处理能量降低至24.7μJ/frame。
图2 Sticker-V Chip Micrograph and Summary Table
自适应稀疏存内计算芯片——新兴电路架构
存内计算是一种新兴的电路架构,具有高并行度、高能量效率的特点。目前的存内计算电路架构面临的一个重要问题是规则存内计算电路无法支持不规则的稀疏神经网络,造成计算资源的大量浪费。团队岳金山博士在论文“A 65nm Computing-in-Memory-based CNN Processor with 2.9-to-35.8TOPS/W System Energy Efficiency Using Dynamic-Sparsity Performance-Scaling Architecture and Energy-Efficient Inter/Intra-Macro Data Reuse”(14.3)提出了首款基于存内计算核心的系统级神经网络处理器Sticker-IM,包含以下关键技术点:(1)在规则的存内计算阵列上实现了不规则稀疏网络的优化,利用稀疏网络权重和输入数据的动态优化,提高芯片能效并加速计算;(2)实现了基于存内计算核心的片上系统芯片,支持不同bit的整体神经网络模型的动态映射和执行,通过灵活的网络映射和数据复用方法提升了系统资源利用率和数据访问效率;(3)设计了可动态关断的存内计算核心处理单元,实现了存内计算单元对运行稀疏网络的功耗优化。该芯片在TSMC 65nm工艺上成功流片,在MNIST和CIFAR-10数据集的不同神经网络模型中,实现了最高158TOPS/W的核心能量效率和最高35.8TOPS/W的系统能量效率。
图3 Sticker-IM Chip Micrograph and Summary Table
厚积薄发▪连续创新
——智能传感团队的“芯”路历程
针对万亿级别的人工智能物联网需求,清华大学智能传感团队近几年围绕后摩尔时代新型器件与人工智能应用带来的机遇与挑战,开展对低功耗、高能效的芯片与系统研究,受到了学术界和产业界的广泛关注。团队主要研究方向包括:面向新兴深度学习应用的算法-芯片协同设计;面向智能物联网应用的端边云协同优化;基于新型非易失器件的存算融合计算架构。
在深度学习算法-芯片协同设计方面,团队发明了Sticker、Sticker-T、Sticker-V、Sticker-IM等系列人工智能处理器。此外,团队发明的稀疏神经网络处理器芯片STICKER-II结合低比特量化等技术,相比于上一代芯片STICKER实现了更高的能量效率,这也是首款将自适应稀疏和量化进行有机结合的人工智能芯片,在2019年ISLPED国际低功耗设计竞赛上获得第一名。
在智能物联网系统方面,团队针对智能制造等重大应用需求,提出基于智能边缘计算芯片的物联网感知、调度与端边云协同优化技术。团队发明的Tritium系列嵌入式深度学习计算芯片,首次将视觉类智能应用部署在以微控制器为核心的物联网终端设备上,为智能应用在低功耗、低成本的嵌入式平台上的部署提供了可能。该方面的技术已成功转移至湃方科技等创业公司进行产业化实践。
在非易失计算芯片方面,团队发明了THU-10XN系列非易失计算芯片,基于此,在电路、架构和系统应用层面上提出更高能效的电源管理、外设管理、存内计算和应用部署技术。
学术突飞猛进▪产业蓄势待发
基于在智能传感领域多年的研究成果,智能传感团队在2018年9月创立了湃方科技。作为一家高科技企业,湃方科技致力于以满足客户需求为导向,打通技术和实际场景落地之间的壁垒。湃方科技瞄准万亿级市场规模的工业互联网,基于人工智能芯片和算法技术为客户打造的跨品类、全栈式的AIoT智能管理解决方案,形成了多种快速可复制的石油、石化、制造、交通等行业智能升级解决方案,为中国石油、中国石化、山东双轮等百余家大中型企业提供智能工业设备升级服务,赢得了客户的广泛好评,创立仅一年,销售业绩就突破数千万。同时和华为云、英伟达、兆易创新、树根互联、东方国信、海尔COMOSPlat以及中国移动oneNET建立了战略合作,为客户打造智能工业设备升级服务闭环。
在工业AI时代席卷而来的今天,湃方科技已经蓄势待发,通过打破技术落地壁垒,实实在在的为我国工业智能化领域再迈更高的台阶发挥自身的产业价值。
打赢疫情防控阻击战——2019携手同行 2020未来可期!
新型冠状病毒疫情肆虐,疫情防控成为过去一个月全国上下最重要的工作。湃方科技所服务的石油、钢铁、石化、电力、装备制造等流程性强的企业,因为疫情造成了工作人员延迟开工,严重影响了对设备的现场管理和维护工作。湃方提供的全栈式工业设备智联技术正是针对该问题的最优解决方案,将传统工业领域中有人值守,逐步升级成为无人值守,让智能物联网代替人工,真正实现了远程监测、智能决策。湃方科技已多次帮助客户发现安全隐患,降低运维和能耗成本,提高运营准确率。湃方将紧握这个使命重大的方向盘,为疫情期更多工业企业安全运营、正常生产秩序保驾护航,为疫情防控贡献我们的专业力量!
当前,全球第四次工业革命孕育兴起与我国制造业转型升级形成历史性交汇,工业互联网作为新一代信息技术与制造业深度融合的产物,构建起全要素、全产业链、全价值链全面连接的新型工业生产制造和服务体系,成为支撑第四次工业革命的基础设施。世界各国纷纷加快工业互联网建设。党中央、国务院高度重视发展工业互联网,作出一系列战略部署。工业互联网市场目前已经进入启动期,并即将进入高速发展期。未来,湃方科技将致力于打通传统行业的数据与信息壁垒,为客户提供转型、增效、提质、降本的服务,形成工业设备智能化数据平台,整合行业多种第三方服务厂商,形成完整的一体化工业设备智能管理与服务产业链生态。