2021年10月28日,英特尔On技术创新峰会(Intel Innovation)正式开幕,归根溯源重新拥抱广大开发者,强调对开发者社区的承诺,以及英特尔横跨软件和硬件的开发者至上的理念。在此次峰会期间,英特尔发布了最新产品、开发者工具和技术,强调对赋能开放生态系统的重视,确保开发者能够使用他们所青睐的开发工具和开发环境,并与云服务提供商、开源社区、初创企业和更多生态伙伴之间巩固信任及伙伴关系。
英特尔CEO帕特·基辛格表示:“作为最初英特尔信息技术峰会(IDF)的发起者,我很荣幸今天能再次将生态系统的各位伙伴聚集在一起,共同探索科技的未来。开发者是数字世界中真正的‘超级英雄’,而数字世界是由半导体所支撑的。英特尔将一往无前,挖掘元素周期表中的无限可能,持续释放硅的神奇力量,并将这种力量赋能开发者。我们将携手开启一个全新的创新时代。”
英特尔详细介绍了针对开发者的重点投入计划,包含一个升级、统一以及更加全面的开发者专区(Developer Zone)、oneAPI 2022工具包和全新的oneAPI卓越中心(CoE),所有这些都旨在优化对资源的获取,并简化跨中央处理器(CPU)和加速器的架构开发。
? 开发者专区(Developer Zone):为了让开发者能更加便捷地访问针对人工智能、客户端、云、5G/边缘和游戏等领域的参考设计、工具包和其他资源,推出一个整合的英特尔?开发者目录(Intel? Developer Catalog),其中包含英特尔关键软件产品,以及一个优化的英特尔? DevCloud开发环境,用于测试和运行在各类英特尔最新硬件(包括CPU、图形处理器(GPU)、现场可编程逻辑门阵列(FPGA)和加速器)的工作负载和多种软件工具。
? oneAPI 2022:自去年发布oneAPI以来,英特尔一直在准备oneAPI 2022工具包的发布,该工具包拥有900项新功能。此次发布的新版本,首次通过统一的C++/SYCL/Fortran编译器和Data Parallel Python为CPU和GPU增加了跨架构的软件开发能力,并提升了Advisor加速器性能建模能力,包括使用VTune Flame Graph将性能热点可视化,并通过扩展Microsoft Visual Studio Code集成和Microsoft WSL2支持,以提高生产力。
? oneAPI卓越中心(CoE):宣布新增11位合作伙伴,通过提供战略性代码端口、额外的硬件支持、全新技术和服务以及课程开发,进一步推动生态系统采用oneAPI,合作院校包括橡树岭国家实验室(Oak Ridge National Laboratory)、加州大学伯克利分校(University of California Berkeley)、杜伦大学(University of Durham)和田纳西大学(University of Tennessee)。除此之外,英特尔还扩大了英特尔Xellence显卡和可视化研究所(Intel Graphics Visualization Institutes of Xellence)的规模,使之成为oneAPI卓越中心(CoE)。
英特尔正稳步执行其产品和制程工艺路线图,并围绕四大超级技术力量加速创新步伐,即无所不在的计算、从云到边缘的基础设施、无处不在的连接和人工智能,以颠覆、探索和影响力,助力开发者不断前行。
无所不在的计算:人与技术的交互点
计算能力正渗透到我们生活的方方面面,作为人和技术的交互点,跨越现有和新兴设备。很快,我们都将拥有数以千计的设备可供我们随时使用。到2030年,每个人都可能拥有1 Petaflop(每秒进行千万亿次浮点运算)的算力和1 PB(Petabyte,千万亿字节)的数据,时延不到 1 毫秒。
通过打破围墙和建立一个开放的环境,英特尔正在驱动个人电脑的未来发展。以全新的CPU、GPU和平台进步,为开发者提供巨大的机会以创造出绝妙的体验。
? 第 12 代英特尔酷睿处理器:得益于软硬件间紧密的设计和打磨,全新产品家族1的高性能混合架构带来了一次架构上的变革,并将把后续几代产品的性能推向新高度。第 12 代英特尔酷睿产品家族将包含60款处理器,将为500多种机型设计提供动力,包括从高端台式机到超轻薄笔记本电脑。目前,英特尔将向OEM合作伙伴交付其中的28个SKU型号的处理器,并在今天推出首批6款台式机处理器,其中包括全球性能出众的游戏处理器——未锁频版英特尔酷睿 i9-12900K。
? 数据科学解决方案:数据科学家们目前可以在英特尔? 酷睿? 和英特尔? 至强? 架构驱动的全新解决方案中,使用同类产品中最高的内存配置,大规模迭代、可视化和分析复杂数据。结合工作站硬件和英特尔oneAPI AI分析工具包,已实现“开箱即用”的AI开发,该解决方案现可在戴尔、惠普和联想基于 Linux 的工作站 PC 上使用。此外,微软和英特尔已开展合作,将为Windows 11带来完整的数据科学工具链,这将率先在全新的 Surface Laptop Studio上提供。
? 英特尔?锐炫TMAlchemist 显卡SoC 系列:以游戏为先的设计理念,第一代英特尔锐炫高性能独立GPU(代号为“Alchemist”)将提供Xe 超级采样(XeSS)技术,该技术是一项全新升频技术,游戏开发者正在将其整合到他们开发的游戏中。XeSS利用机器学习和Alchemist内置的XMX AI加速器的优势,提供高性能和高保真的视觉效果。XeSS是使用开放标准得以实现的,以确保在众多游戏和硬件中广泛使用。此外,Alchemist将支持英特尔平台上的Deep Link技术,新的计算能力包括Hyper Encode,实现跨集成显卡和独立显卡引擎同时加速单个视频文件的转码。
从云到边缘的基础设施:结合规模和容量无限扩展的云以及无限延伸的智能边缘
计算正在CPU、GPU、应用加速器、互联处理器、边缘计算设备和FPGA的异构组合中延伸,所有这些都需要持久稳定的内存和软件,将这些要素组合成一个完整的解决方案。为了实现大规模生成、存储和分析数据,通往Z级(1Z=1021,十万亿亿级)计算的赛道已然开启。之前,从P级(1015,千万亿级)计算发展到E级(1018,百亿亿级)计算用了超过12年的时间。如今英特尔已经向自己提出挑战,预计在五年内也就是2027年实现Z级计算。实现这一目标的核心是要通过与开放生态系统合作,确保开发者拥有优化的工具和软件环境,以加速他们的部署。
? Ponte Vecchio和oneAPI支持的SiPearl 公司的微处理器: SiPearl正在为欧洲的百亿亿次(E)级超级计算机设计一种微处理器,选择英特尔Ponte Vecchio GPU作为该系统高性能计算(HPC)节点内的HPC加速器。为了打通各种计算环境,SiPearl采用oneAPI作为开放的软件规范,从而帮助开发者提高生产力并优化工作负载性能。
? 下一代英特尔?至强?可扩展处理器(代号为“Sapphire Rapids”)的优化:英特尔正在与开源社区及其庞大的生态系统伙伴合作,使开发者在其下一代处理器上进行开发时更便捷,还将整合多个全新的加速引擎,旨在解决数据中心规模部署模式中的开销问题,同时提高处理器内核的利用率,降低功耗和占地面积成本。
除此之外,英特尔还强调,云应用开发者可以在主要的云服务提供商中使用最新的第三代英特尔?至强?可扩展处理器,包括阿里巴巴、AWS、百度、谷歌、微软、Oracle和腾讯。
无处不在的连接:万众互联,万物互联
随着网络自上而下、从端到端变得可编程,未来将处于一个真正开放的完全可编程的网络中,开发者可以自由地以软件的速度传输数据。从英特尔至强可扩展处理器和下一代英特尔至强-D处理器,到全新P4可编程基础设施处理器(IPU)和交换机,英特尔是唯一一家提供整套硬件和软件来构建端到端可编程网络的公司:
? 英特尔? Intelligent Fabric智能结构是一个端到端的可编程平台,可利用英特尔独特的硬件和软件产品来创造商业机会,并将控制权交到开发者手中。
①基于ASIC的 IPU(代号为“Mount Evans”):英特尔和谷歌云宣布深度合作,设计和开发这一首个由行业标准编程语言和开源基础设施程序员开发工具包所支持的开放式解决方案,以简化开发者在谷歌云数据中心对该技术的访问。
②英特尔?Tofino? 3 Intel fabric processor (IFP)借助P4可编程性和人工智能工作负载加速,为交换机增强了智能性。此外,IFP完全是P4可编程的,将主动权交还给网络编程人员,同时为更安全和自我修复的云构造铺平道路。
? AT&T由资深的解决方案供应商生态系统提供支持,将采用英特尔作为其芯片供应商,部署其即将推出的虚拟无线接入网络,使其能够灵活地将自动化和类云功能引入其网络,同时对性能、成本和运行效率进行优化。
? DEKA Research &Development Corporation 与FedEx合作推出Roxo 即FedEx SameDay Bot?,这款机器人设计用于可靠、自主运行的“最后一公里”短程配送。Roxo正在使用英特尔第11代英特尔?酷睿i7处理器、英特尔?RealSense深度摄像头进行测试,并使用OpenVINO作为人工智能推理引擎。通过第11代英特尔?酷睿i7处理器,英特尔帮助DEKA创建了一个高能效和高性能的计算平台。
人工智能:让人工智能更便捷、更具可扩展性,赋能开发者
英特尔在开发者生态系统、工具、技术和开放平台方面的深度投入,正在为人工智能的普及扫清障碍。英特尔的作用是负责任地扩大人工智能技术的应用规模。英特尔通过在英特尔至强可扩展处理器上对流行的库和框架进行广泛的优化,让人工智能更便捷、更具可扩展性,赋能开发者。英特尔投入开发多种人工智能架构以满足不同的客户需求,采用开放、基于标准的编程模型,让开发者能更轻松地在更多的用例中运行更多的人工智能负载。目前有许多世界领先的研究组织和机构正利用英特尔的人工智能技术来解决复杂的任务,今日的发布恰好印证了这点:
? 阿贡国家实验室的“极光”(Aurora)超级计算机提供每秒两百亿亿次的浮点运算性能:该款联合设计的“极光”(Aurora)超级计算机,将搭载下一代英特尔至强可扩展处理器(代号为“Sapphire Rapids”)和英特尔下一代GPU(代号为“Ponte Vecchio”),提供每秒超过两百亿亿次的双精度峰值计算性能。“极光”(Aurora)为高性能计算、人工智能/机器学习和大数据分析工作负载而设计。阿贡国家实验室是美国能源部的一个国家实验室,也是致力于提供未来百亿亿次(E级)计算能力的前沿机构。
? 英特尔人工智能技术赋能阿里巴巴推荐引擎:英特尔与阿里巴巴合作开发了端到端的工具包DeepRec,以促进推荐系统的深度学习训练和部署,这一工作负载会耗费所有数据中心和云端人工智能生命周期的很大一部分,并有不同的计算、内存、带宽和网络需求。DeepRec开发者能更轻松地加载和更新模型,处理嵌入层,利用现有模型库,以及部署具有数万亿个样本的极大规模推荐服务。
? 针对英特尔至强可扩展处理器优化的AI工具包:英特尔优化的AI工具包为数据科学家提供了更高性能和生产力,方便快捷。英特尔已经与开源社区,以及亚马逊、百度、Facebook、谷歌和微软进行合作,以确保支持最流行的数据科学软件,优化了在英特尔硬件上的运行,这些软件包括Pandas、scikit-learn、MXNet、PaddlePaddle、PyTorch、TensorFlow、ONNX Runtime等。
? 加速下一代英特尔至强可扩展处理器的AI性能:英特尔计划通过下一代英特尔至强可扩展处理器(“Sapphire Rapids”),实现人工智能总性能增益与上一代相比提高30倍。这些性能提升是通过广泛的软件优化和即将推出的内置于处理器的英特尔高级矩阵扩展(AMX)引擎实现,在不需要独立GPU的情况下,可执行更多的AI用例。
英特尔首席技术官(CTO)、高级副总裁、英特尔软件和先进技术事业部总经理Greg Lavender强调:“创新在开放环境中茁壮成长,在这样的环境下,开发者们能自由地联系、沟通和协作。技术是人类智慧的产物,助我们实现心中所想。此外,技术的本质是中立的,每个人都应该以一种更负责、更包容、更可持续和更合乎伦理的方式使用它。英特尔基于在开放平台和大量基础软件技术方面的深厚积淀而加倍努力,旨在实现软件创新。”