近日,澜起科技正式发布了第五代津逮CPU处理器,是面向国内本土市场的x86架构服务器芯片。
澜起科技官方明确表示,第五代津逮基于Intel刚刚发布的第五代至强(代号Emerald Rapids),均通过了澜起科技的安全预检测(PrC)测试。
Intel五代至强有多达28款型号,第五地津逮则只有5款,其中旗舰型号津逮C8558P复刻了至强铂金8558P,都是48核心96线程、260MB三级缓存、2.7-4.0GHz主频、350W热设计功耗。
津逮C6548Y+对应至强金牌6548Y+,32核心64线程,60MB三级缓存,2.5-4.1GHz主频,250W热设计功耗。
津逮C5520+对应至强金牌5520+,28核心56线程,52.5MB三级缓存,2.2-4.0GHz主频,205W热设计功耗。
津逮C6542Y对应至强金牌6542Y,24核心48线程,60MB三级缓存,2.9-4.1GHz主频,250W热设计功耗。
津逮C4514Y对应至强饮片4514Y,16核心32线程,30MB三级缓存,2.0-3.4GHz主频,150W热设计功耗。
至于真旗舰级的64核心至强铂金8593Q/8592+/8592V,以及60/56核心型号,都没有进入澜起科技的津逮系列。
除了规格参数完美移植,多种加速器、AI加速引擎、更高的能效、更低的待机功耗等特性,也都一个不落。
澜起科技此前发布的二三四代津逮CPU,也分别与Intel二三四代至强的部分型号一一对应。
生态方面,澜起科技加入了OpenEuler社区、龙蜥社区等操作系统开源社区,获得了麒麟软件、统信软件、凝思软件、湖南麒麟信安、龙蜥社区的产品兼容性互认证。
澜起科技透露,目前已有数家服务器厂商合作,基于第五代津逮CPU的机型已陆续上市。
接下来,看看真国产的。
今天,摩尔线程发布了全新智算加速卡MTT S4000,训推兼顾专为大模型打造,单卡支持48GB显存。
据介绍,MTT S4000采用了第三代MUSA内核,单卡支持48GB显存和768GB/s的显存带宽,FP32性能为25TFLOPs、TF32性能为50TFLOPs、INT8性能为200TFLOPs。
基于摩尔线程自研MTLink1.0技术,MTT S4000还可以支持多卡互联,片间互联可达240GB/s,助力千亿大模型的分布式计算加速。
同时,MTT S4000还提供96路1080P硬件解码,先进的图形渲染能力和超高清8K HDR显示能力,助力AI计算、图形渲染、多媒体等综合应用场景的落地。
最重要的是,通过摩尔线程自研MUSIFY开发工具,MTT S4000计算卡可以充分利用现有CUDA软件生态,实现CUDA代码零成本迁移到MUSA平台。
同时,摩尔线程首个全国产千卡千亿模型训练平台,摩尔线程KUAE智算中心揭幕仪式成功举办。
此举也代表着,国内首个以国产全功能GPU为底座的大规模算力集群正式落地。
摩尔线程CEO张建中表示,摩尔线程构建了从芯片到显卡到集群的智算产品线,依托全功能GPU的多元计算优势,可以满足不断增长的大模型训练和推理需求。
据介绍,摩尔线程KUAE智算中心解决方案以全功能GPU为底座,旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。
该方案可实现开箱即用,大大降低传统算力建设、应用开发和运维运营平台搭建的时间成本,实现快速投放市场开展商业化运营。
目前,摩尔线程支持包括LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各类主流大模型的训练和微调。
基于摩尔线程KUAE千卡集群,70B到130B参数的大模型训练,线性加速比均可达到91%,算力利用率基本保持不变。
以2000亿训练数据量为例,智源研究院700亿参数Aquila2可在33天完成训练;1300亿参数规模的模型可在56天完成训练。
原文标题 : 另类国产CPU进化第五代:基于Intel五代至强