爱游戏-IBM 推出全新Telum处理器,依托新一代 IBM Z 大型主机加速 AI 应用

[导读]新闻要点: 新一代IBM Telum II 处置器和 IBM Spyre 加快器可解锁更多企业级 AI 能力,包罗年夜说话模子和生成式 AI 进步前辈的 I/O 手艺实现并简化可扩大的 I/O 子系统,进一步下降能耗和数据中间占地面积 北京2024年8月29日 /美通...

新闻要点:

新一代IBM Telum II 处置器和 IBM Spyre 加快器可解锁更多企业级 AI 能力,包罗年夜说话模子和生成式 AI 进步前辈的 I/O 手艺实现并简化可扩大的 I/O 子系统,进一步下降能耗和数据中间占地面积

北京2024年8月29日 /美通社/ -- 近日,IBM(纽约证券买卖所:IBM)在 Hot Chips 2024年夜会上发布了行将推出的 IBM Telum® II 处置器和 IBM Spyre™ 加快器的架构细节。这些新手艺旨在年夜幅扩大下一代 IBM Z 年夜型主机系统的处置能力,经由过程新的 AI 集成方式,加快企业对传统 AI 模子和年夜说话 AI 模子的协同利用。

IBM 推出全新Telum处理器,依托新一代 IBM Z 大型主机加速 AI 应用

IBM 推出全新Telum处置器,依托新一代 IBM Z 年夜型主机加快 AI 利用

跟着基在年夜说话模子的 AI 项目从概念验证阶段进入出产阶段,企业对高能效、高平安性和高度可扩大解决方案的需求日趋火急。摩根士丹利比来发布的一份研究陈述猜测,在将来几年,生成式 AI 的电力需求将以每一年 75% 的速度激增,其 2026 年的能耗或将与西班牙 2022 年的全年能耗相当。很多 IBM 客户暗示,撑持恰当范围的根本模子和针对 AI 工作负载的夹杂架构愈来愈主要。

此次IBM发布的首要立异手艺包罗:

IBM Telum II 处置器:这一全新芯片将搭载在下一代 IBM Z 系列主机,与第一代 Telum 芯片比拟,其频率和内存容量均有晋升,高速缓存晋升40%;集成 AI 加快器内核和数据处置单位 (DPU) 的机能也获得改良。IBM Telum II处置器将撑持年夜说话模子驱动的企业计较解决方案,知足金融等行业的复杂买卖需求。 IO 加快单位:Telum II 处置器芯片上的全新数据处置单位 (DPU) 旨在加快年夜型主机上用在联网和数据存储的复杂 IO 和谈,可简化系统操作,提高要害组件机能。 IBM Spyre加快器:可供给额外的AI计较能力,与 Telum II 处置器相得益彰。Telum II 和 Spyre 芯片配合组成了一个可扩大的架构,可撑持AI集成建模方式,行将多个机械进修或深度进修的AI模子与基在编码器的年夜说话模子相连系。经由过程操纵每一个模子架构的优势,AI集成的方式可以生成比单个模子更正确、更稳健的成果。Spyre 加快器芯片在 Hot Chips 2024 年夜会时代进行了预览,并将作为Telum II 处置器的附加选件供给。每一个加快器芯片均与IBM 研究院合作开辟,经由过程一个 75 瓦 PCIe 适配器毗连。与其他 PCIe 卡一样,Spyre 加快器可按照客户需求进行扩大。

IBM主机和 LinuxONE 产物治理副总裁 Tina Tarquinio 暗示:"得益在IBM壮大的多代并行的开辟线路图,我们得以在连结手艺领先的同时,知足企业不竭进级的 AI 需求。Telum II 处置器和 Spyre 加快器旨在供给平安、节能、高机能的企业计较解决方案。这些多年研发的立异功效将被引入下一代 IBM Z 平台,帮忙客户年夜范围操纵年夜说话模子和生成式 AI手艺。"

Telum II 处置器和 IBM Spyre 加快器将由 IBM 的持久合作火伴三星晶圆代工(Samsung Foundry)出产,采取其高机能、高能效的 5 纳米工艺节点。两者将配合撑持企业的进步前辈AI 用例,释放营业价值,从而缔造新的竞争优势。操纵AI集成的方式,客户可以更快、更正确地取得猜测成果。合用的生成式 AI用例包罗:

保险理赔讹诈检测:经由过程AI集成方式将年夜说话模子与传统神经收集相连系,以提高机能和正确性,加强对保险理赔讹诈的检测。 反洗钱高级监测:对可疑金融勾当进行高级检测,撑持遵照监管要求并下降金融犯法风险。 AI 助手:加快利用生命周期、常识和专业技术的教授、代码注释和转换等。

规格和机能指标:

Telum II 处置器:配备八个运行频率达 5.5GHz的高机能内核,每一个内核配备 36MB二级高速缓存,片上高速缓存容量增添 40%(总容量达 360MB)。每一个处置器抽屉的虚拟 L4 高速缓存为 2.88GB,比拟上一代增添 40%。集成的 AI 加快器可实现低延迟、高吞吐量的买卖中 AI 推理,例如加强金融买卖时代的讹诈检测,而且每块芯片的计较能力是上一代的四倍。Telum II 芯片中集成了最新的 I/O 加快单位 DPU。在设计上,其I/O 密度提高 50%,可年夜幅提高数据处置能力,进一步提高 IBM Z 的整体效力和可扩大性,使其成为处置年夜范围AI工作负载和数据密集型利用的不贰之选。 Spyre 加快器:这是一款专为复杂 AI 模子和生成式 AI 用例供给可扩大功能的企业级加快器。它有高达 1TB 的内存,可在通俗 IO 抽屉的八块卡上串连工作,以撑持年夜型主机的整体 AI 工作负载,同时每块卡的功耗不跨越 75W。每块芯片由 32 个计较内核构成,撑持 int4、int8、fp8 和 fp16 数据类型,合用在低延迟和高吞吐量的 AI 利用。

产物时候表作为IBM 下一代 IBM Z 和 IBM LinuxONE 平台的中心处置器,Telum II 处置器估计在 2025 年向 IBM Z 和 LinuxONE 客户供给。IBM Spyre 加快器仍在手艺预览阶段,估计也将在 2025 年推出。

关在IBM 将来标的目的和意向的声明可能会随时更改或撤消,恕不另行通知。

拜候下方链接领会更多:

Telum II:https://www.ibm.com/blog/announcement/telum-ii IBM Spyre:https://research.ibm.com/blog/spyre-for-z IO 加快器:https://community.ibm.com/community/user/ibmz-and-linuxone/blogs/michael-becht/2024/08/23/io-accelerator?communityKey=e7b7d299-8509-4572-8cf1-c1112684644f

关在IBM

IBM 是全球领先的夹杂云、人工智能和企业办事供给商,帮忙跨越 175 个国度和地域的客户,从其具有的数据中获得贸易洞察,简化营业流程,下降本钱,并取得行业竞争优势。金融办事、电信和医疗健康等要害根本举措措施范畴的跨越 4000 家当局和企业实体依托 IBM 夹杂云平台和红帽 OpenShift 快速、高效、平安地实现数字化转型。IBM 在人工智能、量子计较、行业云解决方案和企业办事方面的冲破性立异为我们的客户供给了开放和矫捷的选择。对企业诚信、透明治理、社会责任、包涵文化和办事精力的持久许诺是 IBM 营业成长的基石。

欲知详情,请下载word文档 下载文档

北京2024年8月27日 /美通社/ -- 在8月23日举行的2024年长三角生态绿色一体化成长示范区结合招商会上,软通动力信息手艺(团体)股分有限公司(以下简称 软通动力 )与长三角投资(上海)有限...

要害字: BSP 信息手艺

上海2024年8月26日 /美通社/ -- 本日,高端全合成润滑油品牌美孚1号联袂品牌体验官周冠宇,开启全新路程,助力泛博车主经由过程驾驶去摸索更广漠的世界。在全新发布的品牌视频中,周冠宇和分歧布景的消费者表达了对驾驶的酷爱...

要害字: BSP 汽江南体育车制造

上一篇:爱游戏-Indosat完成全球最大规模PS网络合并,为印尼用户提供卓越体验 下一篇:爱游戏-引领智能边缘未来,2024高通&移远边缘智能技术进化日圆满落幕