212-869-3323

上海市浦东新区世纪大道100号

单芯片混合精度浮点算力达 896TFLOPS,中昊芯英新一代 TPU 芯片「须臾」发布 - 世界杯买球网

首页 / 世界杯资讯

作者:赛事分析师

平台资讯

评论: 22


2026世界杯官方指定直播平台,为您呈现最前沿的赛事数据与战术分析。

中昊芯英发布了其新一代 TPU 芯片「须臾」,该芯片的单芯片混合精度浮点算力达到了 896 TFLOPS,性能相较于上一代「刹那」提升了三倍。在 8-bit 推理方面,其算力可达 1792TOPS,能够满足大规模词元高并发推理的需求。

「须臾」在显存容量和芯片内部互联速率方面均实现了显著增强,并支持超长上下文处理。该芯片的额定功耗为 600W,相较于传统的算力芯片,功耗降低了 50%,有助于推动低碳数据中心的建设。

值得注意的是,「须臾」的芯片 IP 核、专用指令集、底层算子加速库以及整机系统软件均为完全自主研发,不依赖任何海外核心技术,这使其能够符合政务、金融、电网等行业在安全合规方面的高要求。

同时发布的还有高性能智算平台「泰则 2.0」,它被设计为标准化的最小计算单元,集成了两路高性能 CPU 处理器和八片高性能 TPU 处理单元。从物理形态上看,「泰则 2.0」一台通用的 CPU 服务器外接一台高性能 TPU 算力加速设备,其混合精度算力可达 7.168P。在执行相同任务时,「泰则 2.0」的整体能耗仅为传统 GPU 服务器的 80%。

在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。在训练场景下,它适配了 DeepSpeed 和 Megatron-LM 分布式套件。该平台已完成了对 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型的深度适配,以便开发者能够快速地迁移模型。

Top
世界杯直播科技有限公司为全球球迷提供最稳定、最全面、最精彩的世界杯赛事直播与资讯体验。电话:+86 152 2992 8080邮箱:[email protected]微信:2026fifazhiz_453营业时间:周一至周五 8:20–18:30广州市天河区天河北路517号