2026-06-30

中昊芯英发布了其新一代 TPU 芯片「须臾」,该芯片的单芯片混合精度浮点算力最高可达 896 TFLOPS,相较于上一代「刹那」芯片,性能提升了三倍。在 8-bit 推理方面,算力达到了 1792 TOPS,能够满足大规模词元高并发推理的需求。

「须臾」芯片在显存容量和内部互联速度方面均有显著增强,并支持超长上下文处理。其额定功耗为 600W,与传统算力芯片相比,功耗降低了 50%,有助于推动绿色数据中心的建设。

该芯片的 IP 核、指令集、底层算子加速库以及整机系统软件均为完全自主研发,不依赖任何海外核心技术,因此能够满足政务、金融、电网等行业在安全合规方面的要求。

中昊芯英同时推出了高性能智算平台「泰则 2.0」,这是高性能智算平台中的基础计算单元。该平台集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元,从硬件上实现了通用 CPU 服务器与高性能 TPU 算力加速设备的结合。其算力可达 7.168 PFLOPS(混合精度),在执行相同任务时,整机能耗仅为传统 GPU 服务器的 80%。

在软件方面,「泰则 2.0」平台支持所有主流 AI 框架,并原生兼容 PyTorch、vLLM、SGLang 等开发工具。对于训练场景,它适配了 DeepSpeed 和 Megatron-LM 分布式套件。目前,该平台已成功适配 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型,使开发者能够便捷地进行模型迁移。