导读:国内首家估值超百亿的纯推理GPU独角兽曦望(Sunrise)宣布,已完成新一轮超10亿元人民币融资。
“我们的目标是将推理成本降至‘百万Token一分钱’,让AI像水电一样成为普惠基础设施。”
曦望(Sunrise)董事长徐冰的这句表态,背后是AI算力领域正在发生的深刻变局——一场围绕推理算力的权力重构,正悄然拉开序幕。
4月20日,国内首家估值超百亿的纯推理GPU独角兽宣布,已完成新一轮超10亿元人民币融资。
这是2026年AI产业全面迈入“推理落地、智能体普及”时代后,国内GPU赛道诞生的最大单笔融资之一。
在GPU赛道“训推一体”成为主流的当下,曦望为何选择All in推理? 这笔钱又将如何搅动正在爆发的AI应用市场?
超10亿融资落地
资本用脚投票,推理赛道成新风口
事实上,分拆独立仅一年多的曦望已实现资本布局的快速突破:累计完成七轮融资,总融资额约40亿元。
根据公开信息显示,曦望投资方阵容堪称豪华,涵盖产业资本、头部VC/PE及国资背景机构三大阵营——既有三一集团旗下华胥基金、范式智能、杭州数据集团等产业方的深度绑定,也有无极资本、IDG资本、高榕创投、中金资本等头部财务机构的强力加持,更有诚通混改基金、杭州金投、杭州高新金投等国资力量的鼎力支撑。
资本的密集加码,本质上是对推理赛道爆发性增长潜力的精准预判。
正如徐冰所言,2026年AI推理计算需求将达到训练需求的4-5倍,推理算力租赁价格半年涨幅近40%。
随着AI产业加速从“训练红利”向“推理红利”深度转型,大模型规模化落地、智能体全面普及所带来的推理算力缺口,正成为国产GPU实现突围的核心突破口。
基于此,曦望本轮融资的用途将主要用于新一代S3推理GPU的规模化量产交付、全栈软件生态建设,以及S4/S5后续芯片的研发迭代。
这意味着,曦望将进一步巩固技术优势、扩大产能,加速从“技术研发”向“规模化落地”的转型,抢占推理算力的市场先机。
差异化破局
All-in推理,拒绝“训推一体”内卷
与多数国产芯片厂商不同,曦望摒弃了传统训推一体GPU为训练优化的设计思路,从成立之初就坚定“All-in推理”的差异化路线,成为国内首家专注于推理GPU的芯片公司。
资料显示,曦望前身是商汤大芯片部门,2024年底分拆独立运营,专注于高性能GPU及多模态场景AI推理芯片的研发与商业化。公司凭借八年技术沉淀、二十亿研发投入及两代量产芯片的工程化验证,已成为国产GPU替代的核心力量。
截至目前,曦望已推进三代推理GPU迭代、数万颗GPU量产落地,实现了从芯片研发、产品量产到解决方案交付的完整闭环,并保持“芯片均实现一次性流片成功、流片后性能符合设计预期”的行业一流标准。
具体来看,曦望的产品布局精准贴合不同推理场景需求:
第一代S1芯片聚焦视觉推理,适配千余种CV模型,累计销量超2万颗,为商汤科技计算机视觉业务提供坚实支撑;
第二代S2芯片采用GPGPU架构,深度兼容CUDA生态,可适配推理DeepSeek、Qwen等开源大模型,以及文生图、文生视频、文生3D主流模型,实测性能接近英伟达A100的80%,可适配多元大模型推理场景;
于2026年1月正式发布的第三代启望S3芯片,是国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU,定位“推理性价比之王”,堪称曦望抢占市场的核心利器。
与传统GPU不同,S3芯片没有盲目照搬高端训练GPU的HBM显存路线,而是基于智能体推理的本质需求,从AI Core计算架构到内存IO系统进行全链路重构。其核心优势的体现在于“极致降本增效”:推理性能较上一代S2提升5倍,目标实现Token成本下降90%,原生支持FP16至FP4全链路低精度运算,吞吐量较FP16提升3-4倍,真正解决了企业推理算力“成本高、效率低”的核心痛点。
更关键的是,曦望始终坚持原创、全栈自研。从指令集、GPGPU IP到编译工具链,所有关键核心技术均实现自主可控。截至目前,公司已累计持有超过200项核心专利,且此前推出的芯片产品均实现一次流片成功。正是这份过硬的研发与工程化能力,构成了曦望赢得资本青睐、获得行业认可的核心底气。
写在最后
对于曦望而言,本次超10亿融资只是一个新的起点。按照其规划,2026年将围绕“落地、兑现、增长”的核心原则,全力推进S3芯片的规模化量产交付,完成与国内外主流大模型、多模态模型和Agent框架的全面适配,实现“百万Token一分钱”的行业新基准。
从长期来看,曦望的布局已着眼于未来。公司已完成S4高性能推理GPU和S5安全可控推理GPU的技术路线规划,同时持续加码近存计算、光电共封等前沿技术探索,不断巩固技术壁垒。未来,曦望将继续坚守“让AI推理便宜、稳定、随处可用”的核心目标,为中国AI发展铸造坚实的算力底座。
10亿融资的背后,是资本对推理赛道的信心,更是国产算力替代的加速信号。曦望的“All-in推理”之路,不仅为自身赢得了发展机遇,更为国产GPU突围提供了全新思路。随着S3芯片的量产落地,以及后续产品的持续迭代,相信这家推理GPU独角兽,将在国产算力替代的浪潮中,书写更多属于中国芯片的精彩篇章。