2026年4月24日,DeepSeek V4正式发布。这条新闻的技术细节值得细品:全球首个在纯国产算力上完成训练的万亿参数级MoE大模型——昇腾910B/C负责训练,昇腾950PR负责推理,从英伟达CUDA生态到华为CANN框架,重写超过200个核心算子,最终以520万美元的训练成本,性能达到A100集群的85%,推理速度较初始版本提升35倍。

此前,国产芯片的订单很大程度来自政府采购和合规要求——你得用,不是你想用。政务云信创适配完成率92.3%,但这些数字多少带着"规定动作"的意味。DeepSeek V4的出现改变了这道选择题的性质。阿里、字节、腾讯随后宣布新增大模型训练优先采用国产算力——风向变了。用DeepSeek团队的话说:"以前用英伟达是'不得不',现在用国产是'主动选'。"这不是一句场面话。全国日均Token调用量从2024年初的1000亿,飙升至2026年3月的140万亿,增长超过1000倍。算力需求在指数级膨胀,而H20出口受限、H100一卡难求的局面并未改变。国产算力不是"备胎",是刚需。更深层的意义在于:DeepSeek V4证明国产算力已经跨越了"能不能用"的门槛,正走向"好不好用"的下一站。这条路,GPU走通了。
但算力不只是GPU
当我们谈论算力时,GPU往往是第一个跳入脑海的词。但在AI训练和推理的完整链路中,算力从来不是孤立存在的。一个万卡集群中,GPU与GPU之间每秒需要交换TB级数据。光模块速率正从400G向800G、1.6T跃升。英伟达GB200/NVL72等平台对网络带宽的要求,直接推动了1.6T光模块的大规模商用——仅英伟达一家,2026年对1.6T光模块的采购量就超过30万只。

没有高速网络,再强的GPU也得干等。算力决定"速度",网络决定"效率"。网络延迟每增加1毫秒,万卡集群的整体训练效率可能下降数个百分点。这意味着,国产算力的崛起不仅是芯片的事。以网络适配器(网卡)和光模块为代表的网络设备,同样是算力基础设施的关键一环。它们构成了数据在GPU之间、服务器之间流动的"高速公路"。而这条高速公路,目前同样正处于从"能用"到"好用"的产业自证阶段。
算力端的突破正在传导至网络设备端。AI训练集群对网络带宽和延迟的极高要求,使得高速网卡、智能网卡、RDMA网络等网络底层设备的重要性急剧上升。一个趋势正在形成:随着国产算力芯片逐步进入企业核心生产系统,下游客户开始更主动地寻求网络层面的全国产替代方案。不是因为政策要求,而是在寻找与国产算力芯片更适配、响应更快、成本更优的网络设备供应商。
这正是国产网络设备厂商的机会窗口。光润通科技正是这个窗口中的参与者。作为国内网络通信设备的专业制造商,光润通自研G710G2以太网控制器,推出FF系列国产网卡,覆盖万兆、25G、100G等多速率产品线,可适配飞腾、鲲鹏、龙芯、海光、申威等国产CPU平台,兼容麒麟、UOS等国产操作系统。

在信创生态适配方面,在信创生态适配方面,光润通积极推荐移动云、阿里云、腾讯云、华为云的兼容性认证。光润通网卡已完成六大国产平台适配,涵盖飞腾、鲲鹏、龙芯、海光、申威、ARM+麒麟等主流架构。从芯片到驱动,光润通实现了核心环节的自主闭环,确保网卡与国产系统、国产芯片的深度协同。这意味着,当客户需要针对特定国产平台做驱动定制优化时,光润通的响应周期远低于依赖外部IP授权的厂商。产品维度上,光润通的FF系列网卡覆盖了多个关键场景:Bypass网卡保障关键业务链路的零中断,单向网卡实现物理层数据流向管控,智能加密网卡提供硬件级数据安全,100G/200G高速网卡支撑AI训练和云计算的高带宽需求。这些产品在金融、能源、政府、军工等关键领域已有落地部署。
DeepSeek V4用国产算力训练成功,证明国产芯片已经从"跟跑"进入"并跑"阶段。但这只是一个开始。一个完整的AI算力集群,从芯片到应用,中间还有网络、存储、散热、电力等多个环节。任何一环成为短板,都会导致整体效率大打折扣。当国产算力芯片的性能逐步逼近国际头部产品,下一阶段的竞争焦点很可能会从单卡算力转向系统级能力——而网络,正是系统级能力的关键组成部分。就像DeepSeek团队花14个月做的那场"换心手术"——从CUDA迁移到CANN,重写200多个核心算子——国产网络设备的成熟,同样需要这样的时间投入和技术耐心。
但方向已经明确。算力的自主可控,不会止步于芯片。当国产算力从"政策驱动"走向"产业自证",网络设备的国产化替代也将循着同样的路径:从"能用"到"好用",从"合规采购"到"主动选择"。国产算力的"最后一公里",是网络。光润通科技将继续深耕国产网卡与光通信领域,以"光联天下,润通你我"为愿景,携手上下游伙伴,共同构建安全可控的算力基础设施。