国产算力崛起:科大讯飞与DeepSeek的双重探索

author 阅读:22 2025-02-12 08:43:26 评论:0

DeepSeek在春节期间的爆红,为国产算力厂商和云服务商带来了新的机遇。壁仞科技、天数智芯等厂商以及华为云、阿里云、腾讯云等纷纷宣布适配DeepSeek,在其平台上提供推理服务。

大模型的算力需求主要体现在训练和推理两个方面。与推理服务相比,模型训练的难度更大,对计算性能、数据和精度要求更高。因此,尽管许多国产算力平台能快速部署DeepSeek等模型进行推理,但在训练层面,基于国产算力平台的大模型仍然较少。

科大讯飞的讯飞星火是目前国内唯一一个基于全国产算力平台训练的大模型。其深度推理模型讯飞星火X1也是首个使用全国产算力训练的深度推理模型,并计划在未来一个月进行重大版本升级。

科大讯飞携手华为打造的“飞星一号”平台,是中国首个支持万亿参数训练的国产算力平台。“飞星二号”也已启动,预计2025年交付试用。科大讯飞董事长刘庆峰透露,公司30%的算力都用于大模型训练的探索,虽然耗费巨大,但他们坚持使用国产算力,以不到同行十分之一的算力卡完成了数倍的任务量。

与使用英伟达算力集群的模型相比,国产算力在性能和功耗上仍有差距。科大讯飞仅使用1万张910B国产算力卡,就取得了显著成果,并在国产算力平台上实现了大量的适配和效率优化,充分展现了其技术实力和战略勇气。

DeepSeek在算法优化和资源利用上的创新,以及科大讯飞基于全国产算力平台的训练,代表了中国大模型产业在有限算力条件下突破瓶颈的不同方向的探索。DeepSeek的成功打破了传统的算力壁垒,也引发了市场对算力巨头(如英伟达)的看衰。

科大讯飞则坚持全栈自主可控的生态之路,这不仅体现了其作为人工智能国家队的使命,也是对美国人工智能技术霸权的有力反制。面对美国对华芯片禁令的升级,中国人工智能产业必须坚持自主可控。科大讯飞的自主可控战略,使其在央国企招投标市场上获得优势,成为中标数量和金额的双料第一。

面向2025年,随着DeepSeek的成功和美国对算力管控力度的进一步加强,科大讯飞的全栈国产化大模型技术将具有更大的战略意义和先发优势。

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜