DeepSeek被称为AI界拼多多,训练2个月仅花费了557.6万美元!
- 发布于:2025-01-28 14:19:27
- 来源:JRS直播
1月28日讯 据钱江晚报报道,此次DeepSeek-V3在AI行业引发关注,关键的原因在于——超低的预训练成本。
“预训练”是AI大模型学习中的一种方法,指的是通过海量的数据,训练一个大模型。训练时需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元。
官方技术论文披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。这个费用是什么概念?
据报道,GPT-4o的模型训练成本约为1亿美元。简单粗暴地说,这相当于DeepSeek-V3比同等性能的AI大模型,降了十几倍的成本。
早在2024年5月,深度求索发布DeepSeek-V2时,就曾因给模型的定价太过于便宜,开启了中国大模型的价格战,被称之为“AI界的拼多多”。
“相比于说它是‘拼多多’,它更像小米,贴近成本定价,并且自产自销。”马千里认为,训练成本比较低的原因,离不开深度求索团队自研的架构和算力,他们自身的算力储备可以与大厂比肩,并且更注重底层的模型。
“ChatGPT走的是大参数、大算力、大投入的路子,DeepSeek-V3的路径用了更多的巧思,依托数据与算法层面的优化创新,从而高效利用算力,实现较好的模型效果。”马千里说道。

- 体育战报 | 3比0!黄友政陈熠横扫现世界第三组合松岛辉空张本美和
- 体育战报 | 演员李现为中网男单决赛挑边,并与辛纳和勒纳钱合影留念
- 体育战报 | 辛纳夺中网男单冠军
- 体育战报 | 辛纳20击败美国小将勒纳钱,时隔两年再夺中网男单冠军
- 体育战报 | 懂球帝X咪咕中网第六比赛日最佳球员候选:辛纳、梅德韦杰夫在列
- 体育战报 | 30赢日乒组合!中国女乒21岁1米77新星闪耀:新王曼昱冲击主力?
- 体育战报 | 《我的冠军老师》张哲嘉带领学生解锁排球魅力
- 体育战报 | 打造国际级网球生态!久事体育与ATP共建亚洲首个ATP发展中心,久事国际网球学院正式揭牌
- 体育战报 | 王楚钦林诗栋30战胜瑞典组合法尔克卡尔森晋级男双八强
- 体育战报 | 陈垣宇23惜败F勒布伦,无缘中国大满贯男单16强

- 欧冠 | 哈兰德梅开二度,一战造2大神迹!摩纳哥点球绝平,主场22曼城
- 欧冠 | 哈兰德对阵摩纳哥数据:射正3次,打入2球
- 欧冠 | 27次助攻!德布劳内是最近10年欧冠助攻最多球员
- 欧冠 | 22被绝平!欧冠大冷门:12亿豪门意外翻车,神锋2球,历史第二人
- 欧冠 | 欧冠:曼城22遭摩纳哥绝平!无缘两连胜,哈兰德双响52场50球
- 欧冠 | 哈兰德:每一场欧冠都很难踢,我们应该踢得更有斗志
- 英超 | 瓜迪奥拉:不知道那个点球该不该判让罗德里踢90分钟太多了
- 欧冠 | 一匹黑马,卡拉巴赫是六支两连胜球队中唯一一个非五大联赛球队
- 欧冠 | 点射梅开二度,戈登成为纽卡斯尔队史第三位连续欧冠进球球员
- 欧联杯 | 吉鲁:我感觉自己的身体和十年前一样棒,欧联对我们至关重要