DeepSeek-V3的低本钱练习或将引发算力需求新革新!
来源:米乐直播    发布时间:2025-03-04 04:24:35

  在深度求索DeepSeek-V3发布的当天,AI界的轰动简直能用剧烈来描述。这款参数量到达671B的大型模型,仅用2048块GPU在短短两个月内,以557.6万美元的超低本钱完成了预练习。这种高效的练习方法不只让它的功能与其他顶尖大模型相媲美,乃至有更优之处。这背面的隐秘在于DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE,极大地提高了练习的经济性,并且在推理加快方面也取得了令人瞩目的成果。

  DeepSeek-V3的发布引发了业界的热议,有些剖析观念以为,这在某种程度上预示着AI范畴对算力的需求或许会一会儿就下降,乃至将A股算力概念的跌落和这一新模型联络在了一同。但是,另一部分专家则以为,这种观念或许过于片面,由于在AI大模型的练习过程中,削减本钱并不意味着关于算力的全体需求会削减。在练习战略上降低了本钱并不替代算力需求的实质,因而大规模的公司依然需求寻觅高效的方法来探究模型的极限。

  LeptonAI的创始人贾扬清标明,“咱们已慎重进入了分布式推理年代。”他着重,仅笔据台GPU机器现在显着不足以满意模型的参数需求,分布式推理将是确保功能和拓展性的要害。

  中信证券的研报也指出,DeepSeek-V3的推出意味着AI大模型的使用将迎来遍及,推进了更高的使用功率和推理速度。一起,跟着AI使用的日益添加,推理核算又将成为新一波算力需求的驱动力。

  AI职业的一些大佬,如OpenAI的前首席科学家Ilya Sutskever,都正在发出新信号,以为AI的预练习年代行将曩昔,迎来以更高效推理为中心的“推理年代”。这一改动将使得AI在面临问题时扩展思想的时刻,使输出愈加智能化。

  面临全新使用的兴起,推理算力的重要性显而易见。AI芯片制造商Cerebras的论述也标明,快速推理是下一代AI使用可以成功落地的要害。以近期遭到热捧的豆包(Doubao)为例,跟着其大模型的日益更新,推进了对推理算力需求的显着上升。

  从本钱层面看,小米也在准备其GPU集群,对AI大模型进行大力出资,力求搭乘算力需求上升的快车,估计未来将招引更多企业投入AI核算才能的建造,构成更为巨大的商场动能。这种趋势显着在大型科技公司中延伸,摩根士丹利乃至猜测,到2025年,四大海外科技巨子的本钱开支将到达3000亿美元,AI建造的份额也将随之上升。关于AI范畴而言,未来的算力需求将更侧重于推理方面,推进这一范畴以更快的速度开展。回来搜狐,检查愈加多



相关文章
相关产品