消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达
据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeek-R2。
报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。
此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。
据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。
DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。
据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。
-
女生坐萝卜快跑无人车经历尴尬一幕:红灯停路口中间被人疯狂围观
日前,一位女网友发视频称,她和两个朋友在东莞打了一辆萝卜快跑无人车,经历了相当尴尬的一幕。女网友表示,当时车辆行驶在东莞最堵的一个路口,萝卜快跑在绿灯还有几秒的时候冲进了路口。结果行驶到一半路口变红灯
-
苹果iOS 26发布:全局液态玻璃、AI无处不在
苹果今天在WWDC25上正式发布了iOS 26操作系统,并且全平台命名统一为“26”,以后会更容易区分版本了。整体来看,iOS 26的升级可以概括为两部分,一是设计升级,二是功能升级。iOS 26最令
-
韦东奕粉丝超2000万 家属:此前太多人冒用 后续他会自己发
据媒体报道,在北京大学任教的数学天才韦东奕(网友称“韦神”)近日开通短视频账号,迅速引发巨大关注。截至6月8日,其账号粉丝量已突破2000万。他唯一发布的一条4秒出镜自我介绍视频,甚至成为许多考生家长
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

随时掌握互联网精彩