DeepSeek新模型MODEL1曝光
1月21日消息,DeepSeek的下一代旗舰模型疑似提前曝光。在其官方GitHub代码库的更新中,一个名为“MODEL1”的新模型名称在多个技术文件中频繁出现,引发了人工智能社区的广泛关注。
根据对代码库的深入挖掘,“MODEL1”的踪迹横跨了114个文件,共计被提及28次。尤为关键的是,它在代码逻辑中与当前已发布的“V32”(即DeepSeek-V3.2模型)并列出现,表明它并非现有模型的简单迭代,而极有可能是一个独立的新模型序列。
技术分析显示,MODEL1与V3.2在底层架构上存在显著差异。代码对比指出,二者在KV(键值)缓存布局、稀疏性处理方式以及FP8精度解码等核心模块上采用了不同的实现方案。特别是在内存优化方面,MODEL1显示出多处针对性改进,这通常意味着它在处理效率或支持更长上下文方面可能有新的设计目标。
此前有消息称DeepSeek计划在2026年春节前后发布其下一代重量级模型。因为,不少行业分析人士认为,此次MODEL1在开源代码中意外现身,就如同之前DeepSeek发布的优化残差链接“mHC”和AI记忆模块“Engram”两篇论文中提到的新技术一样,很可能正是为这次发布进行的技术准备。
目前,DeepSeek官方尚未对此事发表任何公开评论。所有信息均来源于对公开代码的非官方分析,模型的具体技术细节、性能指标及正式名称仍需等待官方的最终揭晓。
摩根大通:未来五年,AI热潮需5万亿美元成本支撑11月12日消息,据彭博社11月11日报道,摩根大通的分析称,AI超级巨头们正在加速建设数据中心,预计未来五年将需要大约1.5万亿美元(注:现汇率约合10.68万亿元人民币)的投资级债券,并且还需要从市场各个领域获得大...
OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准9月13日消息,今日凌晨,OpenAI正式推出了OpenAIo1预览模型。对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。OpenAI曾解...
小鹏豪掷300亿布局AI:汽车行业正从制造向科技产业转型近日,小鹏汽车董事长、CEO何小鹏在接受媒体群访时,深入探讨了小鹏的AI投入与盈利路径,并描绘了汽车行业从传统制造向科技产业转型的宏伟蓝图。"小鹏既是一家汽车企业,也是一家AI企业,"何小鹏开宗明义地强调这一...
消息称OpenAI预计今年营收将增至127亿美元 明年接近300亿美元3月27日消息,在此前的报道中,曾有外媒提到在生成式人工智能方面走在行业前列的OpenAI,今年的营收将达到116亿美元,是去年37亿美元的3倍多。但从外媒最新的报道来看,OpenAI对今年的营收似乎有更高的预期。已有外...
消息称马斯克的XAI人工智能公司寻求30亿美元融资,估值达180亿美元4月7日消息,据华尔街日报援引知情人士消息,埃隆・马斯克(ElonMusk)旗下的人工智能创业公司xAI正与投资者洽谈融资事宜。此次融资规模达到30亿美元(备注:当前约217.2亿元人民币),这将使XAI的估值达到180亿美元(...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
大模型挑选指南来了!涵盖六种情况下的选择方案,为你匹配最佳模型|来自沃顿商学院教授
西风发自凹非寺量子位|公众号QbitAI最近Claude2亮相、谷歌Bard支持中文、OpenAI推出CodeInterpreter(代码...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...