进军智能体?DeepSeek被曝年底或“放大招”
澎湃新闻  2小时前

  澎湃新闻记者 范佳来 实习生 刘天颖

  

  9月5日,据外媒报道,DeepSeek被曝光正在开发具备更先进的AI智能体相关功能的人工智能模型,目的是与OpenAI等头部科技公司在技术新前沿展开竞争。目前DeepSeek创始人梁文峰计划在今年四季度发布相关智能体产品。

  澎湃新闻记者向DeepSeek内部人士询问此事真实性,对方未给予明确回复,但并未否认此事。

  据外媒援引相关消息称,DeepSeek正在开发的智能体强调自主任务处理能力,与传统聊天机器人不同,智能体能够代表用户在最少指令下完成多步骤复杂任务,并根据历史操作持续学习和改进,减少人工干预需求。

  DeepSeek的动态,向来被视为AI行业风向标。此前8月21日DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。

  据介绍,V3.1包含三大主要变化。首先,V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式;其次,V3.1具有更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;另外,V3.1具有更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

  当时,DeepSeek表示,DeepSeek-V3.1使用UE8M0 FP8 Scale的参数精度。UE8M0 FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。相关表态,一度带动国产芯片算力股价迎来飙升,8月22日,算力芯片厂商寒武纪(688256)、海光信息(688041)、云天励飞(688343)均20CM涨停,其中寒武纪市值突破5200亿元。

  对于此次DeepSeek进军智能体相关计划,有业内人士认为,如果DeepSeek成功推出高效且低成本的智能体,可能进一步拉低AI应用价格门槛。目前,V3.1在Token使用量方面较0324版本下降约13%,每次完整编程任务仅需1.01美元。

  然而也有声音指出,当前AI智能体普遍仍需较多人工监督,完全自主运行仍面临技术挑战。DeepSeek-V3.1虽在部分任务中表现优异,但在数学推理、逻辑分析和幻觉控制等方面仍存不足,新模型能否实现突破尚待观察。

  资深人工智能投资人郭涛向澎湃新闻记者分析称,DeepSeek加码AI智能体,将显著激化全球该赛道的竞争强度,倒逼行业在复杂任务拆解、多步骤推理及环境自适应等核心维度突破技术瓶颈。若技术路线成功落地,不仅有望大幅降低企业级智能体的部署门槛,更能加速其在金融、医疗等专业领域的场景渗透速度。为维系竞争优势,头部厂商必然会加大在具身智能、工具调用等前沿方向的资源投入,进而形成可惠及全行业的技术外溢效应。

  “从中长期视角看,这场竞争将推动AI智能体行业标准体系的完善,尤其在安全围栏搭建、价值对齐实现等关键领域,有望催生行业共识。”郭涛认为。

  2025年被业界称为“AI智能体元年”。8月26日,国务院印发《关于深入实施“人工智能+”行动的意见》(以下简称《意见》)提出,到2027年,率先实现人工智能与6大重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%;到2030年,中国人工智能全面赋能高质量发展,新一代智能终端、智能体等应用普及率超90%。

  在AI大模型领域,市场已经展开激烈的竞争和角逐:OpenAI筹划万亿级AI基建、Meta计划再次重组其AI业务、智谱发布手机AgentAutoGLM2.0……作为国内大模型龙头企业,DeepSeek也面临更激烈的市场竞争。

  本期编辑 邹姗

作者:澎湃新闻