近期國產大模型動作頻頻。4 月 2 日,阿里發布千問新一代大語言模型 Qwen3.6-Plus。4 月 8 日,DeepSeek(深度求索)上線專家模式,這是 DeepSeek 走紅以來首次在產品端引入模式分層設計。此前 3 月份,DeepSeek 釋放了和 Agent(智能體)相關的多個崗位招聘需求。
《每日經濟新聞》記者注意到,無論是阿里千問還是 DeepSeek 大模型,都在強化基礎大模型 Agent 的能力。2026 年初,以 OpenClaw(一款開源人工智能體框架,俗稱 " 龍蝦 ")為代表的 " 龍蝦熱 " 火爆國內外。如果說 2025 年還是 " 千模混戰 ",2026 年 AI(人工智能)主戰場已全面轉向智能體,Agent 對 Token(詞元)的消耗正以百倍、千倍速度加快。
IDC(國際數據公司)中國研究總監盧言霞向《每日經濟新聞》記者表示,強化 Agent 能力是基礎大模型 2026 年的重要發展方向,可能包括深度研究、智能辦公、AI 代碼助手等通用場景。
中國科學院計算所客座博士生導師、中國計算機學會數字金融分會常務執委白碩在接受《每日經濟新聞》記者采訪時表示,隨著 AI 應用爆發,對基礎大模型 Agent 能力,未來將更重視在 Harness Engineering(直譯為駕馭工程)領域的提升。據了解,Harness Engineering 是一個不強調模型性能,更強調工程環境,通過讓 " 駕馭模型的系統環境 " 更專業而提升使用效果的范式。
下一代 OpenClaw 將支持視頻生成
OpenClaw 創始人近日在社交平臺宣稱,下一代 OpenClaw 智能體產品將迎來兩大核心升級——全新融入 AI 視頻生成能力,并成為全球首個官方適配阿里千問大模型的智能體框架。
4 月 2 日,阿里發布千問新一代大語言模型 Qwen3.6-Plus,其中最引人注目的是,新模型顯著增強了智能體編程能力。在代碼智能體領域以及通用智能體與工具使用方面,新模型表現突出。
4 月 4 日,OpenRouter(一個 AI 模型聚合平臺)官方數據顯示,Qwen3.6-Plus 的日調用量突破 1.4 萬億 Tokens。
Agent 對 Token 的消耗正以前所未有的速度激增。國家數據局局長劉烈宏披露了一組數據,到今年 3 月,我國日均詞元調用量已超過 140 萬億,相比 2024 年初的 1000 億增長 1000 多倍,相比 2025 年底的 100 萬億,3 個月時間又增長 40% 多。
在英偉達 GTC 開發者大會上,黃仁勛給出了一個極具沖擊力的定義:Token 是 AI 時代的新大宗商品,是新 " 貨幣 ",也是衡量企業競爭力的核心標尺。
而 OpenClaw 這類 Agent 產品徹底改變了 AI 交互形態,使其能落地完成復雜任務,也讓 Token 需求迎來爆發式增長。
不只是阿里千問基礎大模型強化了 Agent 能力,DeepSeek 通用大模型自 2025 年以來也強化了 Agent 能力。
《每日經濟新聞》記者注意到,在 DeepSeek 官網上,3 月 24 日發布的一系列招聘崗位中,有不少和 Agent 相關的崗位。譬如 Agent 全棧開發工程師、Agent 深度學習算法研究員、Agent 數據策略工程師等。
2025 年 12 月,DeepSeek 更新 V3.2 正式版,就強調其新模型強化 Agent 能力,融入思考推理。在這個版本的模型中,DeepSeek 提出了一種大規模 Agent 訓練數據合成方法,構造了大量 " 難解答,易驗證 " 的強化學習任務,大幅提高了模型的泛化能力。
DeepSeek 專家模式具備領域深度增強等特點
當前,AI Agent(人工智能體)能力很大程度上依賴于基礎大模型能力的提升,基礎大模型提供核心能力,而 Agent 通過系統化設計將這些能力轉化為實際應用價值,國產基礎大模型正在強化 Agent 能力。
橫向對比來看,無論是千問大模型還是 DeepSeek,均支持高達 100 萬個詞元上下文長度,大模型在長文檔、多輪對話信息提取上更精準。
盧言霞認為,當前基礎大模型競爭的關鍵是編程能力、智能體能力等。
在 AI 應用端,浙江華通云數據科技有限公司副總裁林建龍在接受《每日經濟新聞》記者采訪時坦言,當前 AI Agent 仍面臨一些問題。譬如大多數 AI 系統仍然停留在工具、技能層面,無法真正成為企業的 " 數字化員工 "。傳統工作流編排和簡單對話系統雖然能夠完成一些預定義的任務,但缺乏深度理解業務場景、獨立思考和持續學習的能力,難以滿足企業復雜多變的業務需求。
林建龍表示,未來的 AI Agent 不是簡單的工具,而是一個基于大模型之上的各個行業領域專家。這種專家 Agent 具備以下核心特征:第一,具備深厚的行業專業知識,能夠理解并處理復雜的業務問題;第二,能夠深度融入企業業務流程,與現有系統無縫對接;第三,具備持續學習和自我優化能力,能夠在實踐中不斷提升;第四,能夠獨立完成特定任務,而不僅僅是提供建議或答案。
4 月 8 日,DeepSeek 上線的專家模式就提到,專家模式具備領域深度增強、多步推理可視化、引用溯源強化、自定義專家組合、長上下文壓縮優化等特點。專家模式沿用了 R1 的長思維鏈推理能力,但針對專業領域做了定向蒸餾和微調,使 " 快思考 " 與 " 慢思考 " 在領域內更平衡。
林建龍也強調了未來 " 專家 Agent" 理念的實現,需要系統化和工程化的方法。他表示,當前華通云正圍繞底座模型、數據管理、提示詞工程、長期記憶等核心技術要素,構建了一套完整的 AI Agent 開發框架。
其中底座模型提供基礎的認知和推理能力,數據管理完成對企業數據的鏈接和交互,提示詞工程負責將業務需求轉化為模型可理解的任務指令,MCP Tools(用于與外部系統進行交互的工具集或協議)提供與外部系統交互的能力,Skills(技能)封裝了特定領域的專業技能,長期記憶機制則使 Agent 能夠在多輪交互中積累經驗、實現智能的個性化服務。