有意思:
這個叫 " 可悠 " 的小家伙,說是要當你們 " 家庭新成員 ":
能認人、能記事兒、能辦事,活脫脫一個不用你調校的 " 龍蝦 ",還能從你的桌面跟到你的車里——
這不就是給家里添了個"AI 親戚 "?
背后的技術支持來自商湯絕影,就是那個曾經參與過 UniAD," 高中 "CVPR best paper 開啟端到端開源浪潮,后來成長為智艙 + 智駕全方位技術派的玩家。
這熱鬧,值得一看。
" 可悠 ",到底是什么?
官方定義AI 桌面智能機器人,單從硬件設備上看,有那么一點像:
是不是想到了《瑞莫》里那個搶戲的黃油機器人:
但可悠的能力遠不止 "pass the butter",用產品經理的話說,可悠的定位是一個 " 真正走進生活的家庭新成員 "。它不是冷冰冰的工具,而是一個能認識你、了解你、關心你的 AI 伙伴,把大模型和智能體技術從 " 聊天框 " 里解放出來,融入真實、流動的日常生活。
從產品形態上看,配備 1.75 英寸 OLED 屏幕,可以呈現 50 多種靈動的表情,身體支持 360 度旋轉和多種震動模式,眨眼時像一個精靈在回應你。
可悠名字源于 "Care You",即 " 關心你 " 的英文諧音——不是做一個只會回答問題、執行命令的工具,而是一個情緒樹洞、一個靠譜的搭子,在平時陪伴你和家人,在關鍵時候也能幫你做點事情。
從能力邊界上看,可悠是一個能夠感知、記憶、推理、執行的智能體,也就是 Agent,和龍蝦一種東西。
但它不再局限于手機或電腦里的代碼,而是可以獨立存在于家庭桌面、車內、辦公室等真實空間中。
能夠認識家庭成員、記住每個人的習慣和偏好、主動陪用戶做事,還能接住用戶的情緒。
陪伴和協助不只停留在一個地方,而是走進你生活的方方面面。
" 可悠 " 是商湯版 NOMI 嗎?
可悠有一個物理形態沒錯,但在多場景多設備間,可悠不是 " 移動 " 而是 " 流動 ":
車上的可悠、身邊的可悠,不需要你把小機器人揣兜里到處跑,這是真正區別于 NOMI 或其他智能音箱產品的核心所在。
可悠的獨特之處可以用三個關鍵詞概括:認識你、了解你、關心你。
認識你——不只是人臉識別或聲紋解鎖,而是能在真實的社交場景中幫你 " 自然接話 "。
例如,第一次帶女朋友回家,緊張得不知道怎么稱呼長輩,可悠會提前告訴你家庭成員的情況,甚至在飯桌上提醒你 " 小姨越劇唱得好 "" 叔叔最近迷上釣魚 " 這樣的細節。
" 認識 " 背后不是冷冰冰的數據庫匹配,而是融入人與人之間相處的自然智能。
第二,了解你——不是聽懂一句話,而是知道你在不同場景下的連續意圖。
比如你在家里說 " 記得提醒我幫孩子登錄網課 ",結果出門就忘了。
可悠不會因為空間切換就丟失任務,它會在你離開家后主動提醒,甚至直接幫孩子打開網課頁面。
可悠能跨場景、跨時間地理解用戶要做什么、做到哪一步、接下來該怎么做。
第三,關心你——不是機械地刷存在感或重復提醒,而是在你忙碌的時候主動幫你推進事情。
比如你同時有項目匯報、流程報銷、客戶會議、運動健身一堆事,可悠不會再來打斷你,而是幫你問團隊時間、發會議邀請、投屏項目管理表,把整件事情往前推,而不是 " 再多提醒你一句 "。
這三點,背后是兩項核心能力:全場景多端協同和持續自我進化。
前者實現了 " 一個靈魂,多個載體 " ——在家叫可悠,在車里叫 New Member,本質是同一個智能體,記憶和任務在所有設備間無縫同步。
后者讓可悠不是被動等待 OTA 升級,而是通過模型優化、認知升級、技能擴展,越用越懂你,越用越能干。
一個 " 分布式 " 龍蝦,絕影如何實現的?
可悠的能力并非憑空而來,而是建立在四大底層技術體系的深度融合之上。
第一,空間多模態交互系統——這是可悠感知世界的 " 感官中樞 "。
它包含三個環節:感知輸入、智能決策、控制輸出。在感知層面,聽覺上采用高靈敏度雙麥陣列,實現 180 ° 拾音和 50 個聲紋識別,能聽清每句話并分清誰在說話,視覺上用 200 萬像素攝像頭,姿態上配備高精度陀螺儀——這是桌面形態的感知交互基礎。
車端,自然而然調用車內的麥克風和攝像頭。
背后算法,是本地部署的輕量化視覺小模型,可實時識別 50 個人的 Face ID 和 16 種動作姿態,結合 100Hz 采集數據和智能姿態算法。
在決策層面,采用端云協同架構:端側小模型負責本地實時感知、保護隱私、快速響應,云側大模型負責深度理解用戶意圖、規劃任務、精準調用技能工具。
在輸出層面,智能大腦將決策結果轉化為聲音、表情、動作—— 1.75 英寸 OLED 屏呈現 50 多種表情,360 度旋轉配合震動模式,端到端響應時間小于 3 秒。
第二,生長型家庭認知記憶框架——這是可悠 " 記住并理解家庭 " 的核心。
它構建了三層遞進的記憶體系:第一層是感知記憶,在日常陪伴中捕捉飯桌嘮嗑、出游合影、家庭群消息等原始記憶碎片,融合成場景全貌。第二層是事實記憶,從感知記憶中精準提取關鍵信息并抽象為常識,例如 " 爸爸上周買了新魚竿 "。
最后是認知記憶,通過推理推演形成人物畫像,不僅記住每個人的習慣偏好,還能讀懂全家的相處模式。絕影官方特別提到,這些 " 記憶 " 是可悠自己的第一用戶視角構建的——它像一個真正的家庭成員那樣去記憶和思考。
第三點是全場景多端協同技術——實現 " 一個靈魂,多個載體 "。
關鍵技術點有兩個:一是智人體協同中樞,打通車機、可悠、電腦、手機等所有設備,讓不同終端上的分身彼此感知、對話、協同工作;二是同一套記憶引擎,所有設備上的交互、對話、任務都會同步到統一的記憶中,絕不存在信息斷層。
第四是持續自我進化能力——可悠的進化與傳統 OTA 有本質區別。
它通過模型優化(用真實數據強化學習,優化大模型調用工具的準確性和效率)、認知持續升級(沉淀用戶行為習慣,形成認知體系,交互越多越懂你)、技能動態擴展(采用 Skill 框架,已開發數十個專屬技能,未來還會引入第三方技能,技能組合呈指數級增長)三個要素驅動,能自我提高認知、交互能力,而非等待后端開發人員的版本迭代。
實際上,商湯絕影通過可悠,構建起了一個 AI Agent 的數據閉環。
自動發現異常行為,然后將問題自動歸類、建成數據集,再針對性自動進訓練 / 仿真,出了解決方案后,系統還能自動評估效果。
自動走完從 " 被發現 " 到 " 被解決并被驗證 " 的路徑。
這種模式還有一個不易察覺的優勢:云端有一個絕影自研中樞模型,會根據用戶的意圖進行資源分發,非常巧妙的用到端云的組合,達到最好的性價比。
就比如龍蝦,你看見的可悠,后面不光有一只龍蝦,還有好幾只龍蝦在互動,這些龍蝦會各司其職,帶來更好的工作效率。
當然還有還定制了很多 skill,可以理解為 AI Agent 在特定任務中的 " 主導規則 ",方便使用的同時,也能為大家節省 Token。
可悠是探索 AI 從 " 工具 " 向 " 準家庭成員 " 角色過渡的一種產品形態,在特定場景下有實用意義,雖尚未顛覆現有智能音箱或語音助手的核心市場,但在 AI Agent 產品形態、持續迭代層面邁出了第一步。
而對于商湯絕影來說,可能短期并非核心營收產品,更像是一個技術示范與生態探路項目,核心技術與智能座艙場景高度重合,通過消費級桌面硬件快速落地,可以低成本驗證這些技術的穩定性、用戶接受度以及端側模型的隱私保護方案。
絕影此前主要面向車企提供解決方案(如 DMS、OMS、座艙感知),普通消費者感知較弱,可悠以 " 家庭新成員 " 的 C 端產品形態出現,有助于建立品牌在 " 具身智能 " 領域的直接認知,同時為未來可能的 B2B2C 合作(如與車企聯合推出車內同款智能體)鋪墊。
目前多數 AI 助手已嘗試多設備聯動,但多以手機或音箱為中心,且記憶與任務延續能力較弱。
商湯絕影通過可悠提出 " 一個靈魂,多個載體 " 的概念,實際上用一個 AI 軟硬件,打通了人 - 車 - 家生態,而且相比早期含糊不清的落地途徑,絕影搶先占據了 " 全場景智能體 " 的定位——一種新的技術壁壘和生態落地。
銷量其實對可悠反倒沒那么重要,能否撬動更多車企或智能硬件廠商采用其底層方案才是關鍵。
至于誰先吃螃蟹:
官方已經給出了答案:國有大廠東風,和跨國車企雷諾。
— 聯系作者 —
— 完 —
【智能車參考】原創內容,未經賬號授權,禁止隨意轉載。
點這里關注我,記得標星,么么噠~