豆包“撕裂”AI手機
文 | 定焦One,作者 | 王璐,編輯 | 魏佳
短短十來天,一臺僅僅停留在“技術預覽版”的豆包手機,攪動了整個AI手機賽道。
在首批工程機上線即被搶空、帶動中興股價漲停之后,這款手機又因“AI外掛”爭議、被多個超級APP限制登錄、高管連續(xù)發(fā)聲等事件數(shù)度反轉,迅速成為行業(yè)焦點。
嚴格來說,它并非一款正式意義上的“豆包手機”,更準確的說法是豆包與中興旗下努比亞聯(lián)合開發(fā)的AI手機“努比亞M153技術預覽版工程機”,豆包手機助手作為工具被深度嵌入到操作系統(tǒng)中。也正是因為這種深度接入方式,既讓它在真實應用場景中展現(xiàn)出超越傳統(tǒng)語音助手的連續(xù)操作能力,也引爆了后續(xù)的一系列爭議。
與爭議并行的是它在二手市場的價格不斷攀升,原價3499元一臺的手機一度被炒到3.6萬元,顯示出市場在質疑與興奮之間的撕裂情緒。
它的確功能強大,可以替網(wǎng)友在B站答題、在多鄰國打卡以及跨平臺比價下單,被網(wǎng)友稱贊“像人一樣玩手機”。羅永浩評價豆包手機具有開創(chuàng)性意義,周鴻祎預言將沖垮互聯(lián)網(wǎng)大廠護城河。但它問題也不少,頻繁“死機”、任務中斷以及隱私擔憂等吐槽,讓大量用戶保持觀望。
事實上,大眾對于豆包手機的關注已經(jīng)遠超產(chǎn)品本身,它背后是兩條AI手機路線的正面碰撞:一條由傳統(tǒng)手機廠商為代表,以“軟硬一體”為特點的漸進式AI升級;另一條則是由大模型公司主導,通過系統(tǒng)級AI Agent重構移動操作系統(tǒng)的跳躍式路徑。豆包手機屬于后者,它撕開了行業(yè)潛在矛盾,試圖打破傳統(tǒng)APP封閉邊界,觸及互聯(lián)網(wǎng)平臺風控邏輯,也對主流手機廠商的生態(tài)優(yōu)勢構成壓力。
爭議還在繼續(xù),豆包手機會是曇花一現(xiàn),還是推動整個AI手機加速重構?在新一輪競爭中,誰最有希望勝出?
手機廠商沒做出來的AI手機,豆包做出來了
“AI手機”的概念最早被大規(guī)模提及是在2023下半年,三星、谷歌、OPPO、vivo、小米、榮耀等主流手機廠商幾乎都在強調“接入大模型”“系統(tǒng)升級為AI OS”,仿佛不提AI就落伍了。
這些AI手機主要包含實時通話翻譯、生成會議紀要、AI修圖等基礎AI功能,以及一些有限的跨應用操作,比如完成點單任務、智能整理文件等。但在熱鬧背后,更像是給一些舊功能貼上新標簽,一度被評價為“概念有余、創(chuàng)新不足”。
豆包手機更加激進,它的跨應用操作不局限于點單,還支持線上購物、訂票、學習軟件打卡等眾多場景,并且它能在操作過程中自主處理彈窗、跳過廣告、規(guī)避支付陷阱。這種連續(xù)自主行為的復雜度高于行業(yè)現(xiàn)有能力。
不同AI手機在智能化程度上的差異,主要源于其技術技術路線的不同。Agent領域從業(yè)者宵逝向「定焦One」介紹,當前AI手機的實現(xiàn)路線主要分兩種。
在2025年前,行業(yè)普遍采用的是傳統(tǒng)方案,即手機廠商與APP開發(fā)者通過SDK接口(軟件開發(fā)工具包)對接,讓AI助手借助開放接口執(zhí)行任務。但該方案高度依賴APP開放接口,一旦接口變更或未開放,AI將無法執(zhí)行相應指令。早期語音助手如Siri、小愛同學均屬此類。
第二條路線是今年以來各大廠商采用的主要方案,基于GUI Agent(圖形用戶界面智能體),由大模型直接識別屏幕內容、理解界面結構并模擬人類手勢進行點擊、滑動和輸入。也就是說,大模型不再需要“調用SDK接口”,而是轉為“直接識別屏幕并操作”,像用戶一樣操作手機。但這類方案通常需要獲取手機系統(tǒng)級權限,典型代表是豆包手機。

豆包手機在自主操作背單詞工具(視頻為5倍速) 受訪者提供
需要強調的是,GUI Agent并非全新技術,部分AI手機早已使用。比如榮耀MagicOS 9.0的YOYO智能體,通過此路線便可自主完成從打開外賣APP到結算的買咖啡流程。
因此,有從業(yè)者認為,豆包手機的技術并未實現(xiàn)突破性創(chuàng)新。網(wǎng)絡安全專家曲子龍向「定焦One」指出,豆包手機的技術原理并不復雜,是基于視覺語言模型的方案,通過讀取屏幕的權限,利用視覺語言模型識別屏幕內容,再進行指令操作。該方案在行業(yè)中已有實踐。
不過,盡管技術路徑相似,豆包手機在通用任務能力上表現(xiàn)更為突出,顯示出一定技術實力。
宵逝在使用豆包手機的過程中發(fā)現(xiàn),它能主動進行信息檢索與召回、調用在訓練階段從未見過的的陌生APP,這是其他AI手機難以做到的。
比如,在面對“會議延遲是否影響接孩子”的復雜任務時,豆包可定位公司與學校位置,通過地圖類應用查詢路程時間,從而給出判斷,在這一過程中,用戶并沒有指定APP,但豆包能自主分析并規(guī)劃用何種APP操作任務。
相比之下,多數(shù)AI手機仍局限于預設場景。以榮耀YOYO為例,它可以完成點咖啡,但面對陌生任務時,會提示無法執(zhí)行。
簡而言之,豆包手機試圖構建一個不依賴預設場景的通用智能體,其能力不僅限于執(zhí)行固定流程的任務(比如代點咖啡),還可應對開放目標(比如規(guī)劃一次預算內的旅行),這要求它能自主進入不同APP進行瀏覽、比價與決策。而當前大多數(shù)手機廠商的AI功能仍圍繞有限場景的自動化展開。
因此,盡管同樣基于GUI Agent路線,豆包手機在對面對復雜、開放任務的理解與執(zhí)行能力時,更接近“真正的智能”,這正是它引發(fā)行業(yè)震動的根本原因。
大廠“封殺”,AI手機的仗要打起來了
豆包手機的路線展示了技術的可能性,也讓沖突走到臺前。它的“跨應用連續(xù)操作”能力,本質上是在突破現(xiàn)有移動生態(tài)的隱性邊界,于是很快撞上了互聯(lián)網(wǎng)巨頭的防線。如今,微信、支付寶、淘寶等APP均對其自動化操作采取了技術性“封堵”,有的可登錄但不可通過AI操作,有的直接限制登錄。
沖突的核心在于,雙方對操作權限的判定標準存在差異。
站在APP端的立場,其風控機制會持續(xù)監(jiān)測用戶行為特征,一旦察覺非人為操作,便會啟動禁止登錄的保護機制。微信本次限制豆包AI操作,正是出于這一原因。
曲子龍表示,豆包手機助手調用微信執(zhí)行任務時,利用的INJECT_EVENTS權限(Android上允許應用向系統(tǒng)模擬用戶輸入事件的權限),被微信識別到這是一個模擬用戶輸入的事件,懷疑這不是一個正常操作。檢測到異常后,微信將賬號的登錄狀態(tài)回收,讓用戶重新登錄。
他表示,在剛買來的努比亞M153上登錄微信,本身就是在“非常用設備”下進行敏感操作。微信根據(jù)賬號信譽值以及敏感操作的風險值判斷,無論是注銷登錄狀態(tài)亦或者凍結賬戶,都是一個很正常的風控手段。
但事件的另一方,抖音高管曾公開解釋,此類操作本質上是設備持有者授權AI助手代為執(zhí)行任務,而非外部攻擊。
雙方的界定差異,正是此次爭議的根源。換言之,現(xiàn)有的APP應用強調“真人操作”,而系統(tǒng)級AI助手強調“用戶授權下的人機協(xié)同”。這種分歧不僅是一個技術判定問題,還可能帶來深遠影響。它將決定著未來AI手機能否真正具備“系統(tǒng)級智能”,還是會被迫退回到輕量工具。
對于所有試圖重新定義AI手機操作系統(tǒng)的玩家而言,這是第一道難題。除權限沖突之外,基于GUI Agent的技術路徑,用戶體驗層也面臨三項核心挑戰(zhàn):隱私安全、結果“幻覺”與執(zhí)行效率。
首先,隱私安全是用戶最關心的問題。核心疑慮在于,豆包手機在處理任務時,手機屏幕上的用戶信息是否被持續(xù)上傳至云端?是否存在泄露風險?

圖源 / 豆包AI官方微博截圖
宵逝指出,AI手機在執(zhí)行任務時,通常需將當前頁面狀態(tài)等必要信息上傳至云端進行推理,但一般不會全程、全量上傳屏幕數(shù)據(jù)。主要原因在于全部上傳成本太高,大模型的上下文長度與云端計算開銷限制了全程錄屏分析的模式。
對于是否會“24小時窺屏”,宵逝通過手機功耗表現(xiàn)進行了側面驗證。
“如果視覺語言模型持續(xù)進行全屏分析,手機將迅速發(fā)燙、耗電劇增。”但他在使用過程中發(fā)現(xiàn),實際情況并非如此,“在執(zhí)行任務時,豆包手機會發(fā)熱,但待機狀態(tài)時基本正常。”因此他更傾向于“按需觸發(fā)”,并對特定界面(如懸浮窗)設有訪問過濾。
至于當豆包手機遭受外部攻擊時,用戶是否會面臨賬號盜用風險,宵逝覺得無需過度緊張。
“AI的每次操作實質是工具調用,開發(fā)者通常會在工具層設置風控,保證安全性。比如,在最終支付環(huán)節(jié)會中斷自動流程,彈窗交由用戶手動確認。雖然AI的決策或許不可全信,但執(zhí)行支付等操作的授權代碼是明確且受控的。”不過,他也補充,相較本地推理占比更高的傳統(tǒng)AI手機方案,依賴云端推理的路徑,安全性相對更低。
但這并不是一項無法解決的問題,曲子龍認為,平衡隱私安全的關鍵在于終端芯片的算力。“當手機芯片算力足夠大,所有任務都在本地執(zhí)行,隱私擔憂將得到極大緩解。”
其次是“幻覺”問題,即AI錯誤理解用戶意圖或執(zhí)行錯誤操作。
比如,有用戶在使用豆包手機時發(fā)現(xiàn),AI未能按照自身需求篩選出“熱度數(shù)據(jù)最高”的歌曲。宵逝也有相同感受,他讓豆包購買一支普通牙刷,豆包卻將此前加購的電動牙刷一并勾選,導致支付環(huán)節(jié)的金額多了100元。
這類問題短期難以徹底解決,行業(yè)共識是,在現(xiàn)有技術條件下,追求大模型給到100%的準確率并不現(xiàn)實。
最后是執(zhí)行效率。網(wǎng)友們普遍反映,豆包手機在完成跨應用比價、下單的復雜任務時,需要耗時數(shù)分鐘、遠慢于人工操作。
宵逝解釋,這主要是因為AI需等待界面元素完全加載穩(wěn)定后,才能進行識別與下一步操作,而人類用戶可以憑經(jīng)驗進行預判和快速交互。
此外,由于主流應用的技術限制,豆包手機在許多高頻場景中無法工作,這也極大地限制了其實際可用范圍。
豆包手機所面臨的這場“封殺”,不是單一產(chǎn)品的功能博弈,而是新舊規(guī)則的碰撞。下一步是行業(yè)對抗,還是規(guī)則重寫,仍懸而未決。
AI手機會成為誰的機會?
盡管當前AI手機仍面臨不少挑戰(zhàn),但可以肯定的是,這一賽道正成為科技公司爭奪AI時代“超級入口”的核心戰(zhàn)場。
所謂的“超級入口”,關系著企業(yè)在下一輪產(chǎn)業(yè)格局中的地位。在傳統(tǒng)互聯(lián)網(wǎng)時代,入口由瀏覽器、搜索引擎與超級APP主導;在大模型時代,入口將從“用戶主動點開”轉向讓智能體自動代辦,用戶不再逐個打開應用,只用向智能體提出需求,由智能體實現(xiàn)跨應用操作。誰掌握入口,誰就掌握著用戶注意力、數(shù)據(jù)流動的主導權。新的入口一旦形成,后來者將很難再獲得主導權。
過去幾年,AI硬件不斷出現(xiàn)。例如,AI眼鏡或AI耳機在便攜和聽覺交互上見長,智能汽車提供了獨特的空間與算力載體,通用機器人代表著更遠的未來,但無論是處理復雜任務、使用場景,還是技術成熟度,這些設備都存在局限,難以承擔起入口的角色。
相比之下,手機擁有龐大的用戶基數(shù)、極高的日常使用頻次以及成熟的軟硬件生態(tài),具備獨特的綜合優(yōu)勢,成為AI時代最現(xiàn)實的超級入口載體。
盡管戰(zhàn)略地位明確,但當前市場上大多數(shù)“AI手機”并未帶來顛覆性體驗,整體仍處于探索期。
僅靠視覺語言模型實時解析并可操作任意第三方App的GUI Agent路線,尚達不到消費級大規(guī)模落地的成熟度,主流廠商對此態(tài)度謹慎。豆包手機通過融合多模態(tài)大模型與系統(tǒng)級權限的技術路徑,又面臨技術創(chuàng)新與平臺規(guī)則、生態(tài)兼容和安全邊界的沖突。
但豆包手機的出現(xiàn)是一個標志,多位受訪者認為,它不僅提升了討論熱度,也迫使各大科技公司重新審視AI手機布局。從各家的能力儲備來看,可以劃分成幾個梯隊。
第一梯隊是垂直整合能力極強的系統(tǒng)級廠商,主要包括蘋果、谷歌、華為、三星。
這四家的核心優(yōu)勢在于,控制著從芯片、操作系統(tǒng)到應用分發(fā)平臺的完整全棧架構,有能力通過系統(tǒng)更新和開發(fā)規(guī)范,定義AI與應用交互的新標準,構建一個可控、安全且可持續(xù)的底層框架。但較大的組織體量和對生態(tài)安全的謹慎態(tài)度也使得它們推進步伐相對穩(wěn)健,短期內不太可能走到最前沿。
第二梯隊是擁有大模型與服務生態(tài)的軟實力企業(yè),比如微軟、OpenAI、字節(jié)跳動等。
這一類公司在大模型能力和AI算法層面具備核心競爭力,其戰(zhàn)略很可能是“以軟賦硬”,通過和硬件廠商合作的方式,將自身模型和服務集成到各類設備中,而不是自己做手機。但一方面需要找到合適的合作伙伴,另一方面需要解決操作權限的問題。
第三梯隊是具備規(guī)模優(yōu)勢與硬件經(jīng)驗的終端制造商,包括小米、OPPO、vivo、榮耀等。
它們在硬件設計、供應鏈管理和銷售渠道上具備優(yōu)勢,最重要的是,對市場需求反應很快,可以快速將AI功能下沉到中端甚至入門級機型,吸引龐大的老用戶群體,讓AI手機快速普及。
從整個格局看,無論最終勝出者是誰,都必須在開放生態(tài)與安全控制之間尋找到新的平衡。這場博弈還遠沒有停止,手機廠商會繼續(xù)加碼,AI手機的演進速度也將進一步加快。
1.本網(wǎng)刊載內容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
中國信通院正式發(fā)布2026深度觀察十大趨勢
12月13日,2026中國信通院深度觀察報告會主報告會在北京舉辦。本次報告會主題為 “面向“十五五”,人工智能浪潮下的新質生產(chǎn)力發(fā)展”。工業(yè)和信息化部黨組成員、副部長張云明出席報告會并致..[詳細]
1ms城市算網(wǎng)筑基:四川千行百業(yè)數(shù)智煥新
當前,人工智能引領的新一輪科技革命和產(chǎn)業(yè)變革正加速推進,各行各業(yè)都在嘗試以大數(shù)據(jù)、AI模型來升級業(yè)務,這對算力基礎設施及其提供服務的靈活性提出了更高的要求。為更好地支持各行各業(yè)的..[詳細]
手機輕松暢玩PC游戲?G胖引發(fā)玩家大猜想
PC游戲在手機上游玩不是新鮮事,PC游戲通過模擬器在手機上游玩也不是什么新鮮事,然而Steam親自下場,讓Arm設備能夠運行PC設備,就絕對是一件值得關注的事了。畢竟前有SteamOS的成功,甚至能..[詳細]
中國具身智能機器人市場呈六大發(fā)展趨勢,2030年市場規(guī)模將達770億美元
根據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布《中國具身智能機器人應用市場分析與典型應用實踐,2025》報告顯示,在政策、資本與產(chǎn)業(yè)鏈的三重驅動下,中國具身智能機器人市場已完成從“技術突破”到“價值落..[詳細]
中國電信柯瑞文:智能領航、智惠共生,全面擁抱人工智能推動數(shù)智生態(tài)高質量發(fā)展
當前,人工智能正以前所未有的廣度和深度融入經(jīng)濟社會各領域,重塑生產(chǎn)方式、生活方式乃至治理模式。作為建設網(wǎng)絡強國、科技強國、數(shù)字中國的重要力量,中國電信主動把握以人工智能為代表的..[詳細]













