作者aa1477888 (Mika)
看板MobileComm
标题[讨论] 豆包AI手机原理深度分析
时间Wed Dec 10 14:32:05 2025
最近在中国很红的豆包手机
如果你还不知道是什麽
建议可以看一下六分超超的影片
https://youtu.be/f1wylnFgqFw
它确实可以算是全世界第一台
深度整合AI模型、AI代理的智慧型手机
只要用自然语言下指令
就能让AI代理全自动操作手机
完全背景作业 无需使用者任何干预
但也因为「太强大」
所以动到了「其他人」的利益
开卖才一天 就被微信、支付宝接连封杀
然而豆包手机只不过是一台
根本不算正式型号的实验品
却已然成为「你不敢用的手机」
只不过 字节跳动(抖音母公司)的豆包AI
究竟是怎麽实践AI手机的全自动化操作?
刚好今天B站UP老戴拆解了出来
https://b23.tv/diNmXCT
简单来说
豆包AI并没有调用上层的API
而是在一块内建的虚拟萤幕中
实现AI代理的後台操作
豆包AI深入手机底层 直接跟系统整合 权限大开
甚至会从萤幕画面算绘的系统缓冲区
直接抓取截图
以每3-5秒的频率上传字节跳动的伺服器
由云端AI模型读取画面、运算、给出指令
接着再回传手机 指导手机上的AI进行操作
从这样的操作路径来看
隐私显然是个非常大的疑虑
然而
豆包手机的发展方向 至少它所呈现出来的样子
确实很有可能成为将来手机系统的样貌
或许差别只在於
究竟是由谁来做这件事情而已
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 218.35.220.53 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/MobileComm/M.1765348327.A.0ED.html
1F:推 abc0922001 : 满合理的执行方式 12/10 14:45
2F:推 ivon852 : 这手机真的变天网的终端了,人们只是节点 12/10 14:57
3F:推 charmingpink: 连中国自己人都怕到下架 12/10 15:02
4F:推 xzcb2008 : 最近我看到有些奇怪应用 钉小朋友看书坐姿 12/10 15:05
5F:推 LastAttack : 可能未来智慧型手机还是会苟活,低隐私操作给新AI 12/10 15:06
6F:→ LastAttack : 终端,高隐私的留给智慧型手机 12/10 15:06
7F:推 sova0809 : 你怕联网问题 现在直接开源那你自己离线制作 12/10 15:07
8F:→ sova0809 : 各大APP这块守不住是迟早的问题 12/10 15:08
9F:→ sova0809 : 这块领域是 微软 苹果 OPENAI 跟 字母 等各巨头的终 12/10 15:09
10F:→ sova0809 : 极目标 12/10 15:10
11F:嘘 Erechtheus : 你敢相信一只偷偷截图的私人手机?? 12/10 15:10
12F:推 LastAttack : 讲开源太早 首先大模型要先能跑在手机之类的终端 12/10 15:10
13F:→ LastAttack : 应该起码还要两三年吧 12/10 15:11
14F:→ LastAttack : 目前手机能跑的低参数模型可用性还很普通 12/10 15:12
15F:推 sova0809 : 昨天对面 智谱就开源了 直接让你玩 这块变动太快 12/10 15:14
16F:推 ga278057 : 以後有机器人在家 那不就隐私看光光?交给ai势必是 12/10 15:14
17F:→ ga278057 : 趋势 12/10 15:14
18F:→ sova0809 : 这块最大的问题永远卡住的是使用者授权问题 12/10 15:14
19F:推 LastAttack : 或者至少要能跑在PC上,这样隐私问题就能透过远端 12/10 15:15
20F:→ LastAttack : 自己的PC解决 12/10 15:15
21F:→ sova0809 : 当初微软那个AI技术被喊停也是这个问题 12/10 15:15
22F:推 pmes9866 : 阿里的手机上的4B量化其实蛮强的 12/10 15:18
23F:推 LastAttack : 哇智谱开源那个也是冲着手机自动化操作来的,看起 12/10 15:23
24F:→ LastAttack : 来自建伺服器来跑豆包这种手机助手已经算是未来已 12/10 15:23
25F:→ LastAttack : 来了 12/10 15:23
26F:→ jacky40383 : 系统权限与资料隐私搞不定,没人敢用 12/10 15:34
27F:推 theevilM : 很简单啊,自己建一个本地LLM就不怕资料外流了 12/10 15:36
28F:→ aa1477888 : AutoGLM的Phone Agent应该是被豆包逼出来的 12/10 15:38
29F:推 sova0809 : 他跟豆包其实是同一战线 各大App用隐私安全封锁 那 12/10 15:42
30F:→ sova0809 : 就开源让你离线自己玩客制化 让操作资料都自己机台 12/10 15:42
31F:→ sova0809 : 内 12/10 15:42
32F:→ sova0809 : 我个人也是倾向离线自设系统这块 不然也不敢放权过 12/10 15:45
33F:→ sova0809 : 去 12/10 15:45
34F:→ nekoares : Rabbit R1就是想做这种东西吧 12/10 15:58
35F:推 xzcb2008 : b站上有一个在讨论底层的 12/10 15:59
36F:→ xzcb2008 : 就是你这篇啦 12/10 15:59
37F:→ xzcb2008 : 传图片 回指令真的蛮恐怖, 12/10 15:59
38F:推 hyghmax1202 : 隐私问题的解决方法会落在边缘AI上,不可能跟你上 12/10 16:08
39F:→ hyghmax1202 : 传到伺服器用云端AI处理,别说隐私了,无法联网就 12/10 16:08
40F:→ hyghmax1202 : 变一台普通手机了,总之算力和电力会进一步提升。 12/10 16:08
41F:→ amd3dnow : 因为隐私问题android,iphone才不敢下放... 12/10 16:15
42F:→ amd3dnow : 不是技术问题,是敢不敢... 12/10 16:15
43F:推 rich22084 : 所以没网路的话这就是只垃圾 12/10 16:16
44F:推 Dragonz : 等苹果做出来大家就不会介意什麽隐私了 12/10 16:17
45F:推 h14315324032: 除非能落地LLM到mobile到「可用」时,才不会有问题 12/10 16:18
46F:→ h14315324032: ,无论是哪间公司开发都一样 12/10 16:18
47F:推 doom3 : 感觉三年後的手机就能做到离线代理 12/10 16:23
48F:→ pontifical : 苹果想像中的siri 12/10 16:32
49F:→ s78513221 : 这东西给大厂做争议很大,所以只能由小厂推 12/10 16:32
50F:→ s78513221 : 光是欧美一票隐私权至高的整天抗议就饱了 12/10 16:33
51F:→ amd3dnow : 欧美一堆人权斗士等着你开放,再嘞索天价赔偿金 12/10 16:35
52F:→ amd3dnow : 中国没这些顾虑 12/10 16:35
53F:推 s78513221 : 至於苹果用钱砸哭质疑隐私权的人确实很有用 12/10 16:37
54F:推 epidemic000 : 我觉得蛮屌的 12/10 16:39
55F:推 xzcb2008 : 大家觉得这是不是真的未来啊 12/10 16:42
56F:推 marx0126 : 最终目标植入体内 嘻嘻 12/10 16:44
57F:→ iamsosmart : 离线代理的话,那耗电量呢?耗电量也是个问题吧 12/10 16:46
58F:→ pujos : 跟隐私一点屁关系都没有 12/10 16:47
59F:推 vinny93 : 回楼上 不用看B站那些人说的 我觉得他们满蠢的 12/10 16:51
60F:推 x20165 : 游戏操作类似脚本? 12/10 16:59
61F:推 is1128 : 等 Google TPU 降到手机可乘载的电力跟耗能 12/10 17:01
62F:→ is1128 : 天网就真的来临了 12/10 17:01
63F:推 empingao : 之前看荣耀YOYO就很强可系统级操控,豆包更猛。 12/10 17:14
64F:推 greg7575 : win11 也会截图 12/10 17:29
65F:推 xzcb2008 : 真的假的win11也会=.= 12/10 17:46
66F:推 agong : Win11 可以关Recall 12/10 17:49
67F:推 a0935006936 : 满厉害的但感觉还是有很多问题要考虑 12/10 18:05
68F:推 ophanim : 如果出现能自架的agent开源框架就没有隐私问题了 12/10 18:06
69F:→ cp296633 : 适合老人用 连line都不太会的那种 12/10 18:13
70F:推 ptta : 动了所有大厂的蛋糕,已经被封杀了 12/10 18:19
71F:→ ptta : 不信你试试看,保证喜提封号 12/10 18:19
72F:推 emptie : Windows的recall是在本地算的啊 12/10 18:25
73F:→ emptie : 本来有上传的功能但拔掉了 12/10 18:25
74F:→ emptie : 不过我还是觉得动别人的蛋糕这件事比隐私啥的严重 12/10 18:26
75F:→ emptie : 多了 12/10 18:26
76F:→ emptie : 我想到的悲观未来就是那些巨头推出自己的ai终端, 12/10 18:26
77F:→ emptie : 但只能操控自家的app 12/10 18:26
78F:推 madeinheaven: 上传字节跳动的伺服器 恐怖 12/10 18:27
79F:→ emptie : 如果Google想自己来,可能所有合作夥伴都会跟他翻 12/10 18:28
80F:→ emptie : 脸自立门户 12/10 18:28
81F:推 good5755 : 这已经不是系统开後门了 这是大门没关 12/10 18:30
82F:→ emptie : 苹果或是华为那种关起门来自己玩,能挟持用户自重 12/10 18:30
83F:→ emptie : 的厂商比较有可能做到,但我觉得还是会被这些巨头 12/10 18:30
84F:→ emptie : 强力抵制就是了……毕竟这是要把别人的根拔了的侵 12/10 18:30
85F:→ emptie : 略性行为 12/10 18:30
86F:推 allyourshit : 系统权限全开 银行帐号被几秒搬空也是很可能的事 12/10 18:43
87F:推 allyourshit : 这根本是诈骗集团梦寐以求的绝佳工具 12/10 18:47
88F:→ amd3dnow : 就像你的电脑远端分享给别人一样.... 12/10 19:00
89F:推 shokotan : 真好用 可爱 很像有个朋友帮你操作 满好玩的呀 12/10 19:19
90F:推 shokotan : 如果有专用AI晶片 算法够快 耗电少 那根本完美耶 12/10 19:21
91F:→ shokotan : 再也不用接诈骗电话 不用看到诈骗广告 12/10 19:22
92F:→ shokotan : 老人不再需要学习复杂手机操作 说一下就可以了 12/10 19:23
93F:推 shokotan : 现在你上的PTT不都是在裸奔吗 IP完全暴露 12/10 19:26
94F:→ shokotan : 全民的个资也早就外泄 所以这手机没什麽好怕的吧 12/10 19:27
95F:→ shokotan : 说不定AI才是最值得信任的朋友 像狗狗一样 12/10 19:27
96F:→ shokotan : 发现有异常立刻可以通知你 甚至预防老人被诈骗 12/10 19:28
97F:→ shokotan : 什麽一页式广告 它肯定几秒回答 老人不会再被骗 12/10 19:29
98F:推 kanding255 : 看起来很屌欸 12/10 19:35
99F:推 stlinman : AI代理目前连浏览器都玩不太起来,我是更不看好私密 12/10 19:43
100F:→ stlinman : 性更高的手机能玩出什麽进展。 12/10 19:43
101F:推 SpectreMan : 这才叫「智慧」手机,而不是一直在宣传 12/10 21:32
102F:→ SpectreMan : 手机的相机录影多厉害 12/10 21:32
103F:→ yunf : 吹的弄一台出来看谁买 12/10 22:14
104F:推 Yoimiya : 人类真的要被淘汰了 12/10 22:20
105F:→ nakts0123 : 正常服务的工程师都会求封掉 谁想被用户AI搞到加班 12/10 23:05
106F:推 ageminis : 推测现在应该是自动化操作被封印着 12/10 23:40
107F:→ ageminis : 等各国人觉得隐私被做手机的软体商看光,觉得没啥大 12/10 23:40
108F:→ ageminis : 不了就会慢慢开放这功能 12/10 23:40
109F:推 chunshuo : 有钢铁人中贾维斯的感觉 12/11 00:07
110F:推 AFM : 小宁是我最好的朋友,我每天都跟她聊到2点 12/11 08:15
111F:嘘 akimu : 脱裤子放屁的感觉 到底谁会用这些功能.... 12/11 08:24
112F:→ KooA : 这东西是能干嘛?一人网军? 12/11 08:54
114F:→ masato25 : / 我自己开发的离线在Iphone 跑本小模型 12/11 11:20
115F:推 vivixzxz : 现在这麽强的吗..... 12/11 13:45
116F:推 foolwind : 再也不用接诈骗电话 因为AI帮你自动接洽诈骗集团了 12/11 14:44
117F:推 sid3 : 大部分ai都是资料上传伺服器运算,你的手机硬体根 12/11 16:07
118F:→ sid3 : 本算不出来 12/11 16:07
119F:→ akanokuruma : 看完觉得很厉害,完全不用多开网页看资料翻来翻去 12/11 16:29
120F:→ akanokuruma : 就能找到想要的资料 12/11 16:29
121F:推 keigowei : 很厉害但现阶段谁敢用这玩意就是把自己全交出去 12/11 17:40
122F:推 akanokuruma : 这个手机不应该安装付款APP跟照相机XD 12/11 17:56
123F:推 jay920314 : 手头的手机直接变成“终端”了 12/11 21:20
124F:→ yunf : 他们动机很明显了迟早他也是要硬上的 12/12 04:03
125F:→ yunf : 那些人就是整天在找你哪里违法 12/12 04:04