作者pujos (lks)
看板MobileComm
標題Re: [討論] 未來蘋果的AI會拖延好一陣子
時間Fri May 30 08:17:09 2025
那如果整合進去的AI
出來答案是有問題的怎麼辦
我今天早上在調新買的顯示器
問了
Chatgpt一個問題
2560*1440,32吋螢幕,PPI多少
https://ibb.co/4nX3gF2x
91.77
吃飽太閒的我
決定相同問題再拿去問Google、Gork
這問句我還怕誤導AI
沒有任何對話提示
Gork這樣回
https://ibb.co/4nX3gF2x
91.78...
最屌的來了
問Google
手機AI摘要
問第一次
https://ibb.co/YB10hCy4
91.1
問第二次
手抖不小心按了第二下
https://ibb.co/n85CV6F3
82.89,這三小啦
問第三次
我興趣上來了...繼續按
https://ibb.co/DDj21srY
82.17
問第四次
https://ibb.co/Pv2vFQBQ
92
問第五次
https://ibb.co/h17CxW73
82.1
真的超屌的啦
先不管回答對或錯 ,那另外一回事
問5次,5次答案都不一樣
人工智障是你???
還是覺得我重複問
代表前一個答案是錯的
再隨便搜尋一個出來唬爛
整人專家是你?
ChatGpt跟Gork好歹按二次
答案一樣啊
整合google的手機
麻煩先拿去丟掉
這玩意不能用
我這問題如果只問某個AI一次
天曉得我會抽到哪一個
問7次,7個答案
7個對1個正確率14.2%
搞不好七個答案全錯...0%
如果對我提問的問題不懂、不知道
像上面我問的一樣
這玩意能回答個狗屎
※ 引述《running9977 (LL66pu!uunr)》之銘言:
: https://youtu.be/bwu_P5EUCc4?si=NFMPtDHUYJB76jDQ
: 對岸果粉科技主林亦LYi影片討論「蘋果AI怎麼就鴿了?」
: 結論是戰犯「John Giannandrea」
: 重點如下
: 從2024WWDC屎出來的apple intelligence
: 畫出來的大餅功能及廣告影片都是「假的」
: 真相完全做不到在2025/3/7
: 媒體採訪才講「我們團隊努力中 預計明年推出」
: 原來
: 老賈過世後蘋果把「siri」定位不明確
: 「個人助理」or 「搜尋引擎」來回拉扯內鬥
: 直到2018挖角google ai工程師John Giannandrea
: 主導Ai團隊後....?
: 一路廢到現在佛系管理不知道每天衝啥
: 導致Craig Federighi領導軟體團隊互看不爽
: 直到chatgpt隔空出世後 咱們Ai團隊繼續睡Zzz
: 今年3月cook把John Giannandrea 領導Ai團隊扒光解散。
: 心得:
: 這波Ai熱潮之下蘋果落後太多太多了,以前白癡siri被
: 笑10年毫無長進,重要apple intelligence延遲推送
: 2026年,而今年4月媒體報導蘋果狂砸10億美元買
: Nvidia GPU真的太慢了,光是chatgpt每隔幾個月放
: 新模型更進化,有機會看到蘋果走下神壇一日。
: ----
: Sent from BePTT
-----
Sent from JPTT on my Xiaomi 23090RA98G.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.171.213.239 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/MobileComm/M.1748564243.A.13C.html
※ 編輯: pujos (118.171.213.239 臺灣), 05/30/2025 08:22:07
1F:推 jasonbass : 我剛才問了gemini兩次他都回答我91.79 05/30 08:41
2F:噓 JuiFu617 : 我剛才問了gemini 五次他都回答我91.79 05/30 08:53
※ 編輯: pujos (118.171.213.239 臺灣), 05/30/2025 08:55:36
4F:→ JuiFu617 : 不問gimini,而是去問手機ai摘要是在? 05/30 08:55
5F:→ pujos : 笑話,我還負責驗證你們家哪個單位給出來東西是對的 05/30 08:58
6F:→ pujos : 啊噢 05/30 08:58
7F:→ pujos : 在最顯眼的地方放錯誤回答,還真委屈了 05/30 09:17
8F:噓 ssshleo : 真棒欸 你比AI還聰明 05/30 09:27
9F:→ ssshleo : 真的是不去問Gemini去問摘要 05/30 09:28
10F:→ pujos : 更大的笑話來了 05/30 09:33
12F:→ pujos : 換問你們想要的Gemini,相乘答案都是錯的 05/30 09:35
14F:→ pujos : gork一樣錯 05/30 09:39
16F:→ pujos : GPT還是錯 05/30 09:40
18F:→ pujos : 人工智障大集合 05/30 09:40
19F:→ pujos : 這次唯一正確者,google搜尋 05/30 09:43
23F:→ JuiFu617 : deepseek用中文理解數學勝出,估計跟語言有關 05/30 09:59
24F:→ manbow77 : AI對於小數點處理似乎容易有神奇誤差 05/30 10:07
25F:推 matthewcheng: 你可以一直嗆他 他會一直算出不同的答案 05/30 10:07
26F:→ manbow77 : 會自己交給純粹計算機去算的自然會有正確答案 05/30 10:08
28F:→ manbow77 : 微軟就比較聰明直接叫計算機算 05/30 10:09
29F:→ JuiFu617 : 沒道理deepseek就算得很好啊,可能外國ai看不懂中 05/30 10:11
30F:→ JuiFu617 : 文數學表達 05/30 10:11
31F:→ manbow77 : 你可以直接打上無語言隔閡的純算式 會錯的一樣會錯 05/30 10:18
32F:推 aa1477888 : 永遠記得一件事 不要叫LLM算數學 05/30 10:23
34F:→ aa1477888 : 人家叫大型「語言」模型 不叫大型數學模型 05/30 10:24
36F:→ JuiFu617 : 年費的有一個基礎數學模型可以選 05/30 10:27
37F:→ JuiFu617 : 免費 05/30 10:28
38F:推 stlinman : 要計算請找對"數學推理"支援較高的模型! 05/30 10:28
39F:→ stlinman : 基本要正確,計算+推理(才會驗算)解題準確度才會提高 05/30 10:30
40F:噓 xoy : 不同模型適合不同用途,問題是這跟手機助理要用什 05/30 10:30
41F:→ xoy : 麼AI技術有什麼關係? 05/30 10:30
42F:→ JuiFu617 : 語言推理可能程度到大學教授,但是數學推理可能要另 05/30 10:31
43F:→ JuiFu617 : 外訓練 05/30 10:31
44F:→ manbow77 : gemini計算這問題感覺不是用算的而是參考大數據 05/30 10:34
46F:→ JuiFu617 : 確實deepseek感覺真得是有在算 05/30 10:36
47F:→ manbow77 : 純按計算機是這樣 無四捨五入的話小數點二位不是4 05/30 10:37
49F:→ manbow77 : deepseek可能跟微軟一樣是偷吃步叫計算機直接算 05/30 10:38
50F:→ JuiFu617 : 問題是解題步驟都給你條列得很清晰 05/30 10:38
51F:推 MrCool5566 : Gemini 輸 蘋果在ai再下一城 05/30 10:43
53F:→ manbow77 : gemini感覺是有算過但會比對大數據 05/30 10:47
54F:→ manbow77 : 但大數據可能其它只取到某位數四捨五入 05/30 10:48
55F:→ manbow77 : 然後混合雜音就容易在某位數出現四捨五入後的結果 05/30 10:48
56F:推 tktk1212 : 微軟贏了! 05/30 11:18
57F:→ tktk1212 : 記得以前看過有youtuber比較好幾個AI幫她算出國費用 05/30 11:19
58F:→ tktk1212 : 分攤,她結論是不要叫他們算數學(還是自己用excel 05/30 11:19
59F:→ tktk1212 : 或計算機吧) 05/30 11:19
60F:→ abadjoke : 語言模型的重點是要讓你覺得它像一個真人在回答你 05/30 11:29
61F:噓 rz759 : 來了,以為AI=大型語言模型的果果用戶xD 05/30 11:34
62F:→ spfy : 有"正確解答"除非能立即驗證例如程式碼或馬上GOOGLE 05/30 11:39
63F:→ spfy : 不然我都不會問AI...頂多是問了知道方向再自己查 05/30 11:39
64F:→ spfy : 但現在國外有很多機構常常出報告比較每個AI模型的 05/30 11:40
65F:→ spfy : 各能力可以去翻來看 不然用自己爽就好了... 05/30 11:41
66F:→ manbow77 : 這就跟當初gemini還不適合取代助理時一樣 05/30 11:46
67F:→ manbow77 : 有些簡單工作給助理啟動既有功能直接處理較有效率 05/30 11:47
68F:→ BraviaX95j : 因噎廢食 05/30 12:19
69F:→ Ryoma : 剛看到某中出律師昨天發長文訴苦、被抓包開場白抄襲 05/30 13:34
70F:→ Ryoma : 10年前隔壁黨主席的貼文開場、我們都猜是不是ai寫 05/30 13:34
71F:→ s910928 : 生成式ai又不是計算機 05/30 14:30
72F:噓 ruisme : 對對對 等AI100%對我們再考慮導入生活 你就繼續過山 05/30 14:54
73F:→ ruisme : 頂洞人生活吧 05/30 14:54
74F:推 EricTao : 我只想問為什麼字體那麼醜 05/30 15:13
75F:推 issemn : 所以Deepseek又贏了? 05/30 15:56
76F:推 GivemeApen : 數學問題記得自己點計算機 05/30 21:26
78F:→ widec : 你模型是不是都選最快最笨的那個 05/30 23:11
79F:→ yunf : 說不能算數學的通常都是文組 05/31 04:41
80F:→ yunf : 還有這些東西很多都是來自於新聞雲 05/31 04:41
81F:→ yunf : 未必是他自己算的 05/31 04:42
82F:→ yunf : 那只不過是因為Apple有保護機制 05/31 04:47
88F:→ jjjj222 : LLM是不能問數學的, 你打長加法就會一堆錯誤 05/31 15:03
89F:→ jjjj222 : 會問LLM這種東西代表你不懂LLM是怎麼運作的 05/31 15:03
90F:推 cowcowleft : 工具在好用也要有會使用的人 05/31 17:34
91F:→ cowcowleft : 不到兩年前gpt說的話可是有80%不可信呢 05/31 17:35
92F:噓 maplefff : 智障的不是AI, 是... 06/01 05:20
93F:推 kyle5241 : 一個是心算、一個按計算機本來準確度就有差 06/01 07:40