作者iaminnocent (人生無常)

看板Stock

標題

Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高

時間Sun Jan 26 10:24:00 2025

剛剛看FB，發現有個中國的作家對於Deepseek的作文水平感到驚訝，用了相同問題，以王家衛的電影風格去撰寫標題為人生何處不相逢的散文，來分別問CHATGPT-O1跟Deepseek-R1 ChatGPT-O1: https://i.imgur.com/T2jN9hZ.jpeg Deepseek-R1: https://i.imgur.com/IitIbR0.jpeg 我是覺得Deepseek的回答好像有點純堆砌王家衛的電影名台詞的感覺，通篇王家衛感，但是不知道在說甚麼 ChatGPT 在最後有點出散文標題，內容也比較有切合標題這應該可以當作兩者的能力小比拼吧？ -------- 補：我也有用4O用相同問題問過，我覺得寫得比O1跟R1還好 https://i.imgur.com/7DN4Dz9.jpeg 這滿神奇的，O1應該是ChatGPT 最強的模型，但是寫散文我覺得沒有4O寫得好 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.228.63.38 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1737858242.A.BEE.html

1^F：推 s213092921 : 重點是Deepseek背後的成本只有ChatGPT的20分之1 01/26 10:34

2^F：→ iaminnocent : 確實，訓練成本這件事情蠻令人訝異的，OpenAi也宣 01/26 10:41

3^F：→ iaminnocent : 布O3-mini將免費了 01/26 10:41

4^F：→ TaiwanUp : 如果不知道是台詞 R1有故事感但無邏輯結尾有蛇年感01/26 10:44

5^F：推 breathair : 只代表對於演算法大科技也要花大錢挖人 01/26 10:45

6^F：→ breathair : 來搞了，算力的投資不會減少，不然等你 01/26 10:45

7^F：→ breathair : 演算法追上，算力又落後了怎辦？01/26 10:45

8^F：推 strlen : r1實際用遠不如抬面上的啦只有評測嚇人無庸質疑01/26 10:55

9^F：→ TaiwanUp : O1比較像沒有人生經驗學生寫可以再tune一段小故事01/26 10:55

10^F：→ strlen : 但deepseek重點在它開源還公開論文好耶作功德誰01/26 10:55

11^F：→ strlen : 不愛？載回來用免錢改免錢的中國人要作功德當然好01/26 10:56

12^F：→ TaiwanUp : R1就每段都小故事恐怕就是直接從劇本拼湊出來的01/26 10:56

13^F：推 mamorui : pretrain的成本占總成本7-9成，R1是只管posttrain01/26 10:58

14^F：→ mamorui : ，R1高成本會嚇死人。 01/26 10:58

15^F：推 mamorui : 然後是DeepSeek-V3宣稱557萬，但strawberry幾個r也01/26 11:03

16^F：→ mamorui : 會錯的跟其他一模一樣，如果pretrain全部自己的資01/26 11:03

17^F：→ mamorui : 料怎麼會錯01/26 11:03

18^F：推 s213092921 : http://i.imgur.com/NWWWmUD.jpg01/26 11:04

19^F：推 mamorui : 簡單說，成本漂亮那就不要有那麼多別的模型的影子01/26 11:07

20^F：→ mamorui : 。01/26 11:07

21^F：→ iaminnocent : 其實樓上有點出問題，pretrain的預標數據集才是最01/26 11:08

22^F：→ iaminnocent : 貴的，這些可能都是美國公司花大錢去做的01/26 11:08

23^F：→ iaminnocent : pretrain資料集需要人工介入標記，這個東西貴鬆鬆 01/26 11:08

24^F：推 mamorui : 我沒有說不能吹能力，但成本就誇張了，我想看的是D 01/26 11:11

25^F：→ mamorui : eepSeek從pretrain就是土法煉鋼，那才叫真的沒花這 01/26 11:11

26^F：→ mamorui : 麼多成本。01/26 11:11

27^F：推 mamorui : 我沒看那麼多文章，如果有人找到paper解釋DeepSeek 01/26 11:16

28^F：→ mamorui : v3為什麼strawberry的r幾個錯的跟其他模型一模一 01/26 11:16

29^F：→ mamorui : 樣是理所當然，而且預訓練是很純的資料（這家公司01/26 11:16

30^F：→ mamorui : 自己收集的資料、沒有借助其他LLM產生好資料 =》01/26 11:16

31^F：→ mamorui : 準備好資料是預訓練之常識）01/26 11:16

32^F：推 y800122155 : 從Transformer到GPT到ChatGPT等LLM，不都是一直堆疊01/26 11:16

33^F：→ y800122155 : 在前人的成果? 現在DS發表用RL訓練不就只是換一種疊01/26 11:16

34^F：→ y800122155 : 法? 自己要發布論文發布技術本來就是願意給別人用讓01/26 11:16

35^F：→ y800122155 : 產業一起推進，在那邊吵什麼別人在哪個階段沒花到錢01/26 11:16

36^F：→ y800122155 : 不公平有啥意義? 01/26 11:16

37^F：→ mamorui : 做到上述兩項，那我就真的給這家鼓掌01/26 11:16

38^F：推 woker : 中國出產品走向是中低成本市場。沒有一定要當頂尖01/26 11:17

39^F：→ woker : 但cp值可能不錯01/26 11:17

40^F：→ icexice : deepseek的回答真的好王家衛XD01/26 11:17

41^F：→ TaiwanUp : V3的排名還是差4o(11月版)較遠跟4o(五月版)較近01/26 11:19

42^F：推 mamorui : 沒說他們沒花錢，重點前人pretrain花多少，嘲笑前01/26 11:19

43^F：→ mamorui : 人砸大錢，DeepSeek應該pretrain的資料總該是全部01/26 11:19

44^F：→ mamorui : 都自己的、沒有用其他LLM生成的，有人要背書嗎？01/26 11:19

45^F：→ TaiwanUp : 中低成本4o再開放一點權限給免費版就有了 01/26 11:20

46^F：→ mamorui : 有人要幫DeepSeek背書pretrain的資料準備嗎 01/26 11:20

47^F：推 y800122155 : 所以是DS的工程師還是老闆自己出來"嘲笑"嗎? 現實就 01/26 11:24

48^F：→ y800122155 : 是如果別人能重現 DS R1，在算力巨大差異下可以直接01/26 11:24

49^F：→ y800122155 : 加碼做到 R10、R100、R1000，到時DS花的500萬也是一 01/26 11:24

50^F：→ y800122155 : 樣丟到水裡 01/26 11:24

51^F：推 mamorui : 我們看的是總成本，只要找到證明背書pretrain，雖01/26 11:24

52^F：→ mamorui : 然正確率差一點，這成本就真的是今年最神的，很簡01/26 11:24

53^F：→ mamorui : 單。01/26 11:24

54^F：→ strlen : https://tinyurl.com/3dfs2j8k 楊立昆都說話了這就01/26 11:24

55^F：→ strlen : 站在前人肩膀上發展但也開源沒有藏所以很棒稱讚01/26 11:25

56^F：→ strlen : 成本怎麼樣無所謂啦他都要作功德了一塊成本都是賺01/26 11:25

57^F：→ strlen : 阿祖就是號召大家AI都來作功德變成今天這樣很合理01/26 11:26

58^F：推 mamorui : 是啊我對於佛心沒意見 XD 01/26 11:26

59^F：→ TaiwanUp : DS的預訓練要用上微信用戶聊天訊息可能會比較霸氣01/26 11:26

60^F：→ strlen : 誰不曉得中國最厲害的就是魔改別人的東西？01/26 11:26

61^F：→ strlen : 但deepseek算有良心了公開魔改方法過去一堆垃圾偷01/26 11:27

62^F：→ mamorui : 學術界是齊心討論，可沒酸前人01/26 11:27

63^F：→ strlen : 人家的營利就算了還反告別人嘻嘻01/26 11:27

64^F：→ mamorui : 我都直接拿strawberry看是不是資料同源 XDDD01/26 11:28

65^F：→ strlen : 老實講你有GPU有伺服抓r1下來自己調一調開API 它01/26 11:28

66^F：→ strlen : 也不能拿你怎樣這樣還不好？01/26 11:28

67^F：→ jatj : 好啦 1/20 1/20 阿就比較爛啊阿就買不到算力啊 01/26 11:29

68^F：推 mamorui : API就可以串接了繼續拿資料才是目的 01/26 11:29

69^F：推 mamorui : 開源的原因很好懂我之前整合資料庫免費的最popul 01/26 11:31

70^F：→ mamorui : ar的Postgres會支援其他免費的就再說01/26 11:31

71^F：→ mamorui : 所以知道為什麼要開源碼市占是真的很重要 01/26 11:32

72^F：→ mamorui : 因為公司可以決定支援的順序 01/26 11:32

73^F：推 wangm4a1 : 站在巨人肩膀上科技正常現象01/26 11:33

74^F：推 Enzofulgura : 看完覺得Deepseek比較懂得王家衛XD01/26 11:39

75^F：→ iaminnocent : 但是文章內容跟標題完全沒關系XDD01/26 11:42

76^F：→ s860703 : 講這麼多美股續漲01/26 11:49

77^F：推 tradeent : DeepSeek寫得比較好01/26 11:50

78^F：→ tradeent : http://i.imgur.com/c9C1WzU.jpg01/26 11:50

79^F：推 Liberl : 股癌的台股美股電報群已經有很多大神分析過了01/26 11:53

80^F：→ Liberl : 去那邊看就好了 01/26 11:54

81^F：→ Liberl : 或是Miula的臉書也有討論01/26 11:54

82^F：推 toulio81 : 中國公司很多的低成本都是假象，要不就是用品質實01/26 11:54

83^F：→ toulio81 : 際上無法穩定達標的產品充數，要不就是政府補貼導01/26 11:54

84^F：→ toulio81 : 致的低成本，歐美無法學後者，而前者更是一條死路01/26 11:54

85^F：推 tradeent : 請問樓上怎麼加電報群01/26 11:55

86^F：→ iaminnocent : tradent大，因為我是限定用O1跟R1這兩個來進行，如01/26 11:56

87^F：→ iaminnocent : 果用4O跟V3，也會有不一樣結果，這蠻特別的，我也01/26 11:56

88^F：→ iaminnocent : 覺得4O寫的比O1好01/26 11:56

89^F：→ iaminnocent : 以下是4O寫的，我反而覺得寫得比O1還好01/26 11:59

90^F：→ iaminnocent : https://i.imgur.com/7DN4Dz9.jpeg01/26 11:59

91^F：→ iaminnocent : 最後那句「真好，人生何處不相逢」有震驚到我，這01/26 11:59

92^F：→ iaminnocent : 個還是在O1之前我先用4O寫的01/26 11:59

93^F：→ iaminnocent : 但因為我想說要比較兩個最強的，就以O1比R1，但是01/26 12:00

94^F：→ iaminnocent : 我覺得寫散文反而4O好於O101/26 12:00

95^F：推 mamorui : o1是推理型，以r1為例，我問r1不清楚的先問v3、再01/26 12:01

96^F：→ mamorui : 啟動r1，r1就突然知道了01/26 12:01

※ 編輯: iaminnocent (125.228.63.38 臺灣), 01/26/2025 12:02:48

97^F：→ iaminnocent : 得到結論，王家衛的文字用理論是不行的XD要用感情 01/26 12:04

98^F：推 mamorui : 如果是AGI，就不會有能力差異，表現如何是穩定的， 01/26 12:05

99^F：→ mamorui : 雖然還沒有AGI。現在看到LLM會出並存的系列，就當 01/26 12:05

100^F：→ mamorui : 做遊戲角色各種族差異，要想好先用誰再用誰，AI的 01/26 12:05

101^F：→ mamorui : 思考跟記憶是仿人腦（非電腦），所以可以交錯問。 01/26 12:05

102^F：推 mamorui : 像r1就是一定要推理，關掉才能切到V3 01/26 12:06

103^F：推 maxc55555 : 怎麼辦，我只覺得是王家衛寫的好不好的差別，而且 01/26 13:04

104^F：→ maxc55555 : 散文本來就很吃共鳴XD 01/26 13:04

105^F：推 ntr203 : 之前看過中國豆包跟gpt辯論，再來比一次阿 01/26 13:06

106^F：推 pcjimmy : 寫文章的話，4O的能力好很多 01/26 13:09

107^F：推 PoloHuang : 這邊高手好多 01/26 13:39

108^F：推 SuperBig78 : 可以多生成幾篇試試嗎？感覺每次生成的結果應該會有 01/26 13:46

109^F：→ SuperBig78 : 程度上的差異，但deep seek成本相對chatGPT系列真的 01/26 13:46

110^F：→ SuperBig78 : 滿低的@@ 01/26 13:46

111^F：推 s213092921 : https://reurl.cc/qn2dXy 01/26 13:48

112^F：推 tcypost : 這邊對作家最有用的是R1，對學生有用的是4O 01/26 14:14

113^F：→ tcypost : O1只是通順，沒有特色 01/26 14:15

114^F：推 utn875 : 再次證明站在巨人肩膀是最划算策略 01/26 14:17

115^F：推 chaohsiung : 做功德的話 api的token應該要免費才是 01/26 14:18

116^F：推 chaohsiung : O1 4O 嚴謹程度設定應該不一樣 01/26 14:20

117^F：→ iaminnocent : 對作家最有用的不是R1吧，他就只是把王家衛的台詞 01/26 14:21

118^F：→ iaminnocent : 搬過來，作家這樣寫會被告抄襲吧 01/26 14:21

119^F：推 mrmowmow : 你用九把刀的品味去評鑑4o比較好的嗎？ 01/26 14:34

120^F：推 smallph01 : 我是比較喜歡01的版本每一句都讓我想多停留幾秒去 01/26 14:44

121^F：→ smallph01 : 思考它的意涵意境也讓我又一次驚訝Chatgpt 的能力 01/26 14:44

122^F：→ iaminnocent : 4O有呈現回憶細節感，相比起O1來說我覺得較容易閱 01/26 14:50

123^F：→ iaminnocent : 讀阿 01/26 14:50

124^F：→ newwu : 很明顯R1寫得最爛 01/26 15:46

125^F：推 poeoe : 很明顯DeepSeek寫的最有感 01/26 16:29

126^F：推 DarkerDuck : 數學、程式、科學那種需要推理的才會用到o1 01/26 18:11

127^F：推 mamorui : 沒有按Deep think其實是走V3, 按了才是R1（或者R1- 01/26 18:11

128^F：→ mamorui : preview ? ) ˊ_>ˋ 01/26 18:11

129^F：→ DarkerDuck : 你散文用o1寫反而讓CoT毀了原本流暢的寫作脈絡 01/26 18:12

130^F：→ DarkerDuck : 4o才是符合寫作直覺的產生方式 01/26 18:12

131^F：→ DarkerDuck : OpenAI又不是傻了，o1最強為什麼還要留個4o 01/26 18:13

132^F：→ DarkerDuck : 我自己再問那些篇直覺的問題也是只問4o 01/26 18:13

133^F：→ DarkerDuck : 用o1還占我使用的額度 01/26 18:14

134^F：推 mamorui : 樓上那些詩句看起來沒有走推理系，有的話問題下方 01/26 18:14

135^F：→ mamorui : 會看到跑一堆邏輯推理 01/26 18:14

136^F：→ DarkerDuck : 而且有些問題需要網路最新資料，也只能用4o網路搜尋 01/26 18:14

137^F：推 mamorui : DeepSeek明顯被gpt資料模板牽著走，連search的那條 01/26 18:17

138^F：→ mamorui : entry也長一樣 01/26 18:17

139^F：推 mamorui : DeepSeek卻無法整合V3跟Search，真的超奇怪的，理 01/26 18:20

140^F：→ mamorui : 論上Search的資料跟GPT無關，他們可以輕鬆突破才對 01/26 18:20

141^F：→ mamorui : 。 01/26 18:20

142^F：推 tsubasawolfy: 你去看o1出來時跟4o的對比會發現作文那邊沒增強 01/26 18:20

143^F：→ tsubasawolfy: 因為o1就是邏輯能力 01/26 18:20

144^F：推 tcypost : 作家用R1改寫後會最有特色，其他沒有改寫空間 01/26 18:24

145^F：→ tcypost : R1少了很多邏輯上的連接詞，但是這對作家又不難 01/26 18:25

146^F：→ tcypost : R1引導的是一些無法使用大膽文字的作家做出改變 01/26 18:27

147^F：推 mamorui : 其實這題很怪，我自己測試r1也出現午夜三點十七分 01/26 18:53

148^F：→ mamorui : ，我用o1開頭也不會這樣 XD 01/26 18:53

149^F：推 mamorui : 不換個時間？ https://imgur.com/9M2I5y1 01/26 18:55

150^F：推 dragonjj : 有03了喔 01/26 19:28

151^F：推 ariadne : 有人問Deepseek大躍進給出答案後過兩秒撤回答案 01/26 19:49

152^F：→ ariadne : 改回答這個違法不能問這樣你覺得可以？ 01/26 19:49

153^F：→ iaminnocent : 我們使用AI的目的是要測他夠不夠聰明，能否被人類 01/26 20:10

154^F：→ iaminnocent : 接受，這三篇拿去秘密給國文老師修改R1那篇一定第 01/26 20:11

155^F：→ iaminnocent : 一個被打不及格阿，因為根本文不對題 01/26 20:11

156^F：推 guanting886 : 你是永遠沒辦法看到GPT模型會有文筆或真的理解你的 01/26 23:03

157^F：→ guanting886 : 問題 01/26 23:03

158^F：→ guanting886 : 因為從底層他就不是那樣子運作的再怎麼調整都只是 01/26 23:04

159^F：→ guanting886 : 學人講話 01/26 23:04

160^F：→ guanting886 : 舉例來說：你去跟他詢問某一個字的甲骨文源頭金文 01/26 23:06

161^F：→ guanting886 : 發展為什麼要用這個包含裡面字為什麼擺下面他也 01/26 23:06

162^F：→ guanting886 : 不會知道但他會想辦法掰給你 01/26 23:06

163^F：→ guanting886 : 明明就寫反了他還是一本正經的跟你胡說八道 01/26 23:06

164^F：→ guanting886 : 他不是不差他只能這樣如果要給他一個程度的話 01/26 23:07

165^F：→ guanting886 : 他就像Yahoo知識+上的那些「專家」國小、國中生看 01/26 23:08

166^F：→ guanting886 : 到就很熱情的幫你Google出答案只求最佳解答而且 01/26 23:08

167^F：→ guanting886 : 就算他真的不知道也要湊答案掰給你看 01/26 23:08

168^F：→ guanting886 : 但GPT模型有個好處就是你想問很冷門的東西他也能 01/26 23:09

169^F：→ guanting886 : 回你一二句 01/26 23:09

170^F：推 guanting886 : 以前用OpenAI去生圖就叫他不要再給我裡面的某一個 01/26 23:15

171^F：→ guanting886 : 物件了他還是硬要給我 01/26 23:15

172^F：→ guanting886 : 為什麼阿就這些東西都從擴散模型生出來的他怎麼會 01/26 23:16

173^F：→ guanting886 : 做減法 01/26 23:16

174^F：推 stlinman : 認真說一下繪圖AI是發散->收斂，負向提示詞或二次抹 01/27 03:02

175^F：→ stlinman : 除還是能做減法。但LLM就真的是在算計機率。 01/27 03:03

176^F：→ a9564208 : 所以哪個比較像王家衛？ 01/27 11:07

177^F：→ iaminnocent : 以問題的內容來說，我希望生成一篇有王家衛風格的 01/27 11:28

178^F：→ iaminnocent : 標題為人生何處不相逢的散文，R1當然最像王家衛風 01/27 11:28

179^F：→ iaminnocent : 格，但是內容狗屁不通阿，就是照搬動王家衛的電影 01/27 11:28

180^F：→ iaminnocent : 台詞，你是希望AI生成屎味的巧克力還是巧克力味的 01/27 11:28

181^F：→ iaminnocent : 屎，這不是很明白嗎？ 01/27 11:28

182^F：推 geige : Deepseek可能是學中文的比較懂亞洲的東西 01/27 17:25

183^F：推 lemondrink : deepseek版才是王家衛 01/28 14:43

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Stock 板

Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高

熱門看板

贊助商連結