作者lucien0410 (lucein)
看板Stock
标题Re: [新闻] Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高
时间Mon Jan 27 12:25:51 2025
总觉得这个横空出世的deepseek有点猫腻
像LDPC大所说 感觉好像真的用了openai 的ChatGpt的数据来创造训练资料 但openAI很难
证明自己的东西被偷了
我去看了一下deepseek的python api怎麽用
很有趣 结果deepseek用的是 openai的library
https://api-docs.deepseek.com/
```
# Please install OpenAI SDK first: `pip3 install openai`
from openai import OpenAI
client = OpenAI(api_key="<DeepSeek API Key>", base_url="
https://api.deepseek.c
om")
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "You are a helpful assistant"},
{"role": "user", "content": "Hello"},
],
stream=False
)
print(response.choices[0].message.content)
```
难道OpenAI里面出了个中国间谍?
※ 引述《LDPC (Channel Coding)》之铭言:
: 目前就在旁边吃瓜观望@@ 成本这种本就是用开源後的可以拿已有的模型去当辅助下降
成?
: 最常见作法就是拿gpt-4o当judge或者当数据产生器 去精炼数据集 如果再没有gpt-4o
: 情况下 很多高质量资料去产生就花很钱 最经点例子就是LLaVa 一个博士班学生 用gpt
-4
: 去产生高质量多模态数158k 极小量数据集 用8xA100 1天时间 就干爆之前所有
: 多模态大模型 能打赢saleforce的一间大公司堆出来的多模态BLIP-2模型
: 这家伙精髓站就是在gpt-4模型巨人的肩膀上
: 资料的quality会影响大模型 而资料可以透过开源高质量模型去萃取
: 如果再套用COT 这些都可以继续进化 paper有些细节像是数据集这类如何精炼
: 反而可能会是一个重要一环 但大家都会藏这类细节 @@/
: 2025现在大家都杀到LLM Agent去了 LLM刷模型任务分数热潮有点下降
: 大部分都跑去搞LLM决策部分 和COT (思考链) 多步骤分析任务
: 像是waymo自驾端对端的决策都搞了一个EMMA 用Gemini 去往上盖
: (这时候自驾公司有自己的很强的LLM就很有用了 随手不负责预测亚麻zoox会拿自家
: LLM或anthropic来搞end-2-end多模态)
: 然後LLM Agent如果要放在机器人和自驾
: 一定得on-device 因为云端延迟太慢 风险高 所以1B~4B这阵子的on-device模型
: 能力也在不断突破 所以on-device LLM不太会在是AI-PC 除非是属於私密资料等应用场
景
: 而edge/on-devcie AI 可能突破点会在机器人
: 自驾的趋势之後会跟LLM走上同阵线 在某个时间点 等闭源LLM开始时 就是差不多AI模
型
: 的尽头开始产业化 也许端对端LLM决策 可以强化视觉上标签数据不足 (不确定这点
: 但直觉上认为 思考练LLM Agent可以降低场景车用数据量..QQ 基於模型泛化能力)
: 这会给其他车厂追上特斯拉的机会 特斯拉自身的LLM可来自grok 而3D基础模型
: foundation model 像是李飞飞的空间模型 有一定机会能帮助自驾 可以直接融合LLM
: 产生端对端多模态 而李飞飞又跟狗家走很近 所以想单赌个股 可以赌赌看狗家
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 67.150.123.92 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1737951957.A.14E.html
你才是大大 改好了 :)
2F:→ lucien0410 : wow 01/27 12:29
※ 编辑: lucien0410 (67.150.123.92 美国), 01/27/2025 12:30:35
3F:嘘 musie : 哪里来的菜鸡 OpenAI的lib已经是standard protocol 01/27 12:30
5F:→ dosiris : 开源还想赚钱 哪个开源软件有赚钱 01/27 12:30
6F:推 Brioni : 你这个AI圈的人应该都知道了,以为只有你知道? 01/27 12:31
7F:推 sali921 : 开源的也没啥阿 01/27 12:31
8F:推 ggian123 : 相信股板AI大师 一定是抄的偷的 我们知道天安门 01/27 12:32
9F:嘘 qwe78971 : 是不是菜鸡啊 到底知不知道自己在打啥文章 01/27 12:33
10F:→ lucien0410 : 我的确是菜啊 m大分享知识 感恩 01/27 12:34
11F:嘘 Samurai : 不懂没关系,不要乱讲吧 01/27 12:35
12F:→ TaiwanUp : 不是啦 是DeepSeek里面有大巨人在运作啦 01/27 12:35
13F:推 Brioni : 着眼点不同,大神研究模型算法跟效能,有些人只关注 01/27 12:35
14F:→ Brioni : 训练过程有没有记得输入天安门…. 01/27 12:35
15F:→ TaiwanUp : 这样也被你发现 01/27 12:36
16F:推 dosiris : 说不定华西街不知道 求记者报导 01/27 12:41
17F:→ lucien0410 : 我问 “可以谈谈为什麽毛泽东要发动文化大革命吗” 01/27 12:41
18F:→ lucien0410 : 他叫我别聊这个 聊别的 太有趣XD 01/27 12:44
19F:嘘 dongdong0405: 笑死这篇超菜 那已经是通用的接口格式了 01/27 12:45
20F:嘘 matlab1106 : 美国大厂肯定没请到原po这种人才XD 01/27 12:47
21F:嘘 ksjr : ==只是一个名称而已 01/27 12:55
22F:嘘 holebro : 笑死 01/27 13:03
23F:推 tonsofdamage: 笑死,六四天安门不能问 01/27 13:13
24F:嘘 lionel20002 : 菜爆www 01/27 13:14
25F:→ previa : 北七,就Restful接口标准化,根boto3去兼容aws一样 01/27 15:48
26F:→ previa : 连openstack最後都要把api接口做的跟aws兼容 01/27 15:49
27F:→ previa : 你不懂还要硬说人抄袭? 01/27 15:49
28F:推 s1612316 : 当你发现的时候 是不是觉得赢过世界上顶尖工程师了 01/27 16:48
29F:嘘 bleeza : 你都发现了,怎麽不做一个台湾人版的deepseek呢? 01/27 17:37
30F:嘘 s213092921 : 你是电你是光,你是唯一的神话 01/27 18:03
31F:推 tangolosss : 算到8964就自动当机 这种AI谁敢用?? 笑死 XDDDDD 01/27 18:16
32F:嘘 ARui : 你是反串还是菜啊 01/27 19:23