作者cybermeow (北欧组一生推)
看板Soft_Job
标题[心得] 纯粹聊聊AI使用
时间Wed Feb 4 02:00:32 2026
也不知道哪根筋不对半夜睡不着来这个基本没在看的版发文
先上个人权
https://imgur.com/I7XPLK8
这篇文没有打算细谈任何AI实际应该怎麽使用的内容
一方面懒得说二方面我觉得这很因情况而异三方面我也不知道
纯粹想到什麽打什麽打到我睡着为止
开头放个Andrej Karpathy这篇推特
https://x.com/karpathy/status/2015883857489522876?s=46
我觉得这是最近我看到最符合个人使用经验的文章
网路上充斥许多只有AI很强跟AI没用论点的文章
真正中肯做出分析的反而很难看到 (当然也可能是推荐算法使然
喔对了小小自介一下
我最近的工作比较大的milestone是release了一个叫做nijiv7的动漫风格文生图模型
https://x.com/nijijourney/status/2009714744597643503?s=20
更之前的话则是参与midjourney video 1的开发
我的工作内容基本包涵
- 上千张显卡的模型训练
- 以亿为等级的图片影片数据处理
- 图片影像生成模型的各种调整跟feature development
比较忙的时候可能一天同时会碰到资料处理 训练 跟模型推理的代码
实际工作更杂像我最近就开副本在做别的事情 但上面可以当作是工作的主干
而个人在ai coding这一方面觉得算是经历了三个大的变革
1. chatgpt 出来後复制贴上问答
2. cursor 类型的 ide 直接导入
3. claude code等的自主 ai 代理人
3这一块我们团队也是到最近才开始比较积极探索
主要是opus 4.5, codex等模型让agent能力大幅提升
也让3使用起来带来的效益更大
(个人觉得从hype到实际落地能用通常都需要一段缓冲期
而且比起1 2 要运用好3的learning curve更陡
我最近都开玩笑说vibe coding比coding难 写skill比写code难
现在使用算是2 3混合只有在非常偶尔的情况会把独立的问题用1拿去问不同llm吧
至於模型吗 我们都是用最好的甚至claude code直接开api usage (比 team plan速度快
一个月一个人烧个几百几千美元都有 (还没算cursor跟其他杂七杂八的
ai agent这东西感觉是 用起来其实没这麽容易
也没有像网路上大部分讲的这麽万能
现在最大的问题基本是context management跟spec
毕竟目前ai还不会读心 他不知道你想做什麽
而且就算spec写好了实际跑起来还是会发现常常有遗漏
所以的确是一行code都不用写 其实我去年用cursor就几乎一行code都没写了
但会发现到头来最大的bottleneck还是人类自己
因为人类要负责提出requirement (spec)跟做evaluation
这两件事情并没有这麽简单
嘛所以像是brainstorm这种让agent厘清requirement的就很好用
至於evaluation 作为有程式背景的做code review还是最直接的方式
(上面Andrej Karpathy的文也有提到
实际上ai写的code有时候就算是对的
但就是看他的code style或是一些冗余的内容很不爽
至於那些纯vibe完全不看code的人 大概需要不同的evaluation方式吧
但考虑到ml这种超大规模数据处理跟模型训练
坦白讲你不看code你安心吗
你除了看code有什麽方式保证他在所有情况的behavior都是对的 我还真不知道
所以说 这东西真的很看情况
网路上kol说了ai多好用 但他们也不会知道怎麽把它用在千卡的集群上对吧
我有朋友在银行 或者在quant工作 那边又是完全不同的情况跟问题
每个人都有自己的工作流程目标跟限制
只能在这个为基础来尝试把ai容纳到工作流里面去
是说既然为什麽这麽麻烦为什麽还要用ai agent呢
因为人就是懒 而agent虽然不是万能 但如果用得好
对於偷懒 不对 对於提升工作效率 还是有很大帮助的
大概这样 一时没想到啥要写了 睡觉去起来继续当agent manager
--
https://i.imgur.com/LKAEPG4.png
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 160.237.80.233 (日本)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1770141650.A.FD4.html
1F:推 viper9709: 推分享02/04 02:07
※ 编辑: cybermeow (160.237.80.233 日本), 02/04/2026 02:08:37
2F:推 WTS2accuracy: 推 那些有用无用一刀切的幻想文根本是废文02/04 02:15
3F:推 RumiManiac: 强者 推02/04 02:15
4F:推 marra: 有份量的人权宣言 ^_^02/04 04:04
5F:推 pacino: 如何解决contex window size limit?02/04 07:42
无解 所以说现阶段context management 是最重要的
但可能过几个月又是不同的光景
Claude 5, ChatGPT 5.3 似乎都快出了
6F:推 kuan: 推02/04 08:23
7F:推 neo5277: 一定还是会看过一遍啊02/04 09:17
8F:→ TKB5566: 真的很多人觉得ai是废文制造机02/04 09:43
9F:→ watashino: 目前用下来context还是很大的问题 有时候还是要使用102/04 10:21
10F:推 yamakazi: 楼上 完全不用1 要把任务拆成小张票 每个票大概几次对话02/04 10:25
11F:→ yamakazi: 就可以完成 然後就叫ai commit写message02/04 10:25
12F:→ yamakazi: 不知道怎麽拆叫ai帮你拆02/04 10:25
13F:→ watashino: 不是你说的问题02/04 11:14
14F:→ watashino: 在大型专案中 这种agent一定是用rag的形式做 少数状况02/04 11:14
15F:→ watashino: 下才会读全文02/04 11:14
16F:→ watashino: 这种context不全很容易出问题02/04 11:15
17F:推 ybite: 我用Claude Code VS Code Plugin 喂给它我要改的档案 跟它02/04 11:34
18F:→ ybite: 说我想干嘛 它就左翻右翻 看完开始改 改完跑测试 好了02/04 11:34
这基本是我cursor的使用范围 局部修改 提供足够好的context通常都能解决
19F:→ ybite: 但还是会在很难预料到的地方出差错 或者鬼打墙02/04 11:35
20F:推 yamakazi: 我只能说 divide and conquer02/04 11:35
21F:→ ybite: 长期下来我认为程式码跟文件整理这种硬功夫 即便到了AI时代02/04 11:37
22F:→ ybite: 还是十分重要 即便你可能文件不是写给人看的(Skill之类)02/04 11:37
倒不如说现在写docs变得更重要了wwww
23F:推 prag222: 我用ai写自制小工具,有bug,杀进去看,解掉不用5分钟,文02/04 11:50
24F:→ prag222: 件就算了,写文件是想放轻松吃工作时数的吧,写文件还用z02/04 11:50
25F:→ prag222: ip档版控02/04 11:50
26F:推 prag222: 用ai写code 也不存在coding stlye问题,那是人类手工才02/04 11:53
27F:→ prag222: 需要规范,说实在话现在ai还比人工稳,至少不会搞诈欺摸02/04 11:53
28F:→ prag222: 工时拖延症跟埋雷02/04 11:53
Coding style的部分有两种 一种是我单纯看不爽
另一种是依个人经验来说这样写长远来讲比较好
不过这很大一部分也是看用途而定就是了
如果你的用途是完全不用做code review就能保证正确性的那你自然也可以完全不用管它写
什麽
另外就是这一部分也可以尽量在Claude.md agents.md 规范虽然它不一定会听
※ 编辑: cybermeow (160.237.80.233 日本), 02/04/2026 12:01:40
29F:推 yamakazi: Coding style没差啦,用clang formatt 自动化style就好 02/04 12:12
30F:→ yamakazi: 。早就没人在手打调整style了 02/04 12:12
31F:→ cybermeow: 我厘清一下 我这里coding style包含用什麽library 或 02/04 12:19
32F:→ cybermeow: 者一些更接近architecture design的问题 哪些函数在哪 02/04 12:19
33F:→ cybermeow: 里 做什麽等等 02/04 12:19
34F:推 v86861062: 推推 02/04 12:39
35F:推 dani1992: 推推 02/04 12:51
36F:推 Obama19: 网红永远只跟你介绍实现todo app的效果 真正有价值的内 02/04 13:47
37F:→ Obama19: 容 没有人会分享出来 都要自己试过才知道有哪些坑 02/04 13:47
38F:→ Obama19: 一堆范式随着model越来越强 很多都可以丢了 02/04 13:48
39F:推 TiredEvance: 谢分享! 02/04 13:59
40F:推 ian90911: 感谢分享 02/04 15:44
41F:推 kyrie77: 感谢大大分享,使用历程一模一样,导致最近在找工作的时 02/04 23:31
42F:→ kyrie77: 候变成额外会思考工作目前导入哪种AI coding tool,很好 02/04 23:31
43F:→ kyrie77: 奇大大有这方面的经验吗(从Team Lead/ Manager/ 企业方 02/04 23:31
44F:→ kyrie77: 视角出发)?现在玩过Claude Code和Cursor之後,这两年 02/04 23:31
45F:→ kyrie77: 来AI帮我写的code比例越来越高,但面试时听到有些企业好 02/04 23:31
46F:→ kyrie77: 像没有买这些工具,或是用自架的Qwen等模型,但使用体感 02/04 23:31
47F:→ kyrie77: 跟商用模型还是差很多… 像是大大文章中提及的其他领域 02/04 23:31
48F:→ kyrie77: 也很好奇他们业内的情况XD (刚好昨天看到Anthropic又让 02/04 23:31
49F:→ kyrie77: 美股软体股集体跳水…) 02/04 23:31
50F:推 prag222: 我朋友大公司都有买AI服务,你面试的公司不够大间吧,哈 02/05 03:35
51F:→ prag222: 我个人是写提示词写小工具,一行CODE都不用手key 02/05 03:36
52F:推 louner: 好奇你们怎麽把agent用在ML上的 我只用来做些小修补 像是 02/05 09:08
53F:→ louner: 实作GRPO变种 写log与monitor逻辑等我懒得写的部分 或让a 02/05 09:08
54F:→ louner: gents reproduce某个GitHub的实验成果 不得不说他们省下 02/05 09:08
55F:→ louner: 大量我自己写的时间 但真的要上prod我还是没那个胆子XD 02/05 09:08
56F:推 louner: context window可以用multi agent缓解 譬如让一个agent d 02/05 09:27
57F:→ louner: elegate tasks到多个sub agnets等与把那些tasks的context 02/05 09:27
58F:→ louner: 从主线任务切出去 当然主线任务太长还是没救 02/05 09:27
59F:推 deltasxxk: 所以最终还是回归 逻辑清楚 定义明确才是效率能否提高 02/05 10:39
60F:→ deltasxxk: 的关键,原本工作就不明不白的人用AI就是灾难 02/05 10:39
61F:推 ripple0129: 观念还没转变而已,未来没在看code了,就是产出大量 02/05 18:48
62F:→ ripple0129: 测试码各种行为与边界测试。时代在转变,人类介入就 02/05 18:48
63F:→ ripple0129: 是低效而已。人类越少介入越好,未来连决策次数都还 02/05 18:48
64F:→ ripple0129: 要再降低,当速度越快,成品完成丢弃的成本越低,直 02/05 18:48
65F:→ ripple0129: 接做完你看行不行这样是未来的方式。 02/05 18:48
66F:推 bitcch: 人类介入的点不会再是敲键盘产code 而是指挥管理大量agent 02/05 20:54
67F:推 wulouise: 有style很烂,像是std::chrono duration一直用count 02/05 21:15
68F:→ zzshcool: 推,实际用起来,rule skill,还要管理context 更新让後 02/05 22:14
69F:→ zzshcool: 续接手agent 能衔接,要搞大系统不容易 02/05 22:14
70F:推 wizozd84070: 雀有 02/06 05:19
71F:→ ZMTL: 那要转回AI板吗XDD 02/09 16:28
72F:推 CaptPlanet: 好奇大家有实际算过或是大概估算过纯人工或原 PO 1 02/09 22:11
73F:→ CaptPlanet: 方法跟 2, 3 之间的产出效率提升多少吗 02/09 22:11
74F:→ bndan: 用Ai配合完成工作 工时要放够大 取代位置就要够深 所以未 02/12 10:14
75F:→ bndan: 来程式码就直接像机码一样没什麽人会去看 会看的是更上层 02/12 10:14
76F:→ bndan: 的设计工作流程 这个也是只能工程师做 因为需要将ai遇到不 02/12 10:14
77F:→ bndan: 明或是困难时导回或提取代方案(甚至是实际设计逻辑) == 02/12 10:14
78F:→ bndan: 只能说写程式层级架的越高 产生的工作量能越大 但难度也是 02/12 10:14
79F:→ bndan: 一直叠上去(越来越多黑盒子 失去对应工具想直接从最根层 02/12 10:15
80F:→ bndan: 找问题更难)这种情况下几乎没办法摆个菜的..更别说连训练 02/12 10:15
81F:→ bndan: 都没有的 至少现在是这样 02/12 10:15
82F:推 viper9709: 推楼上 02/12 16:38