作者cybermeow (北欧组一生推)

看板Soft_Job

标题

[心得] 纯粹聊聊AI使用

时间Wed Feb 4 02:00:32 2026

也不知道哪根筋不对半夜睡不着来这个基本没在看的版发文先上个人权 https://imgur.com/I7XPLK8 这篇文没有打算细谈任何AI实际应该怎麽使用的内容一方面懒得说二方面我觉得这很因情况而异三方面我也不知道纯粹想到什麽打什麽打到我睡着为止开头放个Andrej Karpathy这篇推特 https://x.com/karpathy/status/2015883857489522876?s=46 我觉得这是最近我看到最符合个人使用经验的文章网路上充斥许多只有AI很强跟AI没用论点的文章真正中肯做出分析的反而很难看到 (当然也可能是推荐算法使然喔对了小小自介一下我最近的工作比较大的milestone是release了一个叫做nijiv7的动漫风格文生图模型 https://x.com/nijijourney/status/2009714744597643503?s=20 更之前的话则是参与midjourney video 1的开发我的工作内容基本包涵 - 上千张显卡的模型训练 - 以亿为等级的图片影片数据处理 - 图片影像生成模型的各种调整跟feature development 比较忙的时候可能一天同时会碰到资料处理训练跟模型推理的代码实际工作更杂像我最近就开副本在做别的事情但上面可以当作是工作的主干而个人在ai coding这一方面觉得算是经历了三个大的变革 1. chatgpt 出来後复制贴上问答 2. cursor 类型的 ide 直接导入 3. claude code等的自主 ai 代理人 3这一块我们团队也是到最近才开始比较积极探索主要是opus 4.5, codex等模型让agent能力大幅提升也让3使用起来带来的效益更大 (个人觉得从hype到实际落地能用通常都需要一段缓冲期而且比起1 2 要运用好3的learning curve更陡我最近都开玩笑说vibe coding比coding难写skill比写code难现在使用算是2 3混合只有在非常偶尔的情况会把独立的问题用1拿去问不同llm吧至於模型吗我们都是用最好的甚至claude code直接开api usage (比 team plan速度快一个月一个人烧个几百几千美元都有 (还没算cursor跟其他杂七杂八的 ai agent这东西感觉是用起来其实没这麽容易也没有像网路上大部分讲的这麽万能现在最大的问题基本是context management跟spec 毕竟目前ai还不会读心他不知道你想做什麽而且就算spec写好了实际跑起来还是会发现常常有遗漏所以的确是一行code都不用写其实我去年用cursor就几乎一行code都没写了但会发现到头来最大的bottleneck还是人类自己因为人类要负责提出requirement (spec)跟做evaluation 这两件事情并没有这麽简单嘛所以像是brainstorm这种让agent厘清requirement的就很好用至於evaluation 作为有程式背景的做code review还是最直接的方式 (上面Andrej Karpathy的文也有提到实际上ai写的code有时候就算是对的但就是看他的code style或是一些冗余的内容很不爽至於那些纯vibe完全不看code的人大概需要不同的evaluation方式吧但考虑到ml这种超大规模数据处理跟模型训练坦白讲你不看code你安心吗你除了看code有什麽方式保证他在所有情况的behavior都是对的我还真不知道所以说这东西真的很看情况网路上kol说了ai多好用但他们也不会知道怎麽把它用在千卡的集群上对吧我有朋友在银行或者在quant工作那边又是完全不同的情况跟问题每个人都有自己的工作流程目标跟限制只能在这个为基础来尝试把ai容纳到工作流里面去是说既然为什麽这麽麻烦为什麽还要用ai agent呢因为人就是懒而agent虽然不是万能但如果用得好对於偷懒不对对於提升工作效率还是有很大帮助的大概这样一时没想到啥要写了睡觉去起来继续当agent manager -- https://i.imgur.com/LKAEPG4.png --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 160.237.80.233 (日本) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1770141650.A.FD4.html

1^F：推 viper9709: 推分享02/04 02:07

※ 编辑: cybermeow (160.237.80.233 日本), 02/04/2026 02:08:37

2^F：推 WTS2accuracy: 推那些有用无用一刀切的幻想文根本是废文02/04 02:15

3^F：推 RumiManiac: 强者推02/04 02:15

4^F：推 marra: 有份量的人权宣言 ^_^02/04 04:04

5^F：推 pacino: 如何解决contex window size limit?02/04 07:42

无解所以说现阶段context management 是最重要的但可能过几个月又是不同的光景 Claude 5, ChatGPT 5.3 似乎都快出了

6^F：推 kuan: 推02/04 08:23

7^F：推 neo5277: 一定还是会看过一遍啊02/04 09:17

8^F：→ TKB5566: 真的很多人觉得ai是废文制造机02/04 09:43

9^F：→ watashino: 目前用下来context还是很大的问题有时候还是要使用102/04 10:21

10^F：推 yamakazi: 楼上完全不用1 要把任务拆成小张票每个票大概几次对话02/04 10:25

11^F：→ yamakazi: 就可以完成然後就叫ai commit写message02/04 10:25

12^F：→ yamakazi: 不知道怎麽拆叫ai帮你拆02/04 10:25

13^F：→ watashino: 不是你说的问题02/04 11:14

14^F：→ watashino: 在大型专案中这种agent一定是用rag的形式做少数状况02/04 11:14

15^F：→ watashino: 下才会读全文02/04 11:14

16^F：→ watashino: 这种context不全很容易出问题02/04 11:15

17^F：推 ybite: 我用Claude Code VS Code Plugin 喂给它我要改的档案跟它02/04 11:34

18^F：→ ybite: 说我想干嘛它就左翻右翻看完开始改改完跑测试好了02/04 11:34

这基本是我cursor的使用范围局部修改提供足够好的context通常都能解决

19^F：→ ybite: 但还是会在很难预料到的地方出差错或者鬼打墙02/04 11:35

20^F：推 yamakazi: 我只能说 divide and conquer02/04 11:35

21^F：→ ybite: 长期下来我认为程式码跟文件整理这种硬功夫即便到了AI时代02/04 11:37

22^F：→ ybite: 还是十分重要即便你可能文件不是写给人看的（Skill之类）02/04 11:37

倒不如说现在写docs变得更重要了wwww

23^F：推 prag222: 我用ai写自制小工具,有bug,杀进去看，解掉不用5分钟，文02/04 11:50

24^F：→ prag222: 件就算了，写文件是想放轻松吃工作时数的吧，写文件还用z02/04 11:50

25^F：→ prag222: ip档版控02/04 11:50

26^F：推 prag222: 用ai写code 也不存在coding stlye问题，那是人类手工才02/04 11:53

27^F：→ prag222: 需要规范，说实在话现在ai还比人工稳，至少不会搞诈欺摸02/04 11:53

28^F：→ prag222: 工时拖延症跟埋雷02/04 11:53

Coding style的部分有两种一种是我单纯看不爽另一种是依个人经验来说这样写长远来讲比较好不过这很大一部分也是看用途而定就是了如果你的用途是完全不用做code review就能保证正确性的那你自然也可以完全不用管它写什麽另外就是这一部分也可以尽量在Claude.md agents.md 规范虽然它不一定会听 ※ 编辑: cybermeow (160.237.80.233 日本), 02/04/2026 12:01:40

29^F：推 yamakazi: Coding style没差啦，用clang formatt 自动化style就好 02/04 12:12

30^F：→ yamakazi: 。早就没人在手打调整style了 02/04 12:12

31^F：→ cybermeow: 我厘清一下我这里coding style包含用什麽library 或 02/04 12:19

32^F：→ cybermeow: 者一些更接近architecture design的问题哪些函数在哪 02/04 12:19

33^F：→ cybermeow: 里做什麽等等 02/04 12:19

34^F：推 v86861062: 推推 02/04 12:39

35^F：推 dani1992: 推推 02/04 12:51

36^F：推 Obama19: 网红永远只跟你介绍实现todo app的效果真正有价值的内 02/04 13:47

37^F：→ Obama19: 容没有人会分享出来都要自己试过才知道有哪些坑 02/04 13:47

38^F：→ Obama19: 一堆范式随着model越来越强很多都可以丢了 02/04 13:48

39^F：推 TiredEvance: 谢分享！ 02/04 13:59

40^F：推 ian90911: 感谢分享 02/04 15:44

41^F：推 kyrie77: 感谢大大分享，使用历程一模一样，导致最近在找工作的时 02/04 23:31

42^F：→ kyrie77: 候变成额外会思考工作目前导入哪种AI coding tool，很好 02/04 23:31

43^F：→ kyrie77: 奇大大有这方面的经验吗（从Team Lead/ Manager/ 企业方 02/04 23:31

44^F：→ kyrie77: 视角出发）？现在玩过Claude Code和Cursor之後，这两年 02/04 23:31

45^F：→ kyrie77: 来AI帮我写的code比例越来越高，但面试时听到有些企业好 02/04 23:31

46^F：→ kyrie77: 像没有买这些工具，或是用自架的Qwen等模型，但使用体感 02/04 23:31

47^F：→ kyrie77: 跟商用模型还是差很多… 像是大大文章中提及的其他领域 02/04 23:31

48^F：→ kyrie77: 也很好奇他们业内的情况XD (刚好昨天看到Anthropic又让 02/04 23:31

49^F：→ kyrie77: 美股软体股集体跳水…） 02/04 23:31

50^F：推 prag222: 我朋友大公司都有买AI服务,你面试的公司不够大间吧,哈 02/05 03:35

51^F：→ prag222: 我个人是写提示词写小工具,一行CODE都不用手key 02/05 03:36

52^F：推 louner: 好奇你们怎麽把agent用在ML上的我只用来做些小修补像是 02/05 09:08

53^F：→ louner: 实作GRPO变种写log与monitor逻辑等我懒得写的部分或让a 02/05 09:08

54^F：→ louner: gents reproduce某个GitHub的实验成果不得不说他们省下 02/05 09:08

55^F：→ louner: 大量我自己写的时间但真的要上prod我还是没那个胆子XD 02/05 09:08

56^F：推 louner: context window可以用multi agent缓解譬如让一个agent d 02/05 09:27

57^F：→ louner: elegate tasks到多个sub agnets等与把那些tasks的context 02/05 09:27

58^F：→ louner: 从主线任务切出去当然主线任务太长还是没救 02/05 09:27

59^F：推 deltasxxk: 所以最终还是回归逻辑清楚定义明确才是效率能否提高 02/05 10:39

60^F：→ deltasxxk: 的关键，原本工作就不明不白的人用AI就是灾难 02/05 10:39

61^F：推 ripple0129: 观念还没转变而已，未来没在看code了，就是产出大量 02/05 18:48

62^F：→ ripple0129: 测试码各种行为与边界测试。时代在转变，人类介入就 02/05 18:48

63^F：→ ripple0129: 是低效而已。人类越少介入越好，未来连决策次数都还 02/05 18:48

64^F：→ ripple0129: 要再降低，当速度越快，成品完成丢弃的成本越低，直 02/05 18:48

65^F：→ ripple0129: 接做完你看行不行这样是未来的方式。 02/05 18:48

66^F：推 bitcch: 人类介入的点不会再是敲键盘产code 而是指挥管理大量agent 02/05 20:54

67^F：推 wulouise: 有style很烂，像是std::chrono duration一直用count 02/05 21:15

68^F：→ zzshcool: 推，实际用起来，rule skill，还要管理context 更新让後 02/05 22:14

69^F：→ zzshcool: 续接手agent 能衔接，要搞大系统不容易 02/05 22:14

70^F：推 wizozd84070: 雀有 02/06 05:19

71^F：→ ZMTL: 那要转回AI板吗XDD 02/09 16:28

72^F：推 CaptPlanet: 好奇大家有实际算过或是大概估算过纯人工或原 PO 1 02/09 22:11

73^F：→ CaptPlanet: 方法跟 2, 3 之间的产出效率提升多少吗 02/09 22:11

74^F：→ bndan: 用Ai配合完成工作工时要放够大取代位置就要够深所以未 02/12 10:14

75^F：→ bndan: 来程式码就直接像机码一样没什麽人会去看会看的是更上层 02/12 10:14

76^F：→ bndan: 的设计工作流程这个也是只能工程师做因为需要将ai遇到不 02/12 10:14

77^F：→ bndan: 明或是困难时导回或提取代方案（甚至是实际设计逻辑） == 02/12 10:14

78^F：→ bndan: 只能说写程式层级架的越高产生的工作量能越大但难度也是 02/12 10:14

79^F：→ bndan: 一直叠上去（越来越多黑盒子失去对应工具想直接从最根层 02/12 10:15

80^F：→ bndan: 找问题更难）这种情况下几乎没办法摆个菜的..更别说连训练 02/12 10:15

81^F：→ bndan: 都没有的至少现在是这样 02/12 10:15

82^F：推 viper9709: 推楼上 02/12 16:38

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Soft_Job 板

[心得] 纯粹聊聊AI使用

热门看板

赞助商连结