Soft_Job 板


LINE

也不知道哪根筋不对半夜睡不着来这个基本没在看的版发文 先上个人权 https://imgur.com/I7XPLK8 这篇文没有打算细谈任何AI实际应该怎麽使用的内容 一方面懒得说二方面我觉得这很因情况而异三方面我也不知道 纯粹想到什麽打什麽打到我睡着为止 开头放个Andrej Karpathy这篇推特 https://x.com/karpathy/status/2015883857489522876?s=46 我觉得这是最近我看到最符合个人使用经验的文章 网路上充斥许多只有AI很强跟AI没用论点的文章 真正中肯做出分析的反而很难看到 (当然也可能是推荐算法使然 喔对了小小自介一下 我最近的工作比较大的milestone是release了一个叫做nijiv7的动漫风格文生图模型 https://x.com/nijijourney/status/2009714744597643503?s=20 更之前的话则是参与midjourney video 1的开发 我的工作内容基本包涵 - 上千张显卡的模型训练 - 以亿为等级的图片影片数据处理 - 图片影像生成模型的各种调整跟feature development 比较忙的时候可能一天同时会碰到资料处理 训练 跟模型推理的代码 实际工作更杂像我最近就开副本在做别的事情 但上面可以当作是工作的主干 而个人在ai coding这一方面觉得算是经历了三个大的变革 1. chatgpt 出来後复制贴上问答 2. cursor 类型的 ide 直接导入 3. claude code等的自主 ai 代理人 3这一块我们团队也是到最近才开始比较积极探索 主要是opus 4.5, codex等模型让agent能力大幅提升 也让3使用起来带来的效益更大 (个人觉得从hype到实际落地能用通常都需要一段缓冲期 而且比起1 2 要运用好3的learning curve更陡 我最近都开玩笑说vibe coding比coding难 写skill比写code难 现在使用算是2 3混合只有在非常偶尔的情况会把独立的问题用1拿去问不同llm吧 至於模型吗 我们都是用最好的甚至claude code直接开api usage (比 team plan速度快 一个月一个人烧个几百几千美元都有 (还没算cursor跟其他杂七杂八的 ai agent这东西感觉是 用起来其实没这麽容易 也没有像网路上大部分讲的这麽万能 现在最大的问题基本是context management跟spec 毕竟目前ai还不会读心 他不知道你想做什麽 而且就算spec写好了实际跑起来还是会发现常常有遗漏 所以的确是一行code都不用写 其实我去年用cursor就几乎一行code都没写了 但会发现到头来最大的bottleneck还是人类自己 因为人类要负责提出requirement (spec)跟做evaluation 这两件事情并没有这麽简单 嘛所以像是brainstorm这种让agent厘清requirement的就很好用 至於evaluation 作为有程式背景的做code review还是最直接的方式 (上面Andrej Karpathy的文也有提到 实际上ai写的code有时候就算是对的 但就是看他的code style或是一些冗余的内容很不爽 至於那些纯vibe完全不看code的人 大概需要不同的evaluation方式吧 但考虑到ml这种超大规模数据处理跟模型训练 坦白讲你不看code你安心吗 你除了看code有什麽方式保证他在所有情况的behavior都是对的 我还真不知道 所以说 这东西真的很看情况 网路上kol说了ai多好用 但他们也不会知道怎麽把它用在千卡的集群上对吧 我有朋友在银行 或者在quant工作 那边又是完全不同的情况跟问题 每个人都有自己的工作流程目标跟限制 只能在这个为基础来尝试把ai容纳到工作流里面去 是说既然为什麽这麽麻烦为什麽还要用ai agent呢 因为人就是懒 而agent虽然不是万能 但如果用得好 对於偷懒 不对 对於提升工作效率 还是有很大帮助的 大概这样 一时没想到啥要写了 睡觉去起来继续当agent manager -- https://i.imgur.com/LKAEPG4.png --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 160.237.80.233 (日本)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1770141650.A.FD4.html
1F:推 viper9709: 推分享02/04 02:07
※ 编辑: cybermeow (160.237.80.233 日本), 02/04/2026 02:08:37
2F:推 WTS2accuracy: 推 那些有用无用一刀切的幻想文根本是废文02/04 02:15
3F:推 RumiManiac: 强者 推02/04 02:15
4F:推 marra: 有份量的人权宣言 ^_^02/04 04:04
5F:推 pacino: 如何解决contex window size limit?02/04 07:42
无解 所以说现阶段context management 是最重要的 但可能过几个月又是不同的光景 Claude 5, ChatGPT 5.3 似乎都快出了
6F:推 kuan: 推02/04 08:23
7F:推 neo5277: 一定还是会看过一遍啊02/04 09:17
8F:→ TKB5566: 真的很多人觉得ai是废文制造机02/04 09:43
9F:→ watashino: 目前用下来context还是很大的问题 有时候还是要使用102/04 10:21
10F:推 yamakazi: 楼上 完全不用1 要把任务拆成小张票 每个票大概几次对话02/04 10:25
11F:→ yamakazi: 就可以完成 然後就叫ai commit写message02/04 10:25
12F:→ yamakazi: 不知道怎麽拆叫ai帮你拆02/04 10:25
13F:→ watashino: 不是你说的问题02/04 11:14
14F:→ watashino: 在大型专案中 这种agent一定是用rag的形式做 少数状况02/04 11:14
15F:→ watashino: 下才会读全文02/04 11:14
16F:→ watashino: 这种context不全很容易出问题02/04 11:15
17F:推 ybite: 我用Claude Code VS Code Plugin 喂给它我要改的档案 跟它02/04 11:34
18F:→ ybite: 说我想干嘛 它就左翻右翻 看完开始改 改完跑测试 好了02/04 11:34
这基本是我cursor的使用范围 局部修改 提供足够好的context通常都能解决
19F:→ ybite: 但还是会在很难预料到的地方出差错 或者鬼打墙02/04 11:35
20F:推 yamakazi: 我只能说 divide and conquer02/04 11:35
21F:→ ybite: 长期下来我认为程式码跟文件整理这种硬功夫 即便到了AI时代02/04 11:37
22F:→ ybite: 还是十分重要 即便你可能文件不是写给人看的(Skill之类)02/04 11:37
倒不如说现在写docs变得更重要了wwww
23F:推 prag222: 我用ai写自制小工具,有bug,杀进去看,解掉不用5分钟,文02/04 11:50
24F:→ prag222: 件就算了,写文件是想放轻松吃工作时数的吧,写文件还用z02/04 11:50
25F:→ prag222: ip档版控02/04 11:50
26F:推 prag222: 用ai写code 也不存在coding stlye问题,那是人类手工才02/04 11:53
27F:→ prag222: 需要规范,说实在话现在ai还比人工稳,至少不会搞诈欺摸02/04 11:53
28F:→ prag222: 工时拖延症跟埋雷02/04 11:53
Coding style的部分有两种 一种是我单纯看不爽 另一种是依个人经验来说这样写长远来讲比较好 不过这很大一部分也是看用途而定就是了 如果你的用途是完全不用做code review就能保证正确性的那你自然也可以完全不用管它写 什麽 另外就是这一部分也可以尽量在Claude.md agents.md 规范虽然它不一定会听 ※ 编辑: cybermeow (160.237.80.233 日本), 02/04/2026 12:01:40
29F:推 yamakazi: Coding style没差啦,用clang formatt 自动化style就好 02/04 12:12
30F:→ yamakazi: 。早就没人在手打调整style了 02/04 12:12
31F:→ cybermeow: 我厘清一下 我这里coding style包含用什麽library 或 02/04 12:19
32F:→ cybermeow: 者一些更接近architecture design的问题 哪些函数在哪 02/04 12:19
33F:→ cybermeow: 里 做什麽等等 02/04 12:19
34F:推 v86861062: 推推 02/04 12:39
35F:推 dani1992: 推推 02/04 12:51
36F:推 Obama19: 网红永远只跟你介绍实现todo app的效果 真正有价值的内 02/04 13:47
37F:→ Obama19: 容 没有人会分享出来 都要自己试过才知道有哪些坑 02/04 13:47
38F:→ Obama19: 一堆范式随着model越来越强 很多都可以丢了 02/04 13:48
39F:推 TiredEvance: 谢分享! 02/04 13:59
40F:推 ian90911: 感谢分享 02/04 15:44
41F:推 kyrie77: 感谢大大分享,使用历程一模一样,导致最近在找工作的时 02/04 23:31
42F:→ kyrie77: 候变成额外会思考工作目前导入哪种AI coding tool,很好 02/04 23:31
43F:→ kyrie77: 奇大大有这方面的经验吗(从Team Lead/ Manager/ 企业方 02/04 23:31
44F:→ kyrie77: 视角出发)?现在玩过Claude Code和Cursor之後,这两年 02/04 23:31
45F:→ kyrie77: 来AI帮我写的code比例越来越高,但面试时听到有些企业好 02/04 23:31
46F:→ kyrie77: 像没有买这些工具,或是用自架的Qwen等模型,但使用体感 02/04 23:31
47F:→ kyrie77: 跟商用模型还是差很多… 像是大大文章中提及的其他领域 02/04 23:31
48F:→ kyrie77: 也很好奇他们业内的情况XD (刚好昨天看到Anthropic又让 02/04 23:31
49F:→ kyrie77: 美股软体股集体跳水…) 02/04 23:31
50F:推 prag222: 我朋友大公司都有买AI服务,你面试的公司不够大间吧,哈 02/05 03:35
51F:→ prag222: 我个人是写提示词写小工具,一行CODE都不用手key 02/05 03:36
52F:推 louner: 好奇你们怎麽把agent用在ML上的 我只用来做些小修补 像是 02/05 09:08
53F:→ louner: 实作GRPO变种 写log与monitor逻辑等我懒得写的部分 或让a 02/05 09:08
54F:→ louner: gents reproduce某个GitHub的实验成果 不得不说他们省下 02/05 09:08
55F:→ louner: 大量我自己写的时间 但真的要上prod我还是没那个胆子XD 02/05 09:08
56F:推 louner: context window可以用multi agent缓解 譬如让一个agent d 02/05 09:27
57F:→ louner: elegate tasks到多个sub agnets等与把那些tasks的context 02/05 09:27
58F:→ louner: 从主线任务切出去 当然主线任务太长还是没救 02/05 09:27
59F:推 deltasxxk: 所以最终还是回归 逻辑清楚 定义明确才是效率能否提高 02/05 10:39
60F:→ deltasxxk: 的关键,原本工作就不明不白的人用AI就是灾难 02/05 10:39
61F:推 ripple0129: 观念还没转变而已,未来没在看code了,就是产出大量 02/05 18:48
62F:→ ripple0129: 测试码各种行为与边界测试。时代在转变,人类介入就 02/05 18:48
63F:→ ripple0129: 是低效而已。人类越少介入越好,未来连决策次数都还 02/05 18:48
64F:→ ripple0129: 要再降低,当速度越快,成品完成丢弃的成本越低,直 02/05 18:48
65F:→ ripple0129: 接做完你看行不行这样是未来的方式。 02/05 18:48
66F:推 bitcch: 人类介入的点不会再是敲键盘产code 而是指挥管理大量agent 02/05 20:54
67F:推 wulouise: 有style很烂,像是std::chrono duration一直用count 02/05 21:15
68F:→ zzshcool: 推,实际用起来,rule skill,还要管理context 更新让後 02/05 22:14
69F:→ zzshcool: 续接手agent 能衔接,要搞大系统不容易 02/05 22:14
70F:推 wizozd84070: 雀有 02/06 05:19
71F:→ ZMTL: 那要转回AI板吗XDD 02/09 16:28
72F:推 CaptPlanet: 好奇大家有实际算过或是大概估算过纯人工或原 PO 1 02/09 22:11
73F:→ CaptPlanet: 方法跟 2, 3 之间的产出效率提升多少吗 02/09 22:11
74F:→ bndan: 用Ai配合完成工作 工时要放够大 取代位置就要够深 所以未 02/12 10:14
75F:→ bndan: 来程式码就直接像机码一样没什麽人会去看 会看的是更上层 02/12 10:14
76F:→ bndan: 的设计工作流程 这个也是只能工程师做 因为需要将ai遇到不 02/12 10:14
77F:→ bndan: 明或是困难时导回或提取代方案(甚至是实际设计逻辑) == 02/12 10:14
78F:→ bndan: 只能说写程式层级架的越高 产生的工作量能越大 但难度也是 02/12 10:14
79F:→ bndan: 一直叠上去(越来越多黑盒子 失去对应工具想直接从最根层 02/12 10:15
80F:→ bndan: 找问题更难)这种情况下几乎没办法摆个菜的..更别说连训练 02/12 10:15
81F:→ bndan: 都没有的 至少现在是这样 02/12 10:15
82F:推 viper9709: 推楼上 02/12 16:38







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP