作者cybermeow (北欧组一生推)
看板AI_Art
标题[闲聊] Agents 24小时跑实验写代码
时间Sat Mar 7 14:13:40 2026
纯闲聊
前不久在软工发了一篇这篇回ai_art发
个人算是差不多一月niji7 release後才开始比较认真研究claude code
但经过一个多月我现在用法可能已经比网路上大多数的先进了 (笑
与其FOMO 其实需要的时候再研究 自己玩一玩 做中学 上手的也挺快的
首先有个东西叫FARS
https://analemma.ai/blog/introducing-fars/
证实了全自主科研的可能性 (印象中ai_art前不久有一篇有分享但一时找不到
另外agent用起来感觉这东西肯定openai anthropic内部都在搞了
所以我索性自己来研究看看
经过几天後
搞出了个类似24/7运作的multi agent ralph loop
这东西我把它包成一个skill 内部自带core libary
观看工作进度做基础管理和提交意见用的前端
甚至还附送配合框架用的skill
不同角色负责不同工作 有人写code跑实验 有人review 有人上网查资料想idea 有人协调
(当然每个agent本身自己还是可以开subagent plan review等等
然後规范好大概工作的方式 以及怎麽跟人类沟通
人类意见优先 需要人类帮助时要跟人类说
支持多种後端 claude code, codex cli, cursor cli, gemini cli, opencode
稍微大方向类似的可能有
https://github.com/steveyegge/gastown
https://github.com/ruvnet/ruflo
但实际细节差蛮多的而且我没搞的这麽复杂
从头搭一方面是学习一方面是我更了解系统到底在干麻一方面是好客制化
说真的这时代造轮子太方便了
像是claude code remote, openclaw这些
都可以用claude code辅助搭出一个更适合自己使用场景的工具
这东西为了安全性考量当然是要在container跑
针对不同机器的container也折磨了一番 然後agents就有8xb200之类的能做实验了
但这还不够 毕竟我们需要多卡训练资料处理或者有些特别难搞的环境依赖
这一部分的话就自己在container外面host一个endpoint限制好他能做的东西让agent访问
反正就想尽各种方法在够安全的前提给agent加手脚
这些以前我自己搞可能要很久 但现在有claude code几小时就搞定了
整套跑通後剩下就是等着收割
指派任务给agent他就会自己找资料做实验写报告
但是agent产生的artifact太多我根本看不完 只能让他们自己总结
如果感觉agent方向走偏了
就直接让他依照需求写个前端给你即时给feedback
像是自己当annotator做active learning
或者好几种不同的选项自己来判断哪个结果更好之类的
如果说用一般用claude code是让你感到工作的方式变了
那这一套就是让你彻底感受到工作内容变了
从synchronous变成asynchronous 从driver变成manager
agent产出的太快 人类甚至已经跟不上了
不过一开始研究这东西纯用api key乱测不同方法烧了上千美元
後来迭代到现在比较成熟的版本後 大概一个team plan感觉够给一个agent 24/7的烧
然後我还配着codex, cursor cli之类的一起用
但真的要scale up这个开销肯定是很可观的
(好像有些人搞了好几个200美的plan 这比直接烧api usage便宜不少
反正这套是跑通了
剩下每个人自己体悟
再多说就牵扯太多工作内容了
我知道有人在养龙虾来达成类似的事情
但我觉得龙虾还是太早了 而且coding agent很够用了
背後用什麽其实可能没那麽重要 你让他们做什麽怎麽合作可能更关键些
--
https://i.imgur.com/LKAEPG4.png
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 160.237.80.233 (日本)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1772864029.A.F0D.html
※ 编辑: cybermeow (160.237.80.233 日本), 03/07/2026 14:27:41
1F:推 Supasizeit: 我觉得Ralph不太好用 很多问题不是硬干就可以干出来03/07 15:26
2F:→ Supasizeit: Agent会卡在兔子洞绕绕绕出不来 烧token而已03/07 15:26
我从头做的不是拿Ralph
但概念不断让不同agent工作可能类似
这东西如果这麽容易我前面也不用烧上几千美元试错
他背後很多需要调整的地方
会卡在兔子洞是因为agent短期近利
然後相关背景知识不够
这要跑通从claude.md到不同角色的prompt到给的knowledge base到工作规范方向很多地方
要下功夫
不是像Ralph loop表面说的我给他事情他自己就会完成这麽简单 现在还没到
※ 编辑: cybermeow (160.237.80.233 日本), 03/07/2026 17:59:18
3F:推 Supasizeit: 应该是标的物不同 我的感觉是现在的agent还是要重度s 03/07 20:18
4F:→ Supasizeit: pec然後标的物很小 用龙虾那种玩法 大多数能成功都是 03/07 20:18
5F:→ Supasizeit: 抄来的 03/07 20:18
6F:推 avans: 推分享~ 03/07 21:23