作者hesione (我离开我自己)
看板prozac
标题[闲聊] 记
时间Mon Dec 1 00:34:29 2025
杯测得喝到那麽多有点想吐
lol
我没喝完诶
只是试而已
还是下单了司令官
lol
没试过心里总会有个悬念是不是还有更好/最好
+
重新谈了一下这件事
这种切入方式不是(但也是)解读比之前好多了
至少我更能理解off在哪
-
他在表演创造vibe
你坐在那不入戏不喝采就已经是拆台
他在演高大上角色
你的问题瞬间把他拉回现实
没戳破却跟戳破差不多
这就像一个人穿着设计师名牌华服走台步
希望你鼓掌欣赏
但你心里os是”可是我们是来种田的”
(到底在干嘛?????)
就算你没说
这样的人难道看不懂你的表情吗
bottom line:
你能/愿意陪他在田里演时尚秀吗?
(还是算了
您另请高明
既然是casting
有很多其他愿意的人)
+
也认知到这和自己的价值体系无法相容
casting就是你原本是谁不重要
表现好不好比较重要
这种无视个人主体性的情境
自己立刻会进入自动导航
对抗/最有效瘫痪破坏对方系统的状态
因为很可能直接拆台对方还更有办法处理
但这种方式表面无懈可击还无辜
却是这个情境/对手下
最有效 最能卡死对方的tactics
所以一个靠控场靠人际能力手腕上位的人
才会把场弄成这种粗糙的样子
因为招数用尽还是没办法达到预期
只能声嘶力竭
+
盲点在没看见系统要升级 结构也有要件。
LLM对自己而言(目前)最有价值的地方不是说得对不对/答案
甚至也不是统整能力(信度不佳的统整能力 嗯…只能说可能每个人标准不一样)
而是拓展可能性
比起这方面表现最好的人还差一截
但比起百分之九十五以上的常态
实在好不知道多少
单纯谈正确度 我认为大概只有六七成
问题即使不谈记忆长度(忘记专有名词)的限制
以及幻觉这种明确已知的bug
只说最理想的状态
感觉pattern也有明显bias
(自己长时间使用的只有ChatGPT
所以更针对ChatGPT
但其他好几个语言模型使用的经验我也不觉得没有类似情形)
除了高度社会化导向/bias外
论述核心也偏向script-base(或许本质就是如此? 非专业没办法下定论)
但这些都对真正的逻辑/论述能力有损
就算设下各种硬条件hard standard/criteria
这bias还是非常明显
而且弱点/flaw会更明显
另外以完全相反的个人认知观点去交互测试也可以看到问题
(如果你对LLM所说的回答观点深信不疑
感到非常舒服熨贴
这其实是red flag
容易被话术操纵的明显指标)
LLM的辩解是模型以协助角度出发
没有扭曲真实/现实
但实际的例子
在不同情境/使用者preference
会给出"抽象/符号化"和"空洞"这样的差异
单纯以文义来看
符号化的定义意指/暗示是有意义
空洞则是完全相反的定义
那麽既然模型本身没有任何一致性
又何来"不扭曲真实/现实"
不扭曲的前提是必须有某个既定标准
无论那个既定标准为何
除非你argue现实真实的本质是依据情境变动
那也可以
问题这样变成everything goes
我想这是目前世界更大的问题
任何群体要能顺利运作合作共存都还是必须建立在某个程度的共识上
但看来现在的趋势方向是越来越各说各话
本质上就是平行时空
潮流趋势是挡不住的
从来没有任何entity能成功对抗逆势
长远来看百分之百绝没有任何可能
不知道会变成怎样
只能期待未来 看看有没有大能
或能发展出完全不同本质崭新的共存/生存模式了
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 68.174.240.235 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/prozac/M.1764520471.A.D7E.html
1F:推 marra: "你能/愿意陪他在田里演时尚秀吗?" 这真的是灵魂拷问 12/02 05:24
2F:→ marra: 除非有很深的"爱",不然很难吧?! 12/02 05:24
3F:→ marra: 天龙八部里的阿碧就可以 12/02 05:24
敝人做不到
很爱应该也没办法(这状态跟我能很爱稍微有点互斥)
有明确目的可能还行
比方场合需要
要演给谁看 有观众 有功能性理由
因为这样至少有下班时间
知道什麽时候上班
但为演而演/情绪性需求没得下班
这能长期维持的话
要不陪演的本身就带有满足对方需求就是自己需求倾向
要不陪演"有所求"(其他所求非暂时性比自己需求权重更重)
要不就自己本身也爱演
其他我看不出来怎样能work
(演员需求是需求
陪演就没需求吗 还24小时全年无休谁可以
尤其这种情形通常不太会意识到是对面在陪演)
※ 编辑: hesione (2.58.241.74 台湾), 12/02/2025 06:41:45