作者driftcreator (貓爹)
看板AC_In
標題Re: [洽特] RisuAI的簡易上手指南
時間Thu May 1 03:19:04 2025
---近期AI競賽新聞---
.Qwen 3發佈
.DeepSeek R2先走汁開始流出來了,很快就會正式發佈
.Meta自己推出Llama的官方API,未來幾週會正式上線
據說蜥蜴人為了扳回AI競賽劣勢,只要判定你是在RP,Llama就不會擋母湯內容
.Grok 3.5下週xAI平台上線,不過新API依然是Coming Sooooooooooon
.Google一直有把匿名模型丟去跑分的小動作
---記憶調控/HypeMemroy V3設定---
Anthocyanin是arca.live上分享相關設定的韓國鄉民。懶得了解細節可以直接照抄;想要研究的,把說明文塞進LLM去翻譯研讀
設定 & Prompts
https://arca.live/b/characterai/126582536
機制說明
https://arca.live/b/characterai/130561629
另外,建議當對話tokens達到上下文三倍左右、劇情跑到節點時進行彙整,重開新的對話
一來跑起來高效;二來比較不會遇到AI抽不到關鍵記憶;三來省點tokens錢
(查tokens:進階設定 > 啟用開發者工具,然後角色卡最右邊會多出一隻扳手 > tokens)
1. 確認你有把最重要、絕對不能忘的東西寫進作者備註或放進Lorebook開"始終啟用"
2. 把對話的json匯出,然後扔給Gemini 2.5 Pro / Grok 3開thinking進行總結
3. 確認LLM有把對話總結好,如果有遺漏的話自己補或是重新下prompts
4. 滿意總結內容後,把總結放進Lorebook開"始終啟用"
5. 把對話匯回角色卡,然後把對話全部刪掉,這樣才可以保留作者備註跟參數
(輔助功能 > 刪除訊息時連帶刪除後續訊息)
6. 封存舊對話,然後新對話繼續遊玩
---預算設定---
這個跟你滿足於哪個模型有關。
如果覺得Gemini 2.5 Flash、本地模型與小用量的Gemini 2.5 Pro就很讚了,那無課就好
不滿足的話就去Openrouter投點幣,測哪個模型比較合胃口
反正要跑中文就是三大家優先,ChatGPT Claude Gemini,越獄苦手選Grok
長期對話選reasoning模型,短期快餐可以試試選同系列的non-reasoning或mini模型
上下文30k滿載的情況下,33次回覆會達到1M input、0.02~0.2M output
剩下就套目標模型價格,算你一個月的用量會花多少,然後Github Copilot有沒有比較划
如果習慣是短時間密集呼叫,Claude或Gemini還可以設定Prompt caching省點錢
---Capsule Extension亞種---
Dice or Choice 作者:Nyan 出處:arca.live 135279888
雙模式可以透過模組內Lorebook切換。均提供六個選項
Dice:以面對抉擇情境、骰D20為導向的選項設計,適合跑RPG
Choice:以對話為導向的選項設計,適合跑Galgame
高速骰子 作者:面紙枕頭 出處:arca.live 135286601
改善原版本的程式碼,讓運作速度更流暢
---RPG卡片---
以下都是TRPG系統的模擬卡
D&D5E 作者:magicbox 出處:arca.live 135304892
https://imgur.com/3iEa6Mw
採用D&D 5E規則的TRPG。
Veldenreich 作者:kimchifriedrice 出處:RisuRealm
https://imgur.com/lx19GMd
採用World of Darkness系統的TRPG。
PathFinder 作者:kimchifriedrice 出處:RisuRealm
https://imgur.com/eAUpUkI
採用Pathfinder系統的TRPG。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 184.65.128.80 (加拿大)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AC_In/M.1746040749.A.E6F.html
1F:推 Lukesky: 中文我都看得懂 然後要實作就就不太行了xd 05/01 07:29
2F:推 mazjin: 昨天我測ollama run qwen3:32b,在中文劇情敘述的部分不是 05/01 09:39
3F:→ mazjin: 很理想,性器官描寫得出來但做愛會被擋 05/01 09:39
4F:推 YukiTomoe: 這兩三天gemini2.0持續overloaded 只能等他好了嗎? 05/01 10:17
5F:→ driftcreator: RisuAI預設很堵,要用CustomAPI或LBI去連Gemini 2.5 05/01 10:38
6F:→ driftcreator: 往前翻幾篇有相關資料設定 05/01 10:39
7F:推 yyykk: 這裡分享另一個長期記憶的方法,概念上是差不多的。 05/01 11:51
9F:→ yyykk: 這傢伙跑了一個總數480萬token的故事... 05/01 11:52
10F:推 yyykk: 另外搭配這篇用RisuAI內建指令去編輯聊天紀錄,可以快速標 05/01 12:15
11F:→ yyykk: 記特定聊天,然後快速批次刪除一大段 05/01 12:17
13F:→ yyykk: 這樣或許就不用開新對話了 05/01 12:17
14F:→ driftcreator: 也可以,不過這個方式平時要花一點心力做記憶管理 05/01 12:39
15F:推 zseineo: 推,昨天也在看同一篇文章 05/01 15:13
16F:→ zseineo: 說到刪除 我還滿常遇到某些對話刪除不給按(cardboard) 05/01 15:27
17F:→ zseineo: 不知道為什麼w 05/01 15:27
18F:推 NoLimination: 可以詳細一下怎麼對話總結嗎? 05/01 15:33
19F:→ NoLimination: 結果似乎是pro太卡 用flash弄感覺也還可以 05/01 15:48
20F:推 yyykk: 簡單的說,有兩種方法。一種是用RisuAI自帶的HypaMemroy記 05/01 16:09
21F:→ yyykk: 憶功能,讓AI自動進行總結;另一種是手動將對話總結之後, 05/01 16:09
22F:→ yyykk: 寫進LoreBook裡,讓機器人不會忘記。概念上就和人的長期記 05/01 16:09
23F:→ yyykk: 憶一樣,細節會忘記,只留下會被記住的重點。 05/01 16:09
24F:推 yyykk: HypaMemroy V3要進設定>其他機器人>長期記憶裡去選擇,下 05/01 16:09
25F:→ yyykk: 不同的提示詞就能控制總結的方向和細節。也可以把提示詞拿 05/01 16:09
26F:→ yyykk: 出來指示其他AI幫你總結對話再寫進LoreBook。 05/01 16:09
27F:推 alpho: 不好意思又來伸手 請問大大目前覺得RPG用什麼模型比較順? 05/01 16:13
28F:→ alpho: 現在用git的claude-3.7-sonnet 蠻容易遇到描述與人設不符 05/01 16:17
29F:→ alpho: 比如髮色之類的 測試是risurealm上的THE MORTAL REALM 05/01 16:21
30F:→ alpho: 也有用其它卡嘗試,有些正常有些會錯 主要用中文對話 05/01 16:23
31F:推 Fizban: 樓上的問題應該跟模型沒關係,我也遇過這種情況,就算在L 05/01 16:30
32F:→ Fizban: orebook勾選「始終啟用」AI對於人設的描述也是錯誤的,唯 05/01 16:30
33F:→ Fizban: 有把人設寫進作者備註才有最強的記憶力 05/01 16:30
34F:→ Fizban: 不過我有問使用酒館的網友,他說沒遇過這現象,有點懷疑 05/01 16:33
35F:→ Fizban: 是RisuAI本身的問題 05/01 16:33
36F:→ zseineo: 看一下那張卡的Lorebook設定的最大Token數? 05/01 18:08
37F:→ yyykk: 如果角色是寫在Lorebook裡面,在Token不足的情況下可能會被 05/01 18:18
38F:→ yyykk: 犧牲掉,改善方法就如同上面說的,增加LoreBook使用的代幣 05/01 18:19
39F:推 Fizban: 怎麼增加lorebook使用的token? 05/01 18:40
40F:→ Fizban: 最早我是玩RPG的時候觀察到這個現象,最近拿早期自己寫的 05/01 18:40
41F:→ Fizban: 色文大綱測試,我把角色設定打進lorebook,聊天頻道第一 05/01 18:40
42F:→ Fizban: 篇丟大綱,之後請他依大綱內容生產劇情,剛開始llm可以精 05/01 18:40
43F:→ Fizban: 確抓到角色資訊,但神奇的是,如果把文章刪除再讓它重複 05/01 18:40
44F:→ Fizban: 生出同一段劇情,第二次生成的內容就無法抓到角色資訊了 05/01 18:40
46F:推 Fizban: 感謝樓上 05/01 18:47
47F:推 NoLimination: 我有個好奇是那3個可勾選項和搜尋深度是什麼意思 05/01 19:00
48F:推 yyykk: 全域設定是指要不要使用進階設定裡的Lorebook設定,不選就 05/01 19:15
49F:→ yyykk: 能讓卡片使用自己調整的設定 05/01 19:16
50F:→ yyykk: 搜尋深度好像是指幾次聊天內的對話內容會啟動Lorebook,針 05/01 19:16
51F:→ yyykk: 對不常態啟用的Lorebook的設定 05/01 19:17
52F:→ yyykk: 這類型Lorebook只有對話提到才會啟動,完整單詞匹配應該也 05/01 19:19
53F:→ yyykk: 是對啟動條件進行調整 05/01 19:19
54F:→ zseineo: 深度我記得1是僅搜作者備註 2是加上當前對話 繼續往上加 05/01 19:26
55F:→ zseineo: 就納入更多對話 05/01 19:26
56F:→ zseineo: 喔我搞錯了 應該是多少就搜尋最近幾個訊息 05/01 19:49
57F:→ driftcreator: 另外,Claude 3.7沒開reasoning的話記憶力不夠好 05/01 22:12
58F:→ driftcreator: 佐上Claude下文優先的特性,人設細節有時真的會忘 05/01 22:12
59F:→ driftcreator: 刪不掉應該是Chat Navi,它只是透明化但還是會佔位 05/01 23:19
60F:推 yyykk: 我github沒辦法用claude-3.7-sonnet-thought不知道為什麼.. 05/01 23:56
61F:→ yyykk: 剛剛成功了... 05/02 00:12
62F:推 yyykk: 這裡推一個新手指南 05/02 00:19
64F:→ driftcreator: 原來Gemini中文tokens這麼有效率,同內容幾乎是1:1 05/02 01:06
65F:推 Lukesky: 如果用copilot的api claude要怎麼啟用reasoning 05/02 07:44
66F:推 yyykk: 模型要用claude-3.7-sonnet-thought,Thinking Tokens要給 05/02 16:58
67F:→ yyykk: ,進階設定 > 請求失敗時重試設成5。啊...不過我是用LBI 05/02 16:59
68F:推 Lukesky: 改用lbi成功了 感恩 05/03 00:01
69F:→ driftcreator: Copilot的後綴還蠻妙的,用thought而不是thinking 05/03 04:07
70F:→ zseineo: Dice or Choice雖然風格比較多 但因為有指定風格我反而 05/05 20:54
71F:→ zseineo: 常常覺得沒有適合的選項(Choice的部分) 05/05 20:54
72F:→ zseineo: 看到Merry Sisters改成2.1 從2.0讀檔案繼續玩 然後選擇 05/05 23:29
73F:→ zseineo: 模組就不出現了w(但2.1開一個新聊天是正常會有) 05/05 23:29