作者yourui0221 (我是一隻小蜜蜂)
看板CodeJob
標題[發案] Transformer Bug hunter
時間Sat Jan 4 01:38:40 2025
凡是「 」開始的行,都請使用 刪除。
如果對於發案文章格式有不清楚的地方,請參考置底文章: 發案 發案範例
發案人:林宥叡
聯絡方式1:
[email protected]
聯絡方式2:
所在地區 :
有效時間:解出來為止
專案說明:附件是我的功課
而我到目前還是找不到問題出在哪
(功課繳交期限已過 不是代做功課
純粹個人研究精神 希望知道問題出在哪
感謝願意抽空協助討論的接案者
主要是做拼字檢查的模型
而目前遇到的狀況是在train時
輸出在預期中 並且可正確達成拼字更正
但在valid/test時 會發生異常
目前是透過ARM去inference
https://i.imgur.com/Twkc1Cf.jpeg
https://i.imgur.com/4qnDJSD.jpeg
而以下附件連結
Decoder mask有試過一般的上三角去遮擋
也有試過用隨機的長度去做
https://cloud.dearestbee.com/s/x6biDqXdN9ssp6o
誠心感謝願意付出時間協助解惑的人
預算:1000
接案者要求:
附註:
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.254.18.192 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/CodeJob/M.1735925922.A.668.html
1F:→ chang1248w: over fitting吧,你看看你的testing loss 01/05 17:35
2F:推 sweetcat8422: 可以嘗試看看早停機制 01/10 00:26