作者blacktea12 (sss)
看板R_Language
標題[問題] R 斷詞問題!!
時間Mon Feb 12 18:51:23 2018
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
我有個檔案要做中文文字斷句,使用UTF-8 codeing讀入之後一直出問題
我也看不太懂R的error狀態想跟我說什麼
[檔案類型] <csv檔>
名稱
舒爽衛生紙 12X6包
好神脫
舒爽廚房紙巾
年菜預購禮盒
...
[程式碼]
df1<-read.csv(file=...)
jiebar.worker<-worker()
seg<-segment(df1$名稱,jiebar.worker)
[顯示的錯誤碼]
Argument 'code' must be an string!!!!!!!!!!!!!!!!
[結論]
所以..我該怎麼辦? 我把資料用toString之後會變成亂碼...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.219.187.60
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1518432685.A.4AA.html
1F:推 PoChieh: as.character 02/12 19:38
2F:推 eric500g: read.csv預設會把文字轉成factor,可用stringsAsFactors 02/12 19:44
3F:→ eric500g: = FALSE設定成不會轉 02/12 19:44