作者ReTryx ()
看板Python
標題[問題] 中文寫進MSSQL變成亂碼
時間Thu Nov 3 15:46:33 2022
想請教各位高手們有沒有遇到如標題的問題過?google完也試過網路上的解法,都無法成
功。
以下是環境以及問題
我用pymssql 連 mssql, 在連線的時候一定要把charset 也寫進去,不然會出現錯誤,而
我charset 是用CP950
接著在insert中文進SQL後,在SQL裡面看會發現insert進去的都是亂碼。但如果用Python
再select 出來卻會是中文。
但如果是SQL裡面本來就是中文的資料,從Python select 出來就也會變成亂碼在Python
上,同樣的,用Python 寫進去變成亂碼的中文由其他語言讀出來也會是亂碼。
簡單來說就是Python寫進去的中文亂碼只能由Python 自己讀來才能解碼成中文。而本來
在DB裡就是中文的資料Python 讀出來就會變成亂碼。
我試過用encode and decode,但還是無解。請問有人成功試過從中文從Python寫進MSSQL
裡面不會變成亂碼的嗎?
感謝幫忙
程式碼
conn = pymssql.connect(server = '', user = '', password =
'', database = '', charset='CP950')
.
.
.
cur.execute(f"Insert into dbo.ABC values ('中文', '中文二', '中文三')")
conn.commit()
以上charset如果省略不填則無法連線
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.175.156 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Python/M.1667461595.A.068.html
1F:→ tzouandy2818: 會不會是你編解碼選錯格式 11/03 16:21
2F:→ surimodo: 把完整程式碼貼出來 11/03 16:31
3F:→ Hsins: 你忽略了很多情境的敘述,無法判斷是哪邊出問題。 11/03 17:52
4F:→ Hsins: 聽起來比較像是你原先已經在裡面的中文,跟你選用的字元集 11/03 17:55
5F:→ Schottky: charset 改用 UTF-8 就沒問題了 11/03 17:55
6F:→ Hsins: 並不一致 11/03 17:55
7F:→ Hsins: 除此之外,你也要檢查一下編輯器的編碼 11/03 17:55
8F:推 Schottky: 會使用 CP950 我猜是用 CMD 命令提示字元 11/03 19:00
※ 編輯: ReTryx (123.51.216.154 臺灣), 11/04/2022 09:42:07
9F:→ ReTryx: 我是用Spyder IDE, 預設編碼是UTF-8 11/04 09:42
10F:→ ReTryx: charset如果改用UTF-8則也是無法連線 11/04 09:43
11F:→ ReTryx: 所有東西都用預設,用C, js or vba寫中文進SQL就都沒問題 11/04 09:45
12F:→ ReTryx: 就是python進SQL中文有問題,也讀不瞭上述語言寫進的中文 11/04 09:45
13F:→ lycantrope: 把varchar轉nvarchar? 11/04 11:11
14F:→ Hsins: 他有提到原本有存中文, 應該不是 varchar/nvarchar 的差異 11/04 12:14
15F:→ Hsins: 比較可能是 encode 和 decode 沒做好 11/04 12:14
16F:→ Hsins: 你嘗試的 encode 跟 decode 是怎麼操作的? 11/04 12:24
17F:推 Schottky: 什麼叫作 charset 設成 UTF-8 就無法連線 11/04 13:54
18F:→ Schottky: 如果你的中文是寫在檔案內,檔案本身是 UTF-8 編碼嗎 11/04 13:56
19F:→ ReTryx: datatype已經是nvarchar了 11/04 13:57
20F:→ ReTryx: a = '中文'.encode('utf-8').decode('utf-8') 11/04 14:06
21F:→ ReTryx: Python檔案裏面本身是utf-8沒錯 # -*- coding: utf-8 -*- 11/04 14:06
22F:→ ReTryx: 也試過把decode encode交叉互換成big5也都是不行 11/04 14:07
23F:→ Hsins: 實話說,你可能沒搞清楚 encode 跟 decode 在幹嘛,另外是 11/04 14:22
24F:→ Hsins: 上下文提供的不夠明確跟精準 11/04 14:22
25F:→ ReTryx: 我再來研究一下編碼 感謝各位~ 11/04 14:26
26F:推 Schottky: ......你先把中文字串 print 出來看看是不是正確的 11/04 14:52
27F:→ ReTryx: Python 中print 出來是正確的,但SQL裡跟用其他語言print 11/06 16:26
28F:→ ReTryx: 出來是亂碼 11/06 16:26