作者Pettitte1 (低调奢华有内涵)
看板Python
标题[问题] 下载台股上柜每日收盘碰到mac greek code
时间Mon Oct 10 09:20:41 2022
最近再下载台股上柜每日收盘行情时
会碰有些日期的编码是 mac greek
code如下
import requests
# 上柜 OTC
dateOTC = '110/11/30'
link =
'
http://www.tpex.org.tw/web/stock/aftertrading/daily_close_quotes/stk_quote_download.php?l=zh-tw&d='
+ dateOTC + '&s=0,asc,0'
r = requests.get(link)
print(r.apparent_encoding)
# 得到 'mac_greek'
# 使用 encoding = 'mac_greek' 後
r.encoding = 'mac_greek'
print(r.text)
# 得到如下
'ΛWΣ─蹏XΠφ±Γ(ßtΒΞΜυΓBΙsΣ─ΓB蟖蹏\ΓBΙdΟBΞφc ω)\r\n
Ηξ°ΤΛι¥Ν:110/11/30\r\nΞNΗΙ,ΠWΚ
请问怎麽转成中文呢?
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 27.247.195.34 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1665364844.A.EE2.html
1F:→ surimodo: 看不懂欸 apparent_encoding 不就说big5格式 10/10 11:22
2F:→ surimodo: 如果是里面的日期格式不是你想要的只能自己手动处理 10/10 11:22
我用apparent_encoding 得到的是 'mac_greek'
还是说 'mac_greek' == 'Big5' ?
我後来是用 chardet 套件先找到 encoding = 'Big5' 後
在 r.encoding = 'Big5' 解决的
※ 编辑: Pettitte1 (27.247.195.34 台湾), 10/10/2022 11:29:31
3F:→ surimodo: 喔 我懂了 你是用苹果电脑? 10/10 11:40
4F:→ surimodo: 那个是回传自己电脑预设解码方式 10/10 11:41
5F:→ surimodo: 资料格式回传回来的是big5 10/10 11:43
6F:→ surimodo: 编码不对出乱码 10/10 11:43
7F:→ surimodo: 不过怎麽会是希腊语 10/10 11:47
8F:→ lycantrope: 谁知道. 10/10 11:53
apparent_encoding 是自己电脑预设解码方式喔
那我要查一下为啥是mac greek 了
我是用 vscode 的 Jupyter Notebook
是 windows 的电脑
※ 编辑: Pettitte1 (1.169.183.33 台湾), 10/10/2022 15:35:03
9F:→ lycantrope: Response本身就是用chardet来detect内容啊.. 10/11 08:58
10F:→ qrtt1: 好好找个支援 api 的券商,开个户比较好抓 10/12 19:46