作者ripple0129 (perry tsai)
看板Soft_Job
标题Re: [请益] 订票程式
时间Tue Jan 17 19:47:47 2017
好吧这麽多人有captcha的问题
这边提供点经验
事实上来说
captcha就是个图档罢了
我的作法就是把这个图档抓下来
然後OpenCV後制处理一下
透过处理杂讯侵蚀膨胀之类让字尽量好读
然後以宽跟高切分出不同的几张图档出来
每张丢进去OCR读出各别的字出来组成String
OCR也可以针对特定网站调整一下字型
比较好比对字的相似度
然後就送出吧
失败就重来一次
反正一般captcha猜错都是叫你重来而已
辨识率能有个5成就够用了
之前是搞游戏的大量帐号登入拿奖励在搞这个XD
小弱弱的我不会什麽机器学习的
会机器学习的透过大量的跑可以提升辨识率了吧
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.136.147.95
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1484653670.A.800.html
1F:推 jimmy689: ㄋ肯定没被googleㄉ我不是机器人电过齁 01/17 19:50
2F:→ ripple0129: 还真的没,没遇到过要处理google我是机器人的需求过XD 01/17 19:53
3F:推 vi000246: 拓元的captcha是用YII写的 研究一下发现很麻烦XD 01/17 20:17
4F:→ vi000246: 怕成功率太低 票就被抢光了 01/17 20:18
6F:→ abc01251: 所以周末五月天 大家都抓好外挂了!? 01/17 22:23
7F:→ brucetu: 好啦 打api给大陆人工答题99%正确 还处理个毛 01/17 23:19
8F:推 et69523820: 验证码直接绕过连破解都不用 程式把验证码单独拉到 01/18 06:16
9F:→ et69523820: 第一步骤 用肉眼辨识填上验证码的答案 开始让程式自动 01/18 06:18
10F:→ et69523820: 开始一步一步往下做 等遇到要输入验证码的时候 程式 01/18 06:19
11F:→ et69523820: 把之前输入的验证码答案 自动带上送出 01/18 06:19
12F:→ et69523820: 有个重点要注意到 不能让对方系统产生新的验证码 01/18 06:20
13F:→ et69523820: 如果产生新的验证码 你之前填的验证答案就不对了 01/18 06:21
14F:→ et69523820: 这里有技巧性 可以让对方验证码产生不出来 01/18 06:22
15F:→ ssccg: 这些都看对方的页面安全性做的怎样,case by case吧 01/18 09:48
16F:推 DWR: 考虑验证自己打 其他写程式跑 阿妹抢票没抢到的怨念 01/18 18:47