DataScience 板


LINE

请求板上大大支援 5年前朋友寄给我的一封手写信寄丢 多年後没了交集 但还是很想知道内容写了什麽 但影片是手机录影 画质不佳 有无方式可以增强解析 以下为影片截图 https://i.imgur.com/qsyQpQg.jpg 在ask板被告知可以来这里问问 如有错板会删文 谢谢 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.129.87.75 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1638879290.A.1A9.html
1F:→ yoyololicon: 只看这张照片的话,很难救了 12/07 23:58
2F:推 ddavid: 其实是可以做的,但会是很大的一个问题 12/08 10:50
3F:→ ddavid: 思路是这样的,影片看来虽然解析度不够文字不清楚,但是因 12/08 10:51
4F:→ ddavid: 为文字大致外形还是可辨识,因此至少每一个字可以得到一个 12/08 10:51
5F:→ ddavid: 可能是哪些字的文字分布机率函数 12/08 10:52
6F:→ ddavid: 然後再靠自然语言相关的技术,从机率函数中去挑选最可能组 12/08 10:53
7F:→ ddavid: 成有意义句子的可能性 12/08 10:53
8F:→ ddavid: 好了,概念说起来很简单,但是技术难度就高了,特别是第二 12/08 10:54
9F:→ ddavid: 阶段的组句难度很高XD 12/08 10:54
10F:→ yoyololicon: 不不 这连外型都很难辨识了吧= = 12/08 11:32
11F:→ yoyololicon: 我倒是觉得如果是影片的话 也许能靠相邻的frame救一 12/08 11:33
12F:→ yoyololicon: 点点资讯回来 不知道有没有类似task 12/08 11:33
13F:→ yoyololicon: 这种restoration的问题我的看法是 如果人都很难猜出 12/08 11:36
14F:→ yoyololicon: 原本的资料长怎样 那机器也不会好到哪去 12/08 11:36
15F:推 st1009: 觉得要靠相邻来救+1 12/08 12:14
16F:推 KindWei: 你可以故意创造这类模糊文字的照片 然後自己 train model 12/08 19:57
17F:→ KindWei: 去解 12/08 19:57
18F:→ KindWei: 不然就有看有没有现成的 model 和资料集 但应该有点难 12/08 19:57
19F:推 watashino: 其实还是有可能啦 12/09 12:32
20F:→ watashino: 现在的sr技术真的蛮强的 12/09 12:32
21F:→ watashino: 尤其是这种很特定、有固定pattern的资料 12/09 12:32
22F:→ su3cl31125: 对於我这普通人看来是很困难的工程 感谢大家的回覆 12/09 23:43
23F:→ ruthertw: 这个题目很难作 12/10 02:25
24F:推 aa871220: 现行去躁比较强的都英文 12/13 21:52
25F:→ aa871220: 繁体中文dataset 来源根本不足xd 12/13 21:52
26F:→ truehero: 这种程度的模糊应该可以解 12/15 22:42
27F:推 truehero: 今年玉山不是有办手写辨识赛,资料集可以拿来用 12/15 22:47
28F:推 mom213: 请通灵王可能较容易0.0 12/16 01:39
29F:推 b10007034: 同感是影片的话,比一张照片有更多的资讯 12/24 15:41
30F:推 ddavid: @yoyololicon 我说的外型,是指一些明显可见的特徵 01/21 11:15
31F:→ ddavid: 比如就算这麽模糊,但其中很多字明显可见是左右两块组成, 01/21 11:16
32F:→ ddavid: 中间那一页最右上角那个字明显有像「地」或「他」右下那个 01/21 11:17
33F:→ ddavid: 弯勾形状,另外从文字色的密度可猜测笔画的密集程度等等 01/21 11:18
34F:→ ddavid: 更细微还能看出一些如「然」「无」这些上密下疏,或是「喝 01/21 11:20
35F:→ ddavid: 」左短右长而「和」会左长右短的特徵 01/21 11:21
36F:→ ddavid: 因此先弄到大量手写字库训练针对这类特徵的模型後,就有机 01/21 11:22
37F:→ ddavid: 会尝试对模糊的字进行辨识输出候选字列表与对应机率 01/21 11:23
38F:→ ddavid: 进一步就是上面讲的,再串自然语言模型尝试最可能组词组句 01/21 11:24
39F:→ ddavid: 的选项,就有机会输出候选句子 01/21 11:24
40F:→ ddavid: 但这真的是个可以写无数篇 Paper 的大题目XD 01/21 11:25
41F:推 yoyololicon: 我懂你的意思 但这个糊到学出来的分布也不会很sharp 01/21 14:02
42F:→ yoyololicon: 再拿来生可能的字句,可能会有数千条候选字句 01/21 14:03
43F:→ yoyololicon: 题目worth trying 但不能保证是原po需要的解答 01/21 14:04
44F:推 ddavid: 候选句可能很多,但特徵取得够好够多的话,有可能意外地机 01/21 16:11
45F:→ ddavid: 率处理後高低机率差距很容易拉开,毕竟有些特徵事实上蛮容 01/21 16:12
46F:→ ddavid: 易锁定到相对少数的字,而文字本身就已经有字频差距,再套 01/21 16:13
47F:→ ddavid: 到词库又可以筛选掉很多低机率可能性,再进一步到了自然语 01/21 16:14
48F:→ ddavid: 言模型又可以除去文法上直接不可能或低机率的组合 01/21 16:15
49F:→ ddavid: 我直觉上是认为过程超级繁复且运算量很大,但做完的结果有 01/21 16:17
50F:→ ddavid: 可能意外地不会有大量高机率候选句,因为某些特徵的筛选力 01/21 16:18
51F:→ ddavid: 还是蛮强大的 01/21 16:18
52F:→ ddavid: 当然,如果写作者本身行文的文法就很特别或很糟会是麻烦 01/21 16:20







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP