作者su3cl31125 (03lii)
看板DataScience
标题[问题] 想知道影片内容写了什麽
时间Tue Dec 7 20:14:48 2021
请求板上大大支援
5年前朋友寄给我的一封手写信寄丢
多年後没了交集
但还是很想知道内容写了什麽
但影片是手机录影 画质不佳
有无方式可以增强解析
以下为影片截图
https://i.imgur.com/qsyQpQg.jpg
在ask板被告知可以来这里问问
如有错板会删文
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.129.87.75 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1638879290.A.1A9.html
1F:→ yoyololicon: 只看这张照片的话,很难救了 12/07 23:58
2F:推 ddavid: 其实是可以做的,但会是很大的一个问题 12/08 10:50
3F:→ ddavid: 思路是这样的,影片看来虽然解析度不够文字不清楚,但是因 12/08 10:51
4F:→ ddavid: 为文字大致外形还是可辨识,因此至少每一个字可以得到一个 12/08 10:51
5F:→ ddavid: 可能是哪些字的文字分布机率函数 12/08 10:52
6F:→ ddavid: 然後再靠自然语言相关的技术,从机率函数中去挑选最可能组 12/08 10:53
7F:→ ddavid: 成有意义句子的可能性 12/08 10:53
8F:→ ddavid: 好了,概念说起来很简单,但是技术难度就高了,特别是第二 12/08 10:54
9F:→ ddavid: 阶段的组句难度很高XD 12/08 10:54
10F:→ yoyololicon: 不不 这连外型都很难辨识了吧= = 12/08 11:32
11F:→ yoyololicon: 我倒是觉得如果是影片的话 也许能靠相邻的frame救一 12/08 11:33
12F:→ yoyololicon: 点点资讯回来 不知道有没有类似task 12/08 11:33
13F:→ yoyololicon: 这种restoration的问题我的看法是 如果人都很难猜出 12/08 11:36
14F:→ yoyololicon: 原本的资料长怎样 那机器也不会好到哪去 12/08 11:36
15F:推 st1009: 觉得要靠相邻来救+1 12/08 12:14
16F:推 KindWei: 你可以故意创造这类模糊文字的照片 然後自己 train model 12/08 19:57
17F:→ KindWei: 去解 12/08 19:57
18F:→ KindWei: 不然就有看有没有现成的 model 和资料集 但应该有点难 12/08 19:57
19F:推 watashino: 其实还是有可能啦 12/09 12:32
20F:→ watashino: 现在的sr技术真的蛮强的 12/09 12:32
21F:→ watashino: 尤其是这种很特定、有固定pattern的资料 12/09 12:32
22F:→ su3cl31125: 对於我这普通人看来是很困难的工程 感谢大家的回覆 12/09 23:43
23F:→ ruthertw: 这个题目很难作 12/10 02:25
24F:推 aa871220: 现行去躁比较强的都英文 12/13 21:52
25F:→ aa871220: 繁体中文dataset 来源根本不足xd 12/13 21:52
26F:→ truehero: 这种程度的模糊应该可以解 12/15 22:42
27F:推 truehero: 今年玉山不是有办手写辨识赛,资料集可以拿来用 12/15 22:47
28F:推 mom213: 请通灵王可能较容易0.0 12/16 01:39
29F:推 b10007034: 同感是影片的话,比一张照片有更多的资讯 12/24 15:41
30F:推 ddavid: @yoyololicon 我说的外型,是指一些明显可见的特徵 01/21 11:15
31F:→ ddavid: 比如就算这麽模糊,但其中很多字明显可见是左右两块组成, 01/21 11:16
32F:→ ddavid: 中间那一页最右上角那个字明显有像「地」或「他」右下那个 01/21 11:17
33F:→ ddavid: 弯勾形状,另外从文字色的密度可猜测笔画的密集程度等等 01/21 11:18
34F:→ ddavid: 更细微还能看出一些如「然」「无」这些上密下疏,或是「喝 01/21 11:20
35F:→ ddavid: 」左短右长而「和」会左长右短的特徵 01/21 11:21
36F:→ ddavid: 因此先弄到大量手写字库训练针对这类特徵的模型後,就有机 01/21 11:22
37F:→ ddavid: 会尝试对模糊的字进行辨识输出候选字列表与对应机率 01/21 11:23
38F:→ ddavid: 进一步就是上面讲的,再串自然语言模型尝试最可能组词组句 01/21 11:24
39F:→ ddavid: 的选项,就有机会输出候选句子 01/21 11:24
40F:→ ddavid: 但这真的是个可以写无数篇 Paper 的大题目XD 01/21 11:25
41F:推 yoyololicon: 我懂你的意思 但这个糊到学出来的分布也不会很sharp 01/21 14:02
42F:→ yoyololicon: 再拿来生可能的字句,可能会有数千条候选字句 01/21 14:03
43F:→ yoyololicon: 题目worth trying 但不能保证是原po需要的解答 01/21 14:04
44F:推 ddavid: 候选句可能很多,但特徵取得够好够多的话,有可能意外地机 01/21 16:11
45F:→ ddavid: 率处理後高低机率差距很容易拉开,毕竟有些特徵事实上蛮容 01/21 16:12
46F:→ ddavid: 易锁定到相对少数的字,而文字本身就已经有字频差距,再套 01/21 16:13
47F:→ ddavid: 到词库又可以筛选掉很多低机率可能性,再进一步到了自然语 01/21 16:14
48F:→ ddavid: 言模型又可以除去文法上直接不可能或低机率的组合 01/21 16:15
49F:→ ddavid: 我直觉上是认为过程超级繁复且运算量很大,但做完的结果有 01/21 16:17
50F:→ ddavid: 可能意外地不会有大量高机率候选句,因为某些特徵的筛选力 01/21 16:18
51F:→ ddavid: 还是蛮强大的 01/21 16:18
52F:→ ddavid: 当然,如果写作者本身行文的文法就很特别或很糟会是麻烦 01/21 16:20