作者su3cl31125 (03lii)

看板DataScience

标题

[问题] 想知道影片内容写了什麽

时间Tue Dec 7 20:14:48 2021

请求板上大大支援 5年前朋友寄给我的一封手写信寄丢多年後没了交集但还是很想知道内容写了什麽但影片是手机录影画质不佳有无方式可以增强解析以下为影片截图 https://i.imgur.com/qsyQpQg.jpg 在ask板被告知可以来这里问问如有错板会删文谢谢 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.129.87.75 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1638879290.A.1A9.html

1^F：→ yoyololicon: 只看这张照片的话，很难救了 12/07 23:58

2^F：推 ddavid: 其实是可以做的，但会是很大的一个问题 12/08 10:50

3^F：→ ddavid: 思路是这样的，影片看来虽然解析度不够文字不清楚，但是因 12/08 10:51

4^F：→ ddavid: 为文字大致外形还是可辨识，因此至少每一个字可以得到一个 12/08 10:51

5^F：→ ddavid: 可能是哪些字的文字分布机率函数 12/08 10:52

6^F：→ ddavid: 然後再靠自然语言相关的技术，从机率函数中去挑选最可能组 12/08 10:53

7^F：→ ddavid: 成有意义句子的可能性 12/08 10:53

8^F：→ ddavid: 好了，概念说起来很简单，但是技术难度就高了，特别是第二 12/08 10:54

9^F：→ ddavid: 阶段的组句难度很高XD 12/08 10:54

10^F：→ yoyololicon: 不不这连外型都很难辨识了吧= = 12/08 11:32

11^F：→ yoyololicon: 我倒是觉得如果是影片的话也许能靠相邻的frame救一 12/08 11:33

12^F：→ yoyololicon: 点点资讯回来不知道有没有类似task 12/08 11:33

13^F：→ yoyololicon: 这种restoration的问题我的看法是如果人都很难猜出 12/08 11:36

14^F：→ yoyololicon: 原本的资料长怎样那机器也不会好到哪去 12/08 11:36

15^F：推 st1009: 觉得要靠相邻来救+1 12/08 12:14

16^F：推 KindWei: 你可以故意创造这类模糊文字的照片然後自己 train model 12/08 19:57

17^F：→ KindWei: 去解 12/08 19:57

18^F：→ KindWei: 不然就有看有没有现成的 model 和资料集但应该有点难 12/08 19:57

19^F：推 watashino: 其实还是有可能啦 12/09 12:32

20^F：→ watashino: 现在的sr技术真的蛮强的 12/09 12:32

21^F：→ watashino: 尤其是这种很特定、有固定pattern的资料 12/09 12:32

22^F：→ su3cl31125: 对於我这普通人看来是很困难的工程感谢大家的回覆 12/09 23:43

23^F：→ ruthertw: 这个题目很难作 12/10 02:25

24^F：推 aa871220: 现行去躁比较强的都英文 12/13 21:52

25^F：→ aa871220: 繁体中文dataset 来源根本不足xd 12/13 21:52

26^F：→ truehero: 这种程度的模糊应该可以解 12/15 22:42

27^F：推 truehero: 今年玉山不是有办手写辨识赛,资料集可以拿来用 12/15 22:47

28^F：推 mom213: 请通灵王可能较容易0.0 12/16 01:39

29^F：推 b10007034: 同感是影片的话，比一张照片有更多的资讯 12/24 15:41

30^F：推 ddavid: @yoyololicon 我说的外型，是指一些明显可见的特徵 01/21 11:15

31^F：→ ddavid: 比如就算这麽模糊，但其中很多字明显可见是左右两块组成， 01/21 11:16

32^F：→ ddavid: 中间那一页最右上角那个字明显有像「地」或「他」右下那个 01/21 11:17

33^F：→ ddavid: 弯勾形状，另外从文字色的密度可猜测笔画的密集程度等等 01/21 11:18

34^F：→ ddavid: 更细微还能看出一些如「然」「无」这些上密下疏，或是「喝 01/21 11:20

35^F：→ ddavid: 」左短右长而「和」会左长右短的特徵 01/21 11:21

36^F：→ ddavid: 因此先弄到大量手写字库训练针对这类特徵的模型後，就有机 01/21 11:22

37^F：→ ddavid: 会尝试对模糊的字进行辨识输出候选字列表与对应机率 01/21 11:23

38^F：→ ddavid: 进一步就是上面讲的，再串自然语言模型尝试最可能组词组句 01/21 11:24

39^F：→ ddavid: 的选项，就有机会输出候选句子 01/21 11:24

40^F：→ ddavid: 但这真的是个可以写无数篇 Paper 的大题目XD 01/21 11:25

41^F：推 yoyololicon: 我懂你的意思但这个糊到学出来的分布也不会很sharp 01/21 14:02

42^F：→ yoyololicon: 再拿来生可能的字句，可能会有数千条候选字句 01/21 14:03

43^F：→ yoyololicon: 题目worth trying 但不能保证是原po需要的解答 01/21 14:04

44^F：推 ddavid: 候选句可能很多，但特徵取得够好够多的话，有可能意外地机 01/21 16:11

45^F：→ ddavid: 率处理後高低机率差距很容易拉开，毕竟有些特徵事实上蛮容 01/21 16:12

46^F：→ ddavid: 易锁定到相对少数的字，而文字本身就已经有字频差距，再套 01/21 16:13

47^F：→ ddavid: 到词库又可以筛选掉很多低机率可能性，再进一步到了自然语 01/21 16:14

48^F：→ ddavid: 言模型又可以除去文法上直接不可能或低机率的组合 01/21 16:15

49^F：→ ddavid: 我直觉上是认为过程超级繁复且运算量很大，但做完的结果有 01/21 16:17

50^F：→ ddavid: 可能意外地不会有大量高机率候选句，因为某些特徵的筛选力 01/21 16:18

51^F：→ ddavid: 还是蛮强大的 01/21 16:18

52^F：→ ddavid: 当然，如果写作者本身行文的文法就很特别或很糟会是麻烦 01/21 16:20

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

DataScience 板

[问题] 想知道影片内容写了什麽

热门看板

赞助商连结