作者saltlake (SaltLake)
看板Math
标题语言之间的转换
时间Sun Jun 7 10:32:26 2020
: → saltlake : 学法文、德文和俄文的时候,有甚麽变换规则让人 06/06 05:50
: → saltlake : 学会一种语言之後很快透过那个变换去掌握另一种? 06/06 05:51
: → saltlake : 毕竟我们可以把语言看成描述物体的座标系,相同物体 06/06 05:52
: → saltlake : 在不同语言的表达式,是该物体在不同座标系的座标 06/06 05:53
: → saltlake : 那麽不同座标系(语言)之间是否渴求出它的变换关系? 06/06 05:53
: 推 chemmachine : 楼上,现在google已经做得很好了。它语系转换接近百 06/06 09:02
: → chemmachine : 国语言,而且似乎转换似乎像机器学习一样输入资料库 06/06 09:03
: 推 chemmachine : 之前看过开发语言演算法之一的文章,方法之一是用 06/06 09:06
: → chemmachine : 某种演算法,也跟机率有点关系。然後它会一直输入 06/06 09:06
: → chemmachine : 文件让程式去比对学习,然後超多各国的超高薪工程 06/06 09:07
: → chemmachine : 师支持更新它 06/06 09:07
: 推 chemmachine : 上次用到youtube影片它英语字幕可以自由转换7-8国字 06/06 09:10
: → chemmachine : 幕让我很惊讶。而且我看一下语义还差不多 06/06 09:10
: → chemmachine : 然後我查英文单字还会发现它跑到法文或西班牙文 06/06 09:12
: → chemmachine : 可见它原来的发源国是英文吸纳其他国生字 06/06 09:12
: 推 chemmachine : 而且它是实作的,不是打高空理论嘴炮。 06/06 09:28
: 推 chemmachine : 可见语言翻译可以用数学原理去逼近近似解决,印证 06/06 09:36
: → chemmachine : 万物皆数 06/06 09:36
: 推 chemmachine : 网路上的文章都能直接google翻了,不管语系。pdf 06/06 15:32
: → chemmachine : 能复制文字的话就也能复制出来翻译,没有的话用文字 06/06 15:32
: → chemmachine : 识别软体能读出来,再用google翻,也能翻出一百种 06/06 15:34
: → chemmachine : 种语言八大概。 06/06 15:35
: 推 chemmachine : google大概是唯一成功快速搜寻、全世界网路地图、 06/06 15:38
: → chemmachine : 成功全世界语言翻译的公司。 06/06 15:38
: 推 Vulpix : 使用者资料。不过安全搜索等功能很恼人,前一阵子连 06/06 17:04
: → Vulpix : 搜寻pixiv都挡,不知道在挡什麽。 06/06 17:04
为了让问题内容与标题一致,另外开一篇文章来讨论。
就上面所述,将人类不同语言之间做转换的「函数」应该是存在的。但是
这种函数的唯一性呢? 例如英文和中文之间的转换函数是否是唯一的。如果
是非唯一的,我们能否定义某种最佳的函数? 该如何定义?
另外,考虑到上述用以转换的函数似乎以所谓的深度学习演算法来实现,
那麽我们评价不同演算法的效能除了根据解问题所耗时间与硬体资源以外,
还有甚麽测度(Metric)方式吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.44.197.114 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1591497148.A.186.html
1F:推 kittor : 我倒是想法语或格陵兰语来教工数看看 06/07 11:33
2F:→ kittor : 想用 06/07 11:34
3F:→ thinkabout : 我个人认为"函数"是不存在的,中文的加油无法用英文 06/07 11:51
4F:→ thinkabout : 恰当的表示,若是要用勉强能翻译的语意,会变成一对 06/07 11:51
5F:→ thinkabout : 多的对应 06/07 11:52
即使「函数」不存在,那有何替代的数学「物件」可用上?
毕竟不谈当前的机器学习,异语言翻译这件事存在更加久远。那麽数学要处理
这个问题总是要先定义出某些处理的工具出来。
※ 编辑: saltlake (114.44.197.114 台湾), 06/07/2020 15:18:06
6F:推 chemmachine : 唯一性没有,我在八卦版之前看到 06/08 00:09
7F:→ chemmachine : 很多语言翻译演算法连结超多,网路也一堆。 06/08 00:09
8F:→ chemmachine : 它们是讨论google的垄断性,应该都是码农,非唬烂 06/08 00:11
9F:→ chemmachine : 文 06/08 00:11
10F:→ chemmachine : 一对多,多对一不是问题,那叫转注假借。 06/08 00:12
11F:推 chemmachine : 最佳函数应该不知道,你知道应该可以当首席google 06/08 00:13
12F:→ chemmachine : 首席翻译部门工程师。 06/08 00:13
13F:推 chemmachine : metric就大o 小o 吧。 06/08 01:16
14F:推 chemmachine : 那个"函数"[math]改成“关系“”【math】就好。 06/08 02:54
16F:→ chemmachine : 用机率算argmax,看一下澳洲那句 06/08 17:43
17F:推 chemmachine : 澳洲是少数与北韩建交的国家之一。 06/08 17:45
18F:→ chemmachine : Google Translate 部门主管Franz Josef Och 06/08 17:45
19F:推 chemmachine : franz在机器学习比赛得了大奖被google聘用 06/08 17:48