作者CCY0927 (茹絮梦)
看板TW-language
标题[新闻] 让119更快救命的人!他奔走7年磨出「台客语AI护城河」
时间Fri Mar 13 10:31:08 2026
https://www.businessweekly.com.tw/Archive/Article?StrId=7013922
让119更快救命的人!他奔走7年磨出「台客语AI护城河」
封面故事| 撰文者: 陈盈萤 |出刊日期: 2026-03-12
1.他拾起大厂不做的苦力活!长问科技总经理陈又硕如何抢救台语与华语语料库间高达73
倍的落差,防止母语在AI时代失声?
2.奔走7年,公司一度连亏3年、1/3核心团队出走!他怎麽靠「笨功夫」让119听得懂台客
语?
3.驱动他坚持下去的使命,藏在一位父亲对下一代的焦虑:「会不会有一天,孩子听不懂
阿公说的『吃果子拜树头』?」
https://i.urusai.cc/fryIx.jpg
长问科技总经理陈又硕。(摄影者.程思迪)
「这里是一一九勤务中心,请问需要消防车还是救护车?」话筒另一端,老人家慌乱颤抖
、结结巴巴的用国、台语交错报案。过去,派案员得在生死交关的几秒钟内,一边安抚、
一边从模糊乡音中判读讯息;如今,AI语音辨识系统会同步分析报案内容,当侦测「没有
呼吸、没有心跳」等关键字,系统会红色警示,预判为OHCA(到院前心肺停止)案件,自
动联动高级救护派遣模组、推播急救先锋App,通报案件。
他拾起大厂不愿做的苦力活
做AI语音系统,救台、客语断层危机
这套每天接听上千通、精准识别国、台、客、英四种语言的救命系统,幕後功臣是长问科
技总经理陈又硕,他做的是Google、OpenAI等大厂,明知台湾有需求,却不愿做的「苦力
活」。
台湾正面临无声却巨大的「语言断层」。根据二○二○年内政部人口普查资料,全台六到
十四岁的国小、国中学童,只剩下七.四%将台语当成主要沟通语言,客语更惨,跌到○
.三%。
「台语在住院中、客语进加护病房、原住民语则在急救中,」致力发展台湾本土语音语料
库、阳明交通大学智能系统研究所教授兼所长廖元甫形容。
跑遍乡镇,用笨功夫打造语料库
一度连三年亏损、三分之一团队出走
「当高科技越发展,低资源的语言越容易『挂掉』。」他指出,目前中国释出的华语语料
库总时长已达二万二千多小时,台湾的台语语料库却只有三百个小时,落差高达七十三倍
。这意味着AI模型辨识中文会远比台湾国语精准。台湾使用者被迫放弃使用自己的腔调,
如果不抢救,未来长者要请照护机器人帮忙倒一杯水,也得说北京腔。
陈又硕是廖元甫的学生。为了替濒危的本土语言建立语料库,他们从一八、一九年开始展
开一场「数位田野调查」。团队没有待在实验室,而是带着录音设备跑遍屏东、台中东势
、云林仑背等地。
每次录音,他们得同时架设六支麦克风,模拟手机、电脑与智慧音箱等不同距离与角度的
收音情境,确保AI在嘈杂的活动中心或医院诊间也能辨识语音,还要请审听老师现场纠正
,因为许多长辈以为自己在讲客家话,其实混杂了九成台语。
录音现场更是耐力的挑战。陈又硕必须拜访各地语言专家,请他们带路找出隐身在巷弄间
的耆老;为了冲语料量,他跟媒体谈合作:「我提供你语音转换字幕的软体,你提供节目
影片与字幕档。」
「这不是大厂会做的事,」 陈又硕说。当对手追求规模化、低成本的通用模型时,他们
却在磨最细碎、最难自动化的在地语料,这样的笨功夫,一磨就是整整一年,直到疫情时
,终於被看见。
二○二○年,疫情指挥中心记者会的语音即时字幕系统,全都采用长问的产品。团队每天
紧盯直播字幕,即时微调模型。他记得:「全台北市街道空荡荡,只有同事为了公事,赶
到公司。」
两年後,另一个时刻让他们更加确信这条路走得对。
二○二二年,Meta执行长佐伯格为展示AI技术,邀请台湾学者与他以台语对话,背後使用
的正是同一套语料库。「终於可以证明语料库是有用的,而且还帮忙国库赚到钱!」廖元
甫说。
然而,就在技术开始受到关注时,公司却陷入最艰难的时刻。连三年亏损、核心团队出走
三分之一,陈又硕回忆:「看着一起打拚的学弟选择离开,当下的士气真的很低迷。」
突破商业化门槛,也为下一代着想
两年前营收开始翻倍成长、由亏转盈
更大的挑战来自商业化门槛。二○二三年,企业若想导入系统,光是采购AI运算的GPU硬
体,就需要约五百万元投资。对中小企业而言,这是一道难以跨越的门槛。
「都还没看到成效,就要先花五百万,这是一个很大的瓶颈,」陈又硕理解客户的却步。
为了生存,他没有放弃,带领团队埋首两年,硬是透过软体优化,将硬体成本从五百万降
至七十万,降幅超过八成五。
https://i.urusai.cc/fhjg1.jpg
台北市消防局局长莫怀祖(左1)表示,执勤同仁在长时间高压工作下容易感到疲乏、专
注度会下降,但导入AI能预先盘点可能面临的情形,救灾更有效率也更安全。(摄影者:
程思迪)|放大原图
当导入门槛降低,飞轮才真正开始转动。医疗院所、金融机构与政府单位陆续采用,包括
双北服务专线1999,以及台北的119指挥中心。
与学者们不同的是,陈又硕选择把研究带进真实场景。因为只有技术真正被使用,资料才
会累积,AI模型才能持续进化,而不必永远依赖人工采集语料。
二四年,长问营收开始翻倍成长,公司转亏为盈。鸿海、台湾大哥大、中华电信与三商电
脑等都成为夥伴,一起把本土语AI辨识系统导入更多场域。
「连全球云端大厂都要找我们处理,我就知道这条路走对了。」他说。
现在,在客语重镇桃园联新国际医院,客家长者看诊时不再担心医师听不懂,诊间导入语
音辨识系统後,萤幕会即时将患者描述转为中文字幕并对应医学术语,减少语言造成的医
病误解。
台北市消防局局长莫怀祖也期待,未来在救灾现场,指挥官只要输入语音,AI就能自动整
理重点与需求,协助决策。「那会是我们的生存夥伴!」
在公司,陈又硕是带领团队打磨技术的总经理;回到家,他却是焦虑的父亲。
「我的孩子读国、高中,他们只会听、却不会说台语了。」他语带遗憾的说:「会不会有
一天,孩子听不懂阿公说的『吃果子拜树头』?语言消逝了,文化也就稀释了啊。」
这份焦虑,让他对这份「笨功夫」有了不同的使命:他标记语料,不仅是为了AI准确率,
更是为了将来某一天,当下一代想找回自己的文化根基时,数位世界里还留有最道地的素
材,甚至能向AI重新学习母语。
即使华语与本土语言的语料差距仍有七十三倍之遥,陈又硕并未停下脚步。他很清楚,这
项事业不是赚快钱,而是为台湾的未来买一份语言保险。
「就算只是把一颗微小的石头丢进大海,我也要试着激起更大的浪花。」他说。只要有人
愿意在大海中持续激起浪花,美丽的台湾母语,就不会在AI时代的浪潮中失声。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.255.116.12 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/TW-language/M.1773369071.A.9EE.html