作者filmwalker (外面的世界)
看板Scenarist
标题[新闻] 大数据助攻 台剧创作掀开新页
时间Thu Mar 18 14:31:57 2021
https://www.cna.com.tw/news/firstnews/202103145002.aspx
影视制作导入大数据是近年国际趋势,2016年《我们与恶的距离》首次为台剧点了第一把
火,如今星火燎原。
文:叶冠吟
21岁到30岁的年轻人最关心什麽?
分龄统整2019年Google关键字搜索:21岁是生日与礼物;22到24岁,在乎自己是否还能长
高;大学、研究所毕业後的25到28岁,开始在意存款;到了29、30岁,烦恼如泉涌,从婚
姻、转职、薪水、存款到健康检查……一连串议题,多到连表格都写不下。
「30岁最痛苦,烦恼一堆」,资策会数位服务创新研究所副主任徐毓良,指着投影幕上的
数据感慨说道。
这是公共电视迷你剧集《大债时代》剧本设定的辅助数据资料,也是资策会服创所团队继
金钟奖台剧《我们与恶的距离》後,第二度与公视合作,以大数据分析协作剧本开发。
探讨青年负债议题的《大债时代》,由张书豪、林柏宏、李霈瑜(大霈)主演,三人饰演
高中死党,毕业後各奔前程,分别成为公司负责人、斜杠创业家与银行债务催收员。但32
岁那年,张书豪跳楼轻生,两位好友替张书豪解决所留钜额债务的同时,也得各自面对沉
重的生活压力。
编剧的大数据门诊 处方来自PTT
「年轻人碰到债会躲起来吗?」「买毒品的年龄层?在哪买?」「年轻人最常见的债务是
什麽?」「30岁受薪阶级的平均月薪是多少?」「企业掏空案到底要掏要多少钱才算多?
」「黑道讨债和银行债权管理的差异?」
一如有着十万个为什麽,方梦贞形容与资策会合作的过程,就像跟医生定期门诊,只是处
方来自扎实的数据资料。
徐毓良指出,
《大债时代》与《我们与恶的距离》两者提出的数据辅助需求不同,前者已
有故事大纲和人物设定架构,後者则是在「无差别杀人事件」主题的资讯海中,捞出剧本
线索。
徐毓良认为合作的方向很明确,就是回答方梦贞提出的问题,并判断剧本可能需要的数据
内容,分类後,再利用文字探勘的方式取得资料。
首先当然是以「债」、「年轻世代」相关内容为关键字,从PTT(批踢踢实业坊)、脸书
、新闻网站、网路论坛,挑选出网友评论度、分享转贴数量高的文章,搜集符合主题及需
求的内容。同时,也就不同个案问题爬梳法院判决书,甚或是外送的菜单。
徐毓良指出,藉由
PTT上的资讯,很容易就可找到各职业的个案。「30岁左右的人,会在
职涯版分享工作经验和过程。」团队就从中找到银行、行销、高科技等各行业的年轻人个
案,观察他们对於生活、薪水、职场、房贷等看法与抱怨,或觉得哪些工作比较好赚钱。
监於《我们与恶的距离》资料过於庞杂,导致编剧吕莳媛难以消化,徐毓良面对《大债时
代》,
将上万笔资料删减、统整成100笔,再转译成方梦贞团队能理解阅读的形式:例如
文字云、表格、关键字等,同时也将资料汇集成小型资料库,供编剧日後查询参考。
大数据反覆验证 戏剧缩影现实人生
经历4个月反覆验证,方梦贞与《大债时代》编剧团队藉由大数据资料,调整故事情节与
人物设定。她苦笑:「来回修改的过程是辛苦的,但改完後就不会心虚虚的,确实符合现
状」。
方梦贞透露,原本规划林柏宏的角色是要
揭发公司的掏空弊案,但经由数据考证才惊觉,
这是公司少数人才可能接触的案件。「20多岁的人,不论职等或资历都不大可能接触到这
麽机密的事,况且大部分年轻人连租房、买房都有困难,甚至吃饱都成问题,更在意寻找
自我价值的认同。」最後,只好
将这条支线删除。
另一条放弃的剧情线,是「年轻上班族因压力吸毒」。徐毓良分享,团队爬梳500多篇法
院判决书和文献,发这个年龄层根本不大会接触毒品。「
20、30岁这群人,生活压力都喘
不过来,根本没钱买毒品,经济宽裕的中年人与家庭富裕的孩子,反而才是主要使用者。
」
方梦贞分享,
编剧团队除了删除不合现实的设定,也从数据中找到先前未注意的职业,掌
握年轻人在意的趋势,从而丰富了剧中角色的内容。
编剧团队删除不符现实的剧情之外,也藉由数据增添人物角色丰富度:
例如主角年龄提高
了5岁,变成30多岁。方梦贞解释:「刚毕业的新鲜人,面临的压力还没那麽明显,大概
工作8、9年有些存款後,家里与社会对你比较有期待,而30岁世代就是被夹在中间,最痛
苦的那一层。」
徐毓良团队
在PTT利用自动索引程式「爬虫」发现的「银行债权催收员」一职,最终也成
为了女主角的职业。剧本原先设定女主角是公务员,为赚钱买房兼职家教,与「债」的距
离较远,没想到後来发现,在民间贷款机构与非法讨债集团之外,还有银行债权管理部门
这样的催收工作。
在编剧把女主角年龄拉高,变成银行债权管理部门的小主管後,副业也改为时下流行的外
送员,让工作性质和内容更符合剧情走向,角色更加立体。
徐毓良指出,
大数据并非左右编剧创作,反而是个辅助,帮助编剧找出田野调查过程被遗
漏、未被看见的资讯。方梦贞也附议,「数据是趋势,田调是细节」,两者相辅相成,提
升了编剧设定剧本大方向的效率,也捞出有趣的趋势议题。
横跨机器与编剧语言 徐毓良读数据定乾坤
《大债时代》播出後,许多观众都说在戏里看到了自己与亲友:「99%的我们都是咏晴,
即使房价再高、也要硬咬着牙买房。」「大债时代就是目前年轻人的缩影。」
方梦贞在宣传《大债时代》时,也特别感谢徐毓良团队的协助,让剧本真实呈现当代青年
面对生存困境的无奈,讲出新世代心声。
摊开4个月的合作过程,其实《大债时代》与资策会团队仅开了7次会。这意味必须在短期
内精准理解、回应剧组的问题。方梦贞本来得知要与资策会共事时,担心双方会有沟通障
碍,「没想到他们对影视术语不陌生,还会举出欧美剧中的类似情节跟我们分享」。
徐毓良笑言自己做的事,就是简单三步骤:听懂客户问题;翻译给机器;最後再把机器产
出的结果,转译回客户。「如果听不懂客户需求,有再高的技术、再强的敏锐度都没用,
解决问题才是关键。」
但是这翻译机的建立,可不简单!
徐毓良在2016年结束《我们与恶的距离》的合作之後,投入2年时间,以实验性质免费与
影视工作者合作,除了精进数据技术,也学习了解编剧到底需要什麽,编剧是如何思考,
热心的编剧友人,还替徐毓良开了一长串书单。
「全部都看完了,但没有看很细啦!」徐毓良的办公桌放满密密麻麻的参考书,从创作经
典《场景设定创意辞海》、《故事的解剖》、《畅销书密码》,到没书皮、被拆成方便携
带的无名书。
与编剧沟通之路没有捷径,只有涓滴累积。尤其资策会执行剧本开发的团队,
包含徐毓良在内,仅有3个人,偶尔加个0.5,请工程师协助「爬虫」。徐毓良坦言,没有
政府的专案支持下,单仰赖大数据协助剧本开发,无法养活整个部门。「太新的事情,要
人掏钱不容易。」
万般设定起头难 照世明灯大数据
目前徐毓良的团队,有5、6个案子正在进行,从剖析年轻女性的感情观、年轻人大学毕业
後的出路,掌握世代价值观差异、协助国外IP转化成本土共感元素,还有运用司法文本与
社群数据找到犯罪手法,验证背景设定等等。
徐毓良认为,
在许许多多的戏剧类型中,大数据最能提供协助的有两种:一是「有开放资
料文本的」,二是「剧情观点多元且混乱的」,像《我们与恶的距离》就是在探讨社会对
随机杀人事件的不同观感。
徐毓良指出,
每个人看资料,下意识只会看喜欢的东西,自动过滤不熟悉的内容,「尤其
政治特别明显,绿的就喜欢看绿的,蓝的喜欢看蓝,看到另一党就会生气,可是事实应是
把蓝绿白拼起来後,中间那块才较接近真实,而我们就是试图还原。」
不过大数据也非万能,
「有数据是基础,数据量够大才是大数据」,徐毓良解释,像刻画
台湾工地百态的《做工的人》,或以消防员为主题的《火神的眼泪》,这类网路资料量较
少的职业,还是得仰赖编剧的田野调查与实际探访职场职人。
大数据对於历史、神怪题材,也较难提供协助。徐毓良分享,曾有人想请他协助调查国共
内战後,被国民党留下或被带回台湾的华侨老兵资料,想写成剧本,但徐毓良只能婉拒。
「
你在Google查到的内容,就是我能做的,这比较适合问历史、民俗专家」。
但徐毓良特别想打破一个迷思,
不是只有「写实剧」能用大数据辅助,「科幻」类型也是
有所助益,「我可以做出未来年表」。
2002年,由汤姆克鲁斯主演的电影《关键报告》(Minority Report)中,未来世界的警
察已可透过犯罪预示系统,事先埋伏、逮捕嫌犯。片中展现的扩增实境(AR)、触控萤幕
、电子纸到无人车等,已经出现在我们生活周遭。
徐毓良指出,藉由政府法规以及科学杂志等数据,替剧组写出「未来年表」不是不可能。
说到底,徐毓良目前的成绩,归功於资策会服务14年所累积的专案经验,再加上自己一颗
旺盛的好奇心。所有人丢出来的剧情问题,对他来说都是充实自己的题库,也惟有如此,
才能继续当编剧导演们的「徐」伯温,以资料库为影视产业卜一个未来。
要数据还是编剧 准确与套路的两难
大数据能完全取代编剧吗?
2015年成立的比利时人工智慧公司ScriptBook,专攻剧本分析。
只要上传剧本至
ScriptBook系统,6分钟内就能完成分析、获得详细数据,包含角色魅力量表、目标族群
预测、观众满意度指数等。ScriptBook也曾用演算法预测过去两年上映电影的国际票房收
益,准确率高达86%,相当惊人。
https://www.scriptbook.io/
ScriptBook另一阶段的目标是故事自动生成,在内建30万份剧本资料的写作系统中,编剧
只需输入关键字与主题,选择长度并选定角色特徵,系统就会填补剩下空白。他们认为人
类与AI共同写作,未来将成常态。
早在4、5年前,中国影视圈也已利用大数据分析,整合影视剧、演艺人员资讯,预测市场
反应,协助资方利用AI选择演员,预测选角组合对票房的影响。
徐毓良笑言,在中国工作的编剧友人曾告诉他,每个人电脑都有一个剧本分析器,稿子写
完,就丢进去验证哪些地方需要加强,才能成为「爆款剧」。「但我朋友就不愿意,因为
剧本就会长得很套路。」
嘲讽这种套路,也被中国玩成另类自娱。
「资深游戏玩家老张意外穿越到自己玩了10年的『武林争霸』游戏世界中,从此拥有所向
披靡的强大力量,但他在穿越之初,就因误会成为武林公敌,随之而来的是一连串的围剿
和阴谋……」
以上内容,是由
中国数据视觉化团队DATAMUSE开发的自动剧本生成器「国产烂剧制造厂」
所产制的内容,只要选取故事类型,输入两位主角名字,就能即时生成剧情介绍。
https://datamuse.guokr.com/
DATAMUSE表示,自动剧本生成器的制作初衷,是在思考为何中国拍摄技术越来越好时,低
分国产剧却越来越多。他们爬梳6000多部中国戏剧作品,从导演、剧情、演员多角度挖掘
数据规律,设计出这个自动剧本生成器。
DATAMUSE感慨,
当编剧想推展剧情时,就喜欢以「昏迷、搬家、出轨、流产和精神病等桥
段,反覆填充」,这意味着编剧缺乏想像力。
蓝色数据海 我想要一个未来
数据的科技蓝海,投影在方梦贞工作室的白墙上,她站在墙前,程式语言交织在脸上。
《大债时代》是方梦贞首部利用大数据开发的作品,合作经验愉快,也替剧组扣紧时事议
题。徐毓良团队既是观众又是数据分析者,能客观提供意见,也能精简资讯,「光从1、2
万笔资料,变成100、200笔,阅读量直接少100倍。」
方梦贞坦言,过去创作像土法炼钢,没有科技协助,写剧本找演员全靠「直觉跟猜」,虽
然尽力阅读相关报导与案例,最终主创团队只能以经验值辅助,嗅出时下议题或趋势。
但是把作品丢回市场,能不能引起观众共鸣?方梦贞笑回:「跟判断一个人会不会红一样
,这个行业都带着一点点赌的成分。」就像当初剧组选择林柏宏饰演创业屡次失败、油而
却不令人厌的杨大器。
「柏宏一坐下来,聊没多久,听他讲小时候爸妈做生意、到处卖东西的故事。角色身上那
亟欲成功,赚钱让家里过好生活的心情,他完全理解。那是我从没听过的柏宏,那时我就
在他身上看到大器的影子。」
或许这就是大数据无法看到的细节,方梦贞幽默地耸耸肩,「但你可以用数据知道,6成
观众都觉得这个人很帅,那红的机率确实比较高。」
对於大数据与影视的关系,方梦贞既乐观也保守,虽不否认大数据可能扼杀创意,但若有
机会再使用大数据分析、开发剧本,会以辅助形式来寻找线索或验证疑问。
「若全然依赖大数据,我会觉得有些可惜,有些戏剧能打动人、吸引人,是因为它超乎一
般人的生活。如果只看一般人注意的,就不会看到有趣的点。」方梦贞眼里闪着光,或许
也有那麽几部电影、戏剧,是带着观众的想像,飞到更遥远之处。
大数据是能帮你快速抓住大方向、推你一把。不过更远的路,或许情感、直觉、创意更是
有用。方梦贞调皮的说:「连大方向都抓不到,再多小细节都没有用啦!」
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.128.156.69 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Scenarist/M.1616049124.A.B74.html