作者filmwalker (外面的世界)
看板Scenarist
標題[新聞] 大數據助攻 台劇創作掀開新頁
時間Thu Mar 18 14:31:57 2021
https://www.cna.com.tw/news/firstnews/202103145002.aspx
影視製作導入大數據是近年國際趨勢,2016年《我們與惡的距離》首次為台劇點了第一把
火,如今星火燎原。
文:葉冠吟
21歲到30歲的年輕人最關心什麼?
分齡統整2019年Google關鍵字搜索:21歲是生日與禮物;22到24歲,在乎自己是否還能長
高;大學、研究所畢業後的25到28歲,開始在意存款;到了29、30歲,煩惱如泉湧,從婚
姻、轉職、薪水、存款到健康檢查……一連串議題,多到連表格都寫不下。
「30歲最痛苦,煩惱一堆」,資策會數位服務創新研究所副主任徐毓良,指著投影幕上的
數據感慨說道。
這是公共電視迷你劇集《大債時代》劇本設定的輔助數據資料,也是資策會服創所團隊繼
金鐘獎台劇《我們與惡的距離》後,第二度與公視合作,以大數據分析協作劇本開發。
探討青年負債議題的《大債時代》,由張書豪、林柏宏、李霈瑜(大霈)主演,三人飾演
高中死黨,畢業後各奔前程,分別成為公司負責人、斜槓創業家與銀行債務催收員。但32
歲那年,張書豪跳樓輕生,兩位好友替張書豪解決所留鉅額債務的同時,也得各自面對沉
重的生活壓力。
編劇的大數據門診 處方來自PTT
「年輕人碰到債會躲起來嗎?」「買毒品的年齡層?在哪買?」「年輕人最常見的債務是
什麼?」「30歲受薪階級的平均月薪是多少?」「企業掏空案到底要掏要多少錢才算多?
」「黑道討債和銀行債權管理的差異?」
一如有著十萬個為什麼,方夢貞形容與資策會合作的過程,就像跟醫生定期門診,只是處
方來自扎實的數據資料。
徐毓良指出,
《大債時代》與《我們與惡的距離》兩者提出的數據輔助需求不同,前者已
有故事大綱和人物設定架構,後者則是在「無差別殺人事件」主題的資訊海中,撈出劇本
線索。
徐毓良認為合作的方向很明確,就是回答方夢貞提出的問題,並判斷劇本可能需要的數據
內容,分類後,再利用文字探勘的方式取得資料。
首先當然是以「債」、「年輕世代」相關內容為關鍵字,從PTT(批踢踢實業坊)、臉書
、新聞網站、網路論壇,挑選出網友評論度、分享轉貼數量高的文章,搜集符合主題及需
求的內容。同時,也就不同個案問題爬梳法院判決書,甚或是外送的菜單。
徐毓良指出,藉由
PTT上的資訊,很容易就可找到各職業的個案。「30歲左右的人,會在
職涯版分享工作經驗和過程。」團隊就從中找到銀行、行銷、高科技等各行業的年輕人個
案,觀察他們對於生活、薪水、職場、房貸等看法與抱怨,或覺得哪些工作比較好賺錢。
鑑於《我們與惡的距離》資料過於龐雜,導致編劇呂蒔媛難以消化,徐毓良面對《大債時
代》,
將上萬筆資料刪減、統整成100筆,再轉譯成方夢貞團隊能理解閱讀的形式:例如
文字雲、表格、關鍵字等,同時也將資料匯集成小型資料庫,供編劇日後查詢參考。
大數據反覆驗證 戲劇縮影現實人生
經歷4個月反覆驗證,方夢貞與《大債時代》編劇團隊藉由大數據資料,調整故事情節與
人物設定。她苦笑:「來回修改的過程是辛苦的,但改完後就不會心虛虛的,確實符合現
狀」。
方夢貞透露,原本規劃林柏宏的角色是要
揭發公司的掏空弊案,但經由數據考證才驚覺,
這是公司少數人才可能接觸的案件。「20多歲的人,不論職等或資歷都不大可能接觸到這
麼機密的事,況且大部分年輕人連租房、買房都有困難,甚至吃飽都成問題,更在意尋找
自我價值的認同。」最後,只好
將這條支線刪除。
另一條放棄的劇情線,是「年輕上班族因壓力吸毒」。徐毓良分享,團隊爬梳500多篇法
院判決書和文獻,發這個年齡層根本不大會接觸毒品。「
20、30歲這群人,生活壓力都喘
不過來,根本沒錢買毒品,經濟寬裕的中年人與家庭富裕的孩子,反而才是主要使用者。
」
方夢貞分享,
編劇團隊除了刪除不合現實的設定,也從數據中找到先前未注意的職業,掌
握年輕人在意的趨勢,從而豐富了劇中角色的內容。
編劇團隊刪除不符現實的劇情之外,也藉由數據增添人物角色豐富度:
例如主角年齡提高
了5歲,變成30多歲。方夢貞解釋:「剛畢業的新鮮人,面臨的壓力還沒那麼明顯,大概
工作8、9年有些存款後,家裡與社會對你比較有期待,而30歲世代就是被夾在中間,最痛
苦的那一層。」
徐毓良團隊
在PTT利用自動索引程式「爬蟲」發現的「銀行債權催收員」一職,最終也成
為了女主角的職業。劇本原先設定女主角是公務員,為賺錢買房兼職家教,與「債」的距
離較遠,沒想到後來發現,在民間貸款機構與非法討債集團之外,還有銀行債權管理部門
這樣的催收工作。
在編劇把女主角年齡拉高,變成銀行債權管理部門的小主管後,副業也改為時下流行的外
送員,讓工作性質和內容更符合劇情走向,角色更加立體。
徐毓良指出,
大數據並非左右編劇創作,反而是個輔助,幫助編劇找出田野調查過程被遺
漏、未被看見的資訊。方夢貞也附議,「數據是趨勢,田調是細節」,兩者相輔相成,提
升了編劇設定劇本大方向的效率,也撈出有趣的趨勢議題。
橫跨機器與編劇語言 徐毓良讀數據定乾坤
《大債時代》播出後,許多觀眾都說在戲裡看到了自己與親友:「99%的我們都是詠晴,
即使房價再高、也要硬咬著牙買房。」「大債時代就是目前年輕人的縮影。」
方夢貞在宣傳《大債時代》時,也特別感謝徐毓良團隊的協助,讓劇本真實呈現當代青年
面對生存困境的無奈,講出新世代心聲。
攤開4個月的合作過程,其實《大債時代》與資策會團隊僅開了7次會。這意味必須在短期
內精準理解、回應劇組的問題。方夢貞本來得知要與資策會共事時,擔心雙方會有溝通障
礙,「沒想到他們對影視術語不陌生,還會舉出歐美劇中的類似情節跟我們分享」。
徐毓良笑言自己做的事,就是簡單三步驟:聽懂客戶問題;翻譯給機器;最後再把機器產
出的結果,轉譯回客戶。「如果聽不懂客戶需求,有再高的技術、再強的敏銳度都沒用,
解決問題才是關鍵。」
但是這翻譯機的建立,可不簡單!
徐毓良在2016年結束《我們與惡的距離》的合作之後,投入2年時間,以實驗性質免費與
影視工作者合作,除了精進數據技術,也學習瞭解編劇到底需要什麼,編劇是如何思考,
熱心的編劇友人,還替徐毓良開了一長串書單。
「全部都看完了,但沒有看很細啦!」徐毓良的辦公桌放滿密密麻麻的參考書,從創作經
典《場景設定創意辭海》、《故事的解剖》、《暢銷書密碼》,到沒書皮、被拆成方便攜
帶的無名書。
與編劇溝通之路沒有捷徑,只有涓滴累積。尤其資策會執行劇本開發的團隊,
包含徐毓良在內,僅有3個人,偶爾加個0.5,請工程師協助「爬蟲」。徐毓良坦言,沒有
政府的專案支持下,單仰賴大數據協助劇本開發,無法養活整個部門。「太新的事情,要
人掏錢不容易。」
萬般設定起頭難 照世明燈大數據
目前徐毓良的團隊,有5、6個案子正在進行,從剖析年輕女性的感情觀、年輕人大學畢業
後的出路,掌握世代價值觀差異、協助國外IP轉化成本土共感元素,還有運用司法文本與
社群數據找到犯罪手法,驗證背景設定等等。
徐毓良認為,
在許許多多的戲劇類型中,大數據最能提供協助的有兩種:一是「有開放資
料文本的」,二是「劇情觀點多元且混亂的」,像《我們與惡的距離》就是在探討社會對
隨機殺人事件的不同觀感。
徐毓良指出,
每個人看資料,下意識只會看喜歡的東西,自動過濾不熟悉的內容,「尤其
政治特別明顯,綠的就喜歡看綠的,藍的喜歡看藍,看到另一黨就會生氣,可是事實應是
把藍綠白拼起來後,中間那塊才較接近真實,而我們就是試圖還原。」
不過大數據也非萬能,
「有數據是基礎,數據量夠大才是大數據」,徐毓良解釋,像刻畫
台灣工地百態的《做工的人》,或以消防員為主題的《火神的眼淚》,這類網路資料量較
少的職業,還是得仰賴編劇的田野調查與實際探訪職場職人。
大數據對於歷史、神怪題材,也較難提供協助。徐毓良分享,曾有人想請他協助調查國共
內戰後,被國民黨留下或被帶回台灣的華僑老兵資料,想寫成劇本,但徐毓良只能婉拒。
「
你在Google查到的內容,就是我能做的,這比較適合問歷史、民俗專家」。
但徐毓良特別想打破一個迷思,
不是只有「寫實劇」能用大數據輔助,「科幻」類型也是
有所助益,「我可以做出未來年表」。
2002年,由湯姆克魯斯主演的電影《關鍵報告》(Minority Report)中,未來世界的警
察已可透過犯罪預示系統,事先埋伏、逮捕嫌犯。片中展現的擴增實境(AR)、觸控螢幕
、電子紙到無人車等,已經出現在我們生活周遭。
徐毓良指出,藉由政府法規以及科學雜誌等數據,替劇組寫出「未來年表」不是不可能。
說到底,徐毓良目前的成績,歸功於資策會服務14年所累積的專案經驗,再加上自己一顆
旺盛的好奇心。所有人丟出來的劇情問題,對他來說都是充實自己的題庫,也惟有如此,
才能繼續當編劇導演們的「徐」伯溫,以資料庫為影視產業卜一個未來。
要數據還是編劇 準確與套路的兩難
大數據能完全取代編劇嗎?
2015年成立的比利時人工智慧公司ScriptBook,專攻劇本分析。
只要上傳劇本至
ScriptBook系統,6分鐘內就能完成分析、獲得詳細數據,包含角色魅力量表、目標族群
預測、觀眾滿意度指數等。ScriptBook也曾用演算法預測過去兩年上映電影的國際票房收
益,準確率高達86%,相當驚人。
https://www.scriptbook.io/
ScriptBook另一階段的目標是故事自動生成,在內建30萬份劇本資料的寫作系統中,編劇
只需輸入關鍵字與主題,選擇長度並選定角色特徵,系統就會填補剩下空白。他們認為人
類與AI共同寫作,未來將成常態。
早在4、5年前,中國影視圈也已利用大數據分析,整合影視劇、演藝人員資訊,預測市場
反應,協助資方利用AI選擇演員,預測選角組合對票房的影響。
徐毓良笑言,在中國工作的編劇友人曾告訴他,每個人電腦都有一個劇本分析器,稿子寫
完,就丟進去驗證哪些地方需要加強,才能成為「爆款劇」。「但我朋友就不願意,因為
劇本就會長得很套路。」
嘲諷這種套路,也被中國玩成另類自娛。
「資深遊戲玩家老張意外穿越到自己玩了10年的『武林爭霸』遊戲世界中,從此擁有所向
披靡的強大力量,但他在穿越之初,就因誤會成為武林公敵,隨之而來的是一連串的圍剿
和陰謀……」
以上內容,是由
中國數據視覺化團隊DATAMUSE開發的自動劇本生成器「國產爛劇製造廠」
所產製的內容,只要選取故事類型,輸入兩位主角名字,就能即時生成劇情介紹。
https://datamuse.guokr.com/
DATAMUSE表示,自動劇本生成器的製作初衷,是在思考為何中國拍攝技術越來越好時,低
分國產劇卻越來越多。他們爬梳6000多部中國戲劇作品,從導演、劇情、演員多角度挖掘
數據規律,設計出這個自動劇本生成器。
DATAMUSE感慨,
當編劇想推展劇情時,就喜歡以「昏迷、搬家、出軌、流產和精神病等橋
段,反覆填充」,這意味著編劇缺乏想像力。
藍色數據海 我想要一個未來
數據的科技藍海,投影在方夢貞工作室的白牆上,她站在牆前,程式語言交織在臉上。
《大債時代》是方夢貞首部利用大數據開發的作品,合作經驗愉快,也替劇組扣緊時事議
題。徐毓良團隊既是觀眾又是數據分析者,能客觀提供意見,也能精簡資訊,「光從1、2
萬筆資料,變成100、200筆,閱讀量直接少100倍。」
方夢貞坦言,過去創作像土法煉鋼,沒有科技協助,寫劇本找演員全靠「直覺跟猜」,雖
然盡力閱讀相關報導與案例,最終主創團隊只能以經驗值輔助,嗅出時下議題或趨勢。
但是把作品丟回市場,能不能引起觀眾共鳴?方夢貞笑回:「跟判斷一個人會不會紅一樣
,這個行業都帶著一點點賭的成分。」就像當初劇組選擇林柏宏飾演創業屢次失敗、油而
卻不令人厭的楊大器。
「柏宏一坐下來,聊沒多久,聽他講小時候爸媽做生意、到處賣東西的故事。角色身上那
亟欲成功,賺錢讓家裡過好生活的心情,他完全理解。那是我從沒聽過的柏宏,那時我就
在他身上看到大器的影子。」
或許這就是大數據無法看到的細節,方夢貞幽默地聳聳肩,「但你可以用數據知道,6成
觀眾都覺得這個人很帥,那紅的機率確實比較高。」
對於大數據與影視的關係,方夢貞既樂觀也保守,雖不否認大數據可能扼殺創意,但若有
機會再使用大數據分析、開發劇本,會以輔助形式來尋找線索或驗證疑問。
「若全然依賴大數據,我會覺得有些可惜,有些戲劇能打動人、吸引人,是因為它超乎一
般人的生活。如果只看一般人注意的,就不會看到有趣的點。」方夢貞眼裡閃著光,或許
也有那麼幾部電影、戲劇,是帶著觀眾的想像,飛到更遙遠之處。
大數據是能幫你快速抓住大方向、推你一把。不過更遠的路,或許情感、直覺、創意更是
有用。方夢貞調皮的說:「連大方向都抓不到,再多小細節都沒有用啦!」
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.128.156.69 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Scenarist/M.1616049124.A.B74.html