作者oopFoo (3d)
看板Soft_Job
標題Re: [心得] 如何減少 GTA Online 70% 載入時間?(轉)
時間Mon Mar 29 22:25:07 2021
※ 引述《alihue (wanda wanda)》之銘言:
: 原始文章: https://nee.lv/2021/02/28/How-I-cut-GTA-Online-loading-times-by-70/
: 如何減少 GTA Online 70% 載入時間?
: 作者覺得 GTA Online 載入時間機八久,因此想要一探究竟
: 首先作者做 benchmark 發現
: Story mode load time: ~1m 10s
: Online mode load time: ~6m flat
: 然後看看 cpu usage 同時在這段時間燃燒
: 第一步,作者先做 profiling 可以得知哪一些 function 佔了最多 CPU 資源
: 第二步,用 disassembler 去看程式碼
: 問題1. It’s… strlen?!
: 好像會 parse 一個高達 10MB 的 json 檔案,其中包含 63k items
: 這些資料是遊戲中的線上商城的
: 問題不是 10MB,而是讀取資料的方式
: https://i.imgur.com/ZHLlEDJ.png
: 讀法是用 sscanf 一次讀一個 char,讀完馬上呼叫 strlen,
: 再繼續讀下一個 char....
: 然後當要讀的檔案有 10mb 這麼大就有很重的 overhead
是sscanf的function裡會呼叫strlen,也不是一次讀一個char。
https://opensource.apple.com/source/xnu/xnu-792/libkern/stdio/scanf.c.auto.html
雖然不知微軟如何implement sscanf,不過應該大致相同。
這10mb的json是一個string。迴圈裡的sscanf會讀一個item(key:value)。
所以這個parser裡的strlen的complexity是
strlen(10mb)+strlen(10mb-length(key:value))+strlen(10mb-2*length(key:value)......
這迴圈會跑63k次。很不幸的一個quadratic time的parser就出現了,因為程式師不知sscanf裡有strlen。
GTA的insert也是quadratic time,但這真的蠢,有code review應該都會抓的到
無論如何,json parser不應該自己寫。
https://github.com/simdjson/simdjson - 最快的parser
https://rapidjson.org/ - 實際上快又準確,最多人建議的parser
https://github.com/nlohmann/json - 好用也多人建議的parser
google 一下,有超多的選擇。
上面任何一個都可以在幾秒(0.幾秒吧)內處理完10mb 63k的json。
而現在優化的GTA還是需要快一分鐘處理!對sscanf is slooooooow。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.27.86 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1617027914.A.8CD.html
1F:推 alihue: 謝謝補充說明 03/29 22:25
2F:→ nh60211as: 所以這算是自己造輪子失敗的案例嗎 03/29 23:11
對,遊戲業的習慣,喜歡自己造輪子。十幾二十幾年前,因為各種限制,造輪子還有道理,現在還不趁機導入業界好用的lib就是怠惰了。
3F:推 jasonwung: 推 03/29 23:43
4F:推 viper9709: 原來是這樣 03/30 00:00
※ 編輯: oopFoo (59.115.98.214 臺灣), 03/30/2021 10:52:24
5F:推 dreamnook: 03/30 14:14
6F:推 Barchem: 推 03/30 14:44
7F:推 tsairay: 怕找開源的lib商用要付錢吧 03/30 18:13
8F:→ oopFoo: mit/bsd/apache license的libs超多,這幾個json libs都是 03/30 18:36
9F:推 hduek153: 推 03/30 19:43
10F:→ superpandal: 這事情有應不應該? 不過M$就不說了 03/30 19:53
11F:→ superpandal: 不過 XD 03/30 20:07
12F:推 OppOops: 事實上我認為他是用 recursive 的方式去處理 json 03/30 21:48
13F:→ OppOops: 所以才會重複展開 sscanf 03/30 21:49
15F:→ oopFoo: 很早就知道sscanf有strlen的問題。 03/30 23:03
16F:→ oopFoo: 跟重複展開無關 03/30 23:04
17F:推 wangm4a1: 推 04/01 16:09