[討論] LLM即將像Stable Diffusion普及

時間Wed Mar 15 12:56:02 2023

https://simonwillison.net/2023/Mar/11/llama/ https://simonwillison.net/2023/Mar/13/alpaca/ Simon Willison提到，很快大家都會有自己的ai助手。看時間軸： 24th February 2023: LLaMA is announced, starts being shared with academic partners: https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/ 2nd March: Someone posts a PR with a BitTorrent link to the models: https://github.com/facebookresearch/llama/pull/73 10th March: First commit to llama.cpp by Georgi Gerganov: https://github.com/ggerganov/llama.cpp 11th March: llama.cpp now runs the 7B model on a 4GB RaspberryPi: https://twitter.com/miolini/status/1634982361757790209 12th March: npx dalai llama: https://cocktailpeanut.github.io/dalai/ 13th March (today): llama.cpp on a Pixel 6 phone: https://twitter.com/thiteanish/status/1635188333705043969 And now, Alpaca. https://crfm.stanford.edu/2023/03/13/alpaca.html ------------------------------------------ 詳細想法與內容就請看simon willison的部落格。我是蠻認同這想法的，LLM(Large Language Model)很快就會普及。 https://cocktailpeanut.github.io/dalai/#/ 自動安裝的script都出了。LLaMA的Inference在現代多核CPU跑是可行的，現在優化速度也很快。離ChatGPT，GPT4還有一段距離，但很夠用了，而且整個網路一起發展，可能很快就追上也不一定。我雖然最近超忙，但都想找時間看能不能移植到OpenCL。我覺得LLM最大的好處是summerize(總結) 例如之前討論手刻Make的問題。 Make是偶而一用，真的容易忘記指令跟功能，也就不容易發現問題。 LLM在這就很適合幫忙，把make檔給它，解釋總結，很快就能發現問題，就不須要找很難找到的Make專家。雖然LLM容易"hallucinate"但用LLM寫個簡單的Make檔案當個開頭也很好。 Code看不懂，用太多不明functions？LLM來幫忙。 ffmpeg參數太多太複雜？LLM寫給你。這是當年google橫空出世讓網路好用起來。再一次大感動。大家真的可以好好追蹤這個發展。可以自己控制的LLM，可以發展的功能太多了。 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.232.158 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1678856174.A.098.html

1^F：推 create8: 推 03/15 17:38

2^F：→ superpandal: 看過沒試過不過可以看別人的感想 03/15 18:09

3^F：→ superpandal: ffmpeg參數... 你還是要仔細看文檔 03/15 18:12

4^F：推 ptta: 這真的很神，從此regexp都給它寫 03/15 18:46

5^F：推 hizuki: 看看它能不能正確處理GNU make和舊Android Make的差異 03/15 18:49

6^F：→ hizuki: make出問題，很多時候其實和shell環境有關，比如突然csh 03/15 18:50

7^F：→ superpandal: 寫regex會是不錯應用但指令說實話一堆文檔沒有的 03/15 18:50

8^F：→ superpandal: 文檔沒有的你也不知道可以這樣用 03/15 18:50

9^F：→ superpandal: makefile要分析整個專案了 03/15 18:51

10^F：→ superpandal: makefile可定義選項 03/15 19:04

11^F：→ Hsins: 而且有人用 4GB RAM 的樹莓派就跑起來了 03/15 19:40

12^F：→ superpandal: 觀望中聽說效能不好 03/15 19:55

13^F：→ oopFoo: pc的效能不錯。RPI是10秒一個token，pc是秒內幾個token 03/15 20:22

14^F：→ oopFoo: declarative的程式，LLM比較會處理。只要補餵正確的資料， 03/15 20:23

15^F：→ oopFoo: android/gnu make都可以分析。最近看好多應用都蠻有趣的 03/15 20:30

16^F：→ oopFoo: 當然沒有的功能，問LLM，它會幻想給你，但這是小問題 03/15 20:33

17^F：→ superpandal: 測了一下web demo時間很久又答非所問 03/15 20:39

18^F：→ superpandal: 還會error... 03/15 20:40

19^F：推 v86861062: 推推 03/15 22:33

20^F：推 CoNsTaR: 有沒有哪個 ai 是會分清楚什麼時候該幻想什麼時候不該幻 03/16 04:17

21^F：→ CoNsTaR: 想的 03/16 04:17

22^F：推 CoNsTaR: 以前問過 clang format 的 rule，ChatGPT 幻想了一個給 03/16 04:21

23^F：→ CoNsTaR: 我，我還問他這個 rule 是那個版本加入的，要怎麼用 etc 03/16 04:21

24^F：→ CoNsTaR: 結果所有東西都是他幻想出來的，浪費了我十分鐘 03/16 04:21

25^F：推 AzureRW: 做比較重要的東西時要叫他給出處多方比較後才採用 03/16 07:36

26^F：→ AzureRW: 我想這也是為 03/16 07:36

27^F：→ AzureRW: 毛該禁止ai寫stack overflow跟wiki或技術文章未來 03/16 07:36

28^F：→ AzureRW: 整個池子被污 03/16 07:36

29^F：→ AzureRW: 染之後可能會根本不知道哪裡是ai自己亂唬爛的 03/16 07:36

30^F：推 wsad50232: 原Po是Google派來的嗎？ 03/16 08:28

31^F：推 ouskit: 可以跑跟跑的好是兩回事 03/16 14:02

32^F：→ oopFoo: Meta說LLaMA-13B可比GPT3的175B。 03/16 15:35

33^F：→ oopFoo: 目前都是最簡單的CPU優化。剛開始Pixel6需要26秒/token 03/16 15:38

34^F：→ oopFoo: 前幾天已經5token/秒。各家版本飛速進步中。 03/16 15:39

35^F：→ oopFoo: LLMs的"幻想"是內建，目前沒辦法，只能後續查證。 03/16 15:40

36^F：推 lastpost: 這些直接問chatGPT就好了，為何要自己弄？ 03/17 17:56

37^F：→ Hsins: 差別在一個是在大公司商用伺服器上，一個則是可以自己用消 03/17 18:13

38^F：→ Hsins: 費型主機搭建。當初 Hadoop 的興盛也是因為可以使用消費型 03/17 18:13

39^F：→ Hsins: 主機作為運算叢集，真的能發展起來的話是很有價值的 03/17 18:13

40^F：推 jay123peter: 推 03/17 22:36

41^F：→ oopFoo: chatGPT是通用的chat，但自己的，如Alpaca你可以訓練特化 03/18 10:16

42^F：→ oopFoo: 的instruction tuning。更適合自己的用途。 03/18 10:17

43^F：→ oopFoo: https://github.com/antimatter15/alpaca.cpp 03/18 21:56

44^F：→ oopFoo: windows可以玩，自己編譯7B版，13B版應該很快就來了。 03/18 21:57

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Soft_Job 板

[討論] LLM即將像Stable Diffusion普及

熱門看板

贊助商連結