作者aPplAus (灿烂)
看板Stock
标题Re: [新闻] 联发科AI平台MediaTek DaVinci「达哥」
时间Wed Apr 10 20:38:57 2024
原文恕删
小弟刚好最近有跟到一些台湾LLM的发展,可以补充一下关於模型的部分。联发科的研究
单位联发创新基地,做语言模型有一段时间了,之前有一版Breeze-7B模型,发布了一篇
技术论文放在arxiv:
https://arxiv.org/pdf/2403.02712.pdf
论文提到这个模型是从mistral-7B 继续训练而成,花了7000小时的H100,灌了650GB的da
ta。如果有一半是中文,325GB,也灌了超过1000亿汉字(3bytes=1word),其实很多了啦
。
然後Breexe是从Mixtral训练而成,是更大一级的模型,论文好像还没出,但很多公司都
有不同大小的模型,做法应该不会差太多(?)。最近有开放API试用:
https://huggingface.co/MediaTek-Research/Breexe-8x7B-Instruct-v0_1
跟ChatGPT的比较,最重要的点应该是,像Breeze-7B这种已经开源的模型,对能架伺服器
的公司来说,是用越多越赚;跟token收费的ChatGPT 用越多越贵截然不同。Breexe不知
道会不会开源就是了。
达哥的部分,没有亲自用过,但有认识的人用过。基本上就是平台,然後有一些功能,像
是读pdf等等。就把AI推广给更多人的东西,应该是不错啦。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.166.35.85 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1712752740.A.F57.html
1F:推 stlinman : 开源的 Breeze-7B 我是玩一下过,感觉还不错! 04/10 20:42
2F:→ stlinman : 试 04/10 20:43
3F:推 tomdavis : 推介绍! 04/10 20:43
4F:推 addy7533967 : 推推 04/10 20:48
5F:推 xm3u4vmp6 : 一看到h100 直接冷掉 一半人根本玩不起QQ 04/10 20:50
6F:推 Sixigma : 做隔壁专业的,好奇这样子也会有 emerging ability 04/10 20:52
7F:→ Sixigma : 吗,其实它变单一语种而且是繁中,和原始模型不能算 04/10 20:52
8F:→ Sixigma : 同个东西了吧,而且英语的普及度又远大於繁中,很多 04/10 20:53
9F:→ Sixigma : 问题会受限吧,那个benchmark和GPT3.5也差一截 04/10 20:54
10F:嘘 damn1120 : 可以帮文组翻译吗 救命-.- 04/10 21:00
11F:推 stlinman : 重点是企业设置私有AI模型运用,要能合规法循。所以 04/10 21:05
12F:→ stlinman : 繁中未来还是有一定的市场可以开发。 04/10 21:06
13F:推 turndown4wat: 这样发哥明天是涨还是跌? 04/10 21:08
14F:推 avali : 联发哥2000 04/10 21:15
15F:推 Morphee : 这东西开发跟上好处很多 值得值得 04/10 21:21
16F:→ Morphee : 受限没关系啊 跟上就好 04/10 21:21
17F:推 bj45566 : Mistral AI 这家法国新创有前途啊,微软都要琵琶别 04/10 21:29
18F:→ bj45566 : 抱了 04/10 21:29
19F:→ bj45566 : 发哥有眼光 04/10 21:30
20F:推 napyang : 个人觉得繁体中文最强的开源就是breeze 7B了,回答 04/10 21:35
21F:→ napyang : 的都满好的。 04/10 21:35
22F:推 fukku100 : 特点除了繁体,可以针对台湾的内容回答得不错 04/10 21:56
23F:推 Isopod : 达哥也不是功能啦,大部分就是挑好model然後写好pro 04/10 22:00
24F:→ Isopod : mpt来做各种事情 04/10 22:00
25F:推 coffee112 : 推推 04/10 22:04
26F:推 Ken52039 : 未来股王 04/10 22:05
27F:推 stevegood : 讲实话工作上能用很不错 04/10 22:41
28F:推 wayne0530 : 繁中最大资料库,是否能用ptt内的文章来灌进去训练 04/10 23:06
29F:推 Surrey00 : 推推 04/11 00:29
30F:推 qwe78971 : 果然是拿开源拿来改== 给我一台H100 我也行 04/11 01:19
31F:→ greatwu : 闻西,要你命3000,讯号来了 04/11 07:22