作者retest75 (再一次)
看板DataScience
标题[问题] 手刻机器学习模型
时间Fri Jan 20 22:02:16 2023
请问板上各位前辈
最近想试着手刻一些机器学习的模型
像是KNN、Logistic之类的经典模型
但找了一些书後发现大多都是介绍完模型概念後就直接使用scikit-learn的套件模型使用
於是上来问问板上前辈
有没有关於这些手刻模型的书籍或是参考资源是比较推荐的?
另外想问一下,手刻模型需要刻到怎麽样的程度?
是需要做到可以像scikit-learn一样还有一些额外的参数可以做调整
还是说只要可以实现这些演算法的内容与结果即可
会这样问是因为这学期修的某堂课老师常常提到说会要求自己的研究生不能使用套件
都要他们自己手刻,也提过说去到业界工作也不会让你使用这些套件
也是因为这样才让我想说自己试着手刻看看,顺便加强自己的coding能力
不晓得这样做对自己有没有帮助
还请板上前辈解惑 谢谢大家
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.120.7.210 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1674223338.A.913.html
1F:→ alex780312: 我倒觉得业界也要用那些套件做模型训练,只是部署阶01/20 22:13
2F:→ alex780312: 段有种种考量要自己刻或者改code的能力01/20 22:13
3F:推 st1009: 业界不用套件??? 这老师是跟哪个公司合作的...01/20 22:23
4F:推 a78998042a: 练习时就刻核心就好,可以当成做教学的心态,会做得 01/20 23:08
5F:→ a78998042a: 比较仔细。跟刻论文算法一样,如果结果跟论文差太多01/20 23:08
6F:→ a78998042a: ,就会把各种参数都开出来了…01/20 23:08
7F:→ wuyiulin: 不是啦,这边说的套件是 scikit-learn 直接 .train 那01/21 01:28
8F:→ wuyiulin: 种01/21 01:28
请问w大,什麽是直接.train那种呢?
9F:→ wuyiulin: Model 自己刻很正常吧?我也只有接简单案子敢直接交 sc01/21 01:28
10F:→ wuyiulin: ikit-learn 东西出去01/21 01:28
※ 编辑: retest75 (111.83.38.23 台湾), 01/21/2023 09:20:42
11F:→ iHaveAPen: 手刻模型就是不停的看library的documentations,依自己 01/21 14:58
12F:→ iHaveAPen: 的需求使用 01/21 14:58
13F:→ iHaveAPen: 手刻的程度可大可小,小至矩阵计算实作ML,大至新模型 01/21 15:00
14F:→ iHaveAPen: 架构实作 01/21 15:00
15F:推 st1009: 我试过用c刻DNN,和用python numpy刻DNN,torch刻任意基础 01/21 16:03
16F:推 st1009: 模型,个人觉得这个能力应该要有 01/21 16:03
17F:→ yoyololicon: 打开PRML 照里面的算式用numpy写 easy 01/21 17:00
18F:推 Wush978: 手刻模型要学数值最佳化套件, 像是LBFGS 或是 SGD等等 01/22 10:42
19F:→ Wush978: 还有要练习自己建model matrix ,需要线性代数知识 01/22 10:44
20F:→ Wush978: 以及会用相关的函式库 01/22 10:44
21F:推 ddavid: 业界才是能用套件就尽量用,必须特化才会修改 01/24 21:52
22F:→ ddavid: 基本上要有修改能力,但绝不是什麽都自己造轮子 01/24 21:53
23F:推 cowbadma5566: 手刻能更好了解原理 但时间可以投注在更有效率的地 01/25 03:24
24F:→ cowbadma5566: 方 01/25 03:24
25F:推 wieldthewave: 借串问一下,在numpy下刻套件跟在pytorch下刻有什麽 01/25 13:46
26F:→ wieldthewave: 不一样吗 01/25 13:46
27F:→ wieldthewave: 最近在用numpy刻一些模型,有想要用pytorch也试试看 01/25 13:46
28F:→ wieldthewave: 但突然想到如果我用numpy就可以完成的事为什麽还要 01/25 13:46
29F:→ wieldthewave: 用pytorch再做一次 01/25 13:46
30F:→ wieldthewave: 想问一下在业界用numpy跟用pytorch有什麽差别吗? 01/25 13:46
31F:→ yoyololicon: PyTorch 有autograd 还有能跑在GPU上 01/25 14:25
32F:推 st1009: torch有比较多实践,np刻个NN就很累,torch刻transformer 01/26 12:07
33F:推 st1009: 而且torch 2.0 真的很快 01/26 12:08
34F:→ chang1248w: 用numpy写的附带打包串接上线都得自己弄过一遍,还有 01/26 20:17
35F:→ chang1248w: 单核 01/26 20:17
36F:推 justakidd: 业界其实是有现成的就先用,有需要才针对需求去特化 02/04 21:49
37F:→ justakidd: 手刻还是不错的练习啦,个人认为刻过一次能重现结果, 02/04 21:53
38F:→ justakidd: 理解每个步骤的实作即可,时间应花在更值得的地方 02/04 21:53
39F:推 jacky18008: 好奇一问,你老师是不是姓蔡……? 04/26 20:16