作者Epoch0404 (Epoch0404)
看板Programming
标题[问题] 自学写compiler 求建议
时间Sun Oct 29 23:10:16 2017
各位大大安安,第一次发文,如有缺失还请多多包涵
小弟目前是大二的学生,学过的语言包含 C/C++ Java Python 然後有自学
过一点组语,最近想给自己一个挑战就是写一个简单的compiler,爬过文之
後也有去图书馆翻了几本compiler实作的书(像是用Java实作compiler等)
,可是程度感觉差太多而且书又厚又长实在啃不下去,网路上也有翻过一些简单
的用Javascript写基础compiler的小文章,可是看完之後实在没甚麽感觉
所以来这边发问希望各位大大可以给点建议看要从哪里切入,看最基础入门要从哪
里开始会比较好,希望有大大可以分享一点心得或是指点个方向,感恩大家
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.113.121.228
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Programming/M.1509289818.A.3C9.html
1F:推 alan23273850: 先修compiler课程?113应该有开吧 1.168.89.86 10/30 00:12
2F:→ chuegou: 语法分析吧? 1.160.123.161 10/30 00:13
4F:→ eddie55020: 这堂课还不错会写一个简单的浏览器(ht140.117.181.107 10/30 08:53
5F:→ eddie55020: ml,js)140.117.181.107 10/30 08:53
6F:→ eddie55020: 基本的语法分析,词法分析也讲的不会140.117.181.107 10/30 08:53
7F:→ eddie55020: 太难140.117.181.107 10/30 08:53
8F:→ eddie55020: 对了这堂课是用Python140.117.181.107 10/30 08:55
9F:→ bcew: nand2tetris的compiler部分可练习,不难也 223.139.157.73 10/30 12:29
10F:推 james732: 我在天珑买过简体书,实作C subset的co 223.136.27.207 10/30 15:19
11F:→ james732: mpiler 223.136.27.207 10/30 15:19
12F:→ Epoch0404: 回alan大 学校是有开不过是大三的课 然140.113.121.228 10/30 16:16
13F:→ Epoch0404: 然後卡我现在的必修140.113.121.228 10/30 16:16
14F:推 Neisseria: 先写四则运算直译器看看,有感觉後 118.161.40.212 10/30 18:39
15F:→ Neisseria: 再慢慢加入其他功能,比较会有具体感觉 118.161.40.212 10/30 18:40
16F:→ Neisseria: 可以参考 bc(1) 的语法去写 118.161.40.212 10/30 18:40
17F:→ alan23273850: 那我觉得可以先跟学长姐打听一下贵 123.193.38.80 10/30 19:51
18F:→ alan23273850: 校的compiler教得好不好,如果教得 123.193.38.80 10/30 19:51
19F:→ alan23273850: 特好,那到大三再学就可以了,一个 123.193.38.80 10/30 19:51
20F:→ alan23273850: 教得好的老师其实不需要让同学预习 123.193.38.80 10/30 19:52
21F:→ alan23273850: 的,到时候你会觉得花那麽多时间自 123.193.38.80 10/30 19:52
22F:→ alan23273850: 学CP值特低,因为老师一点就通;如 123.193.38.80 10/30 19:52
23F:→ alan23273850: 果教得很烂,那就赶快趁现在自修, 123.193.38.80 10/30 19:52
24F:→ alan23273850: 然後到时候修课去电其他人,因为反 123.193.38.80 10/30 19:52
25F:→ alan23273850: 正老师教了也是听不懂。 123.193.38.80 10/30 19:52
26F:→ alan23273850: 不过我倒是要提醒compiler的内容对 123.193.38.80 10/30 19:53
27F:→ alan23273850: 於一个正常学生是前所未有的概念, 123.193.38.80 10/30 19:53
28F:→ alan23273850: 所以并不太适合自修,但可以试试。 123.193.38.80 10/30 19:53
29F:→ alan23273850: 如果想利用时间充实自己,也不一定 123.193.38.80 10/30 19:53
30F:→ alan23273850: 要写compiler阿,练习当个骇客还是 123.193.38.80 10/30 19:53
31F:→ alan23273850: 验证码辨识什麽的都很好。 123.193.38.80 10/30 19:53
32F:→ jimfan: 我用bison、flex写过interpreter都觉得头 14.199.97.157 11/03 13:05
33F:→ jimfan: 疼了,compiler还要输出机器码,应该特级 14.199.97.157 11/03 13:06
34F:→ jimfan: 困难吧 14.199.97.157 11/03 13:06
35F:→ bcew: 不考虑最佳化其实只是做苦工而已啦 223.140.195.48 11/03 16:23
36F:→ bcew: 先写个scanner把文字转token,最简单 223.140.195.48 11/03 16:26
37F:→ bcew: 用递回的方式把所有token串成parse tree 223.140.195.48 11/03 16:28
38F:→ bcew: 最後遍历tree,所有基本sub-tree转组语而已 223.140.195.48 11/03 16:33
39F:→ bcew: 例如c=a+b就是var=exp,这exp又是var+var 223.140.195.48 11/03 16:41
40F:→ bcew: var+var转成mov r1,[a]; mov r2,[b]; add r1 223.140.195.48 11/03 16:44
41F:→ bcew: ,r2; mov [tmp_01], r1; 再来换做c=exp 223.140.195.48 11/03 16:50
42F:→ bcew: mov r1, [tmp_01]; mov [c], r1;这样就做完 223.140.195.48 11/03 16:52
43F:→ bcew: 机械码和组语是一对一也很好做的 223.140.195.48 11/03 16:55
44F:推 lc85301: 推nand2tetris ,手爆就能写完 182.158.95.66 11/05 22:41
45F:→ fayhong: 最近看到一个语言:Pyret,跑在 node.js111.241.215.194 11/08 09:21
46F:→ fayhong: 换句话说,是一个可以 compile 成 js 的111.241.215.194 11/08 09:21
47F:→ fayhong: 语言,你可以把他们的 source 抓回来研究111.241.215.194 11/08 09:21
48F:推 fayhong: 换个角度想,你要不要先学着写直译器?111.241.215.165 11/13 10:57
49F:→ fayhong: interpreter,设计一个简单点的语言来做111.241.215.165 11/13 10:57
50F:推 NoyVaughty: 113杨武开的编译器风评不错 140.113.69.32 11/17 19:08
51F:推 hijkxyzuw: scheme 和 sicp (X140.116.102.187 02/24 23:48
52F:→ xcycl: 看一下程式语言理论还有程式语意,再从一 92.40.249.78 04/28 19:26
53F:→ xcycl: 个 while 语言了解怎麽拆解问题比较容易 92.40.249.78 04/28 19:26
54F:推 xcycl: AST 的分析包括 tokenizer 用现代的函数式 92.40.249.78 04/28 19:28
55F:→ xcycl: 编程,通常在一两百行的程式码就可以完结。 92.40.249.78 04/28 19:28
56F:→ xcycl: 用 yacc& lex 实作浪费生命... 92.40.249.78 04/28 19:28
58F:→ xcycl: e_imperative_language 92.40.249.78 04/28 19:35