作者brianhsu (坟墓)
看板Programming
标题[心得] 自学组合语言的必备良方!
时间Sun Feb 7 11:27:44 2010
话说其实从大学起就一直都很想学组合语言,但一直都没能够成功的进入组语
的学习领域。
後来陆陆续续接触了一些其他的程式语言,玩到 Functional Programming 之
後,也渐渐地把学组合语言这件事给抛到脑後了,毕竟光是玩 Functional
Programming 就已经玩不玩了说。
只是後来又不小心进到了需要惯 C 的工作领域,重新在 Linux Kerenel 下面
打转,於是学组语这个念头又回来了--毕竟,这是可是基础中的基础啊,而
且追 Kernel 常常追到最後都是组语。
但问题是组语要怎麽学呢?我想这一定也有很多想学组语,但和我一样不得其
门而入的朋友有相同的困扰。
以我自己而言,我有莫名其妙、不知道为何会出现的,从 80386 时代遗留下
来的组语书籍(还用 PE2 咧),有自己去书局买的 NASM 的书,也有资工系
开的组合语言课程的课本,甚至是网路上开放下载的教学书籍。
可是以上没有任何一本书真正让我进入组语的世界,理由很简单--这些书我
怎麽看都觉得不对劲,不知道该如何写出我的第一只组语程式。
有的一开始就和你讲什麽 MOVL 是干嘛用的,ADD 又是啥,但却又没有一只完
整的程式可以执行试验--这样根本就没感觉啊!根本就不能从错误之中学习
啊(例如随便乱加两个暂存器会怎样)!
有的嘛,遵照古老的传统,一开始就写一个 Hello World 给你,然後再告诉
你不要管那些 include 的黑魔法,反正程式可以跑就好--等一下,我学组
语就是为了要了解最底层的运作,结果你叫我不要管他?
总而言之,看这些书的挫败感真的很大,也因为如此,我一直没有真正下定决
心好好把组合语言给学起来。
一直到前一阵子,我在 Hacking Thursday [1] 的讨论区上看到这一本超级棒
的书籍--Programming from the Ground Up [2],这真的是自学组合语言的
好物啊!
[1] Hacking Thursday
http://hack.ingday.org/
[2] Programming from the Ground Up
http://ftp.twaren.net/Unix/NonGNU/pgubook/
废话不多说,我们来看书中第一个程式范例:
======================================================================
.section .data
.section .text
.global _start
_start:
movl $1, %eax # This is the linux kernel system call for exit
movl $0, %ebx # This is the status number return to OS
int $0x80 # This wake up the kernel to run exit system call
======================================================================
三行程式,而且每一行书里面都解释的很清楚(是的,包括 System Call 的
部份也有说明,虽然经过简化与譬喻),没有任何的黑魔法。
同时,你也可以乱改这个程式,例如试着改变 EBX 暂存器的值,让他返回不
同的值给 Shell,又或者乱改 EAX 里面的值,然後让他产生 Segmentation
Falut 而当掉。
真是太神奇有趣了!这才叫学组语嘛。
我真的很佩服作者可以想出把程式的结束状态代码当成输出这个点子,完全避
开了其他书里面为了要产生输出而不得不先使用黑魔法的问题。
再举另一个例子,他的第二只程式是介绍控制流程和回圈,要透过他介绍的各
种跳跃指令找到一个数列里的最大值,这只程式如下:
======================================================================
.section .data
items:
.long 3, 6, 7, 10, 22, 34, 12, 0
.section .text
.global _start
_start:
movl $0, %edi # move 0 to index register
movl items(,%edi,4), %eax # load the first number
movl %eax, %ebx # put it to the EBX (cureent biggest)
start_loop:
cmpl $0, %eax # check to see if we've hit the end
je loop_exit
incl %edi # increment index by 1
movl items(,%edi,4), %eax # load next number
cmpl %ebx, %eax # compare with current biggest
jle start_loop # jump to start_loop if not bigger
movl %eax, %ebx # else move this value as the largest
jmp start_loop # next turn
loop_exit:
movl $1, %eax # System Call exit (No. 1)
int $0x80 # Singal batman
======================================================================
同样的,这只程式也是利用离开状态做输出--所以你用到的,都是你学过的
东西,没有黑魔法,每一行每一行都可以解释到底是在做什麽,让你验证你是
不是真的了解他。
另外,他用的是 GNU as 的语法,这对我而言有以下几个好处:
- 这是 Linux Kernel 里面用的东西,我不用再去熟悉其他语法
- 我只要有一台 Linux Box 就可以试着跑书里的程式
- 这意谓着你可以用 GCC 把 C 语言编译到组合语言,然後和这本书里面
的范例做比对,例如讲到 Function 的时候,你就可以写几个 C 语言
的函数来验证书里讲的东西。
所以我一定要大推这一本书的啊~~这本书真的是自学组语的必备良方,只要
会一点程式设计,一定可以看得懂的好东西!
--
~
白马带着她一步步地回到中原。白马已经老了,只能慢慢地走,
'v'
Brian Hsu 但终是能回到中原的。江南有杨柳、桃花,有燕子、金鱼……
// \\
( 坟 墓 )
/( )\
但这个美丽的姑娘就像古高昌国人那样固执。 【白马啸西风】
^`~'^
http://bone.twbbs.org.tw/blog 『那都是很好很好的,可我偏不喜欢。』
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.32.42.74
1F:→ aleelyle:= = x86的指令初学者不易学阿 59.105.46.29 02/07 13:33
2F:推 akasan:先推一个,也立志学组语超久了,结果到现在118.168.190.172 02/07 14:27
3F:→ akasan:只学会arm跟nds32的...118.168.190.172 02/07 14:27
4F:→ akasan:x86的就是一直没找机会补起来XD...118.168.190.172 02/07 14:28
5F:推 Tankan:你这个不是x86的组语指令? 看起来怪怪的 61.64.195.232 02/07 20:19
6F:→ brianhsu:是 AT&T 的语法,是 Linux 下比较常用的 114.32.42.74 02/07 21:34
7F:推 ogamenewbie:推一个, 另外也有ASM版欧 (不过我没看 218.160.33.60 02/07 21:38