Linux汇编语法简介(GNU GAS)
 
 
声明:本教程不是介绍汇编语言和CPU指令的书籍,只是对gas的用法做一简单介绍。市面上所有讲汇编的书都是在微软的环境下,使用的是Intel的语法格式,因此,本教程的目的是想给在Linux下学习汇编的初级用户提供一些帮助。(详细请参阅 GNU GAS 手册)
本人也是初学者,在以后的不断学习中,此教程也会慢慢修改,使得更加完善,希望阅读者给予宝贵意见。谢谢!
一、 通用语法
指令格式: 操作码 源操作数, 目的操作数(在有两个操作数的情况下)。
常量表示: 在常量前加上$,例:$1
$的另一种用法:用于符号时,表示的是一个首地址。 
例:
string:
.ascii "hello world\n\0"
movl $string, %eax # 首地址复制到eax
寄存器表示: 在寄存器名前加上%,例:%eax
对不同长度的操作数操作:分别在指令后加上b、w、l,表示字节(8位)、字(16位)、双字(32位)。
例:movb $1, %al, movw $1, %ax, movl $1, %eax (注:一般情况下,都是32位操作)。
不同进制数的表示: 
十六进制以0x开头,例:$0xffff
十进制没有符号,例:$1
八进制以0开头,例:$0777
二进制以0b开头,例:$0b1111
注释:
#号开头用于单行
/* 
…………
…………
…………
*/
用于多行。
每条汇编语句以换行和回车这两个字符为结束。(注意:当写完程序的最后一条语句,不要忘记按enter键,否则编译时会提示最后一条语句的出错)
二、 寻址
通用内存寻址:地址或偏移量(%首地址或偏移量, %索引, 字节数),其中所有的参量都是可选的。
以下的几种寻址是通用方式的变形:
直接寻址:movl 0xff11, %eax
索引寻址:movl string(, %ecx, 1), %eax # string是事先已定义过的标签,代表一个首地址。整个意思是读取一组数据的某一个,长度为一个字节,复制到eax。(相当于数组)适用于数据段寻址。
间接寻址:movl (%eax), %ebx # 把eax所指向的值复制到ebx(相当于指针操作)
基址寻址:movl 4(%ebp), %ebx # 把ebp的地址偏移4个字节所取得的值复制到ebx(通过基址指针加偏移量来寻找数据)。适用于堆栈寻址。
立即数寻址:movl $1, %eax # 把一个常量直接复制到寄存器
三、 常用伪指令
段表示:
.data 数据段
.bss(block started by symbol) 符号开始段
.text 代码段
基本数据类型(可以用逗号分割多个表达式或字符串):
.byte 表达式:8位(0 - 255)例:.byte 100, 200, 300
.int 表达式:16位(0 - 65535) 例:.int 1000
.long 表达式:32位(0 - 4294967295) 例:.long 100000
.ascii "字符串":以'\0'为结束符,例:.ascii "hello\0"
.global(或.globl) 符号:定义全局符号,例:.global _start,这是每个Linux下的汇编程序代码段的第一个定义,它指定了整个程序与运行环境交互的入口(相当于C中的main函数)。
.equ 符号, 表达式:等价替换(可用于局部变量的定义)。例:.equ LINUX_SYSCALL 0x80
.lcomm 符号, 字节数:在.bss段中声明未初始化变量的内存空间(适用于全局和静态变量的声明)。
例:
.bss
.lcomm buffer, 256
函数表示:
.type 符号, @function
例:
.type func, @function
func:
...
.include 文件:外部文件的调用 例:.include "outside.s"
四、 程序基本结构
.data
...
.bss
...
.text
.global _start
_start:
...
五、 系统调用
Linux的系统调用的中断号是0x80,参数的传递要通过通用寄存器来完成。这里对寄存器的使用有一些约定:eax存放系统调用的编号,参数依次放入ebx,ecx,edx,esi,edi,最后用int $0x80指令完成调用。
例:程序结束后的正常退出
movl $1, %eax
movl $0, %ebx
int 0x80
这相当于在C中执行了exit(0)。
六、 程序的编译
汇编器命令:as
参数:
--gstabs:产生符号表,用于调试
-o:自定义输出的文件名,由于通过汇编器产生的是目标文件,因此,必须是后缀名为.o的文件
--help:帮助
例:as --gstabs test.s -o test.o
连接器命令:ld,只有通过连接器才能完成最后的可执行文件。
参数:
-o:自定义输出文件名,文件没有后缀名
--help:帮助
例:ld test.o -o test
05-26 01:06