续:将基于Nasm汇编的打字小游戏,移植到DOSBox
前情提要
在上一篇文章中我对这个小程序进行了介绍,但由于运行环境的安装比较复杂,估计没有谁会将我的代码跑起来,可那样实在是太遗憾了。学习过汇编语言的你大概率是使用过DOSBox的,为此我献祭了2小时的宝贵生命,成功地将代码在DOS上跑起来了。
如果对具体移植过程不感兴趣,可以直接跳到运行体验部分。
细说
上文的虚拟机环境和DOSBox都支持8086汇编,就换个地方运行能遇到什么麻烦?麻烦就是多了DOS操作系统的存在,现在我不需要自己编程从磁盘加载用户程序的引导程序了,这个事情换由DOS操作系统来做,可是我不太明白DOS需要我提供什么。
1 编译
首先我尝试着将曾经编译的typing.bin
直接在DOSBox中运行,期待它能识别出我代码里的头部信息,正常地加载我的代码并将cpu的控制权交出来。然而它并不认.bin
后缀的程序:Illegal command: typing.bin
。于是我搜索到了一篇博客,并欣喜地发现它的代码是可以正常运行的。
原来是需要编译成.com
文件
> nasm -f bin typing.asm -o typing.com # 在本机命令行窗口中
> typing.com # 在DOSBox中
2 程序入口
DOS系统如何知道我的程序从哪里开始执行呢?毕竟我源代码中起始是一个头部段而不是代码段。答案是它什么也不知道,只会从源代码的第一行开始执行,所以我在源码的开头添加了一条跳转指令:
org 0x0100 ;DOS系统会创建一个PSP数据区
jmp section.code.start
那org 0x0100
是什么?可以参考下面另一个博主的文章。它是在编译阶段发挥作用的伪指令,简单点说就是让标号能够获取到正确的偏移地址。引用标号时本来是获取标号所在处的汇编地址(与程序开头的相对地址),程序第一条指令的汇编地址是0,但被DOS加载后程序第一条指令的偏移地址就变成了0x0100
,因为前面256个字节被PSP占据。而org 0x0100
会让你在引用标号时自动加上0x0100
。
此时逻辑地址cs:0000
指向的是PSP,cs:0100
指向的才是程序第一条指令。不过org 0x0100
是为后面定位代码段和数据段服务的,写与不写都对依据位移的jmp
指令没有影响。
下面这张图可能更加直观一点:
3 定位段
3.1 定位数据段
这件事情在Nasm中要比Masm麻烦,因为Masm可以直接获取一个段的段地址,而Nasm中的section.段名.start
只能获取到段的汇编地址。我想让数据段寄存器ds指向数据段,还需要将获取的汇编地址除以4,才得到段地址。这里的除操作可以使用右移位指令shr
替代。
;1 将ds指向数据段;
mov ax, section.data.start
shr ax, 4
mov bx, cs
add ax, bx
mov ds, ax
3.2 定位代码段
因为在程序开头使用了jmp指令,即便不将cs定位到代码段,大部分代码也可以正常执行,除了键盘中断例程。中断例程的代码逻辑当然没有什么问题,毕竟之前都能正常运行,只是中断向量表的填写出问题了,问题代码片段如下:
cli
mov word [9*4], int9_new
mov word [9*4+2], cs
sti
回想一下,标号int9_new
是个代码段的段内偏移地址,可cs指向的都不是代码段,这能从中断向量表找到中断例程才怪。定位代码段的操作与前面定位数据段类似,但必须同时更改cs和ip寄存器,因为cs:ip
永远指向运行的下一条指令的地址。
;2 将cs指向代码段, 并将ip指向程序的正式开始:start标号
mov ax, section.code.start
shr ax, 4
mov bx, cs
add ax, bx
mov free[2], ax
mov word free[0], start
jmp far [free]
运行体验
我在代码仓库的dos文件夹中,已经提供了编译好的程序typing.com
,如果你已经安装了DOSBox的话,那么可以直接运行它了!