转自:http://www.cnblogs.com/leo0000/p/5632642.html

声明:以下的代码成果,是参考了网上的injso技术,在本文的最后会给出地址,同时非常感谢injso技术原作者的分享。

   但是injso文章中的代码存在一些问题,所以后面出现的代码是经过作者修改和检测的。也正因为这些错误,加深了我的学习深度。

  最近因为在学习一些调试的技术,但是很少有提到如何在函数运行时实现函数替换的。

  为什么会想到这一点?因为在学习调试时,难免会看到一些内核方面的调试技术,内核中的调试有一个kprobe,很强大,可以实现运行时的函数替换。其原理就是hook,钩子,但是学习了这个kprobe之后会发现,kprobe内部有检测所要钩的函数是不是属于内核空间,必须是内核函数才能实现替换。而实际上,我的工作大部分还是在应用层的,所以想要实现应用程序的热补丁技术。

  一些基础的知识这边的就不展开了,需要的基础有,elf文件格式,ptrace,waitpid,应用程序间通信时的信号,汇编。

  • 1、elf文件加载过程

  elf简单地说是由以下四部分组成的,elf文件头,program header和section header,内容。其中program header是运行时使用的,而section header并不会被加载进程序运行空间,但他们可以在编译时被指定该段的加载地址等信息,当然一般这个链接脚本.lds是由gcc默认的。

  第一步,加载elf文件头,检验文件类型版本等,重要的是找到program header的地址和header的个数,如果连接器脚本是默认的,那么elf文件头会被加载在0x804800地址处。

  第二步,加载program header,接着扫描program header,找到一个类型为PT_INTERP的program header,这个header里面放着的是有关解释器的地址,这时候将解释器程序的elf文件头加载进来。一般是这样:

      INTERP 0x000134 0x08048134 0x08048134 0x00013 0x00013 R 0x1
        [Requesting program interpreter: /lib/ld-linux.so.2]

  第三步,扫描program header,如果类型为PT_LOAD,则将该段加载进来。

  第四步,判断是否需要解释器程序,如果需要,把解释器程序加载进来,并把程序入口设置为解释器程序的地址。否则是应用程序本身的入口。反汇编为_start标号。

  第五步,设置命令行传入的参数等应用程序需要的信息。

  第六步,解释器程序开始运行,加载程序需要的库,填写重定向符号表中的地址信息。

  • 2.elf文件动态链接过程

  上一步,解释器程序根据program header已经将应用程序的段都加载进内存了,接下来再扫描program header,找到类型为PT_DYNAMIC,这里面包含了很多由section header描述的内容,包括重定向表,符号表,字符串表等等。解释器需要这个段描述的一些信息。

  DT_NEEDED描述了所需要的动态库名称,DT_REL描述了重定位表地址,DT_JMPREL描述了重定位表地址(这个表是懒惰链接使用的),DT_PLTGOT全局偏移表地址。

  此时解释器程序就可以根据所需要的动态库,将其加载进内存。每一个被加载进来的库的相关信息会被记录在link_map结构中,这个结构是一个链表,保存了所有的动态信息。

  其中,全局偏移表got,got[0]保存了PT_DYNAMIC的起始地址,got[1]保存link_map的地址,而link_map中就可以找到PT_DYNAMIC的起始地址,和下一个或者上一个共享文件或者可执行文件的link_map地址。

  DT_REL这个重定向表中的符号必须在此时就被解析完成。

  而DT_JMPREL这个重定向表中的符号可以在运行时再解析。

  所有的库和符号全部解析完成之后,解释器程序就会把控制权交给可执行文件的_start。程序开始执行。

  • 3.替换函数和被替换函数

  被替换程序源码。 

1
2
3
4
5
6
7
8
9
#include <stdio.h>
#include <time.h>
int main()
{
        while(1){
                sleep(10);
                printf("%d : original\n",time(0));
        }
}

  替换新库代码。

1
2
3
4
5
6
7
#include <stdio.h>
 
int newmyprint()
{
    write(1,"hahahahahahaha",14);
    return 0;
}

  够简单明了吧,如果替换成功,目标程序将会一直输出“哈哈哈哈哈哈”。

  • 4.功能函数  

  ptrace相关代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
/* 读进程寄存器 */
void ptrace_readreg(int pid, struct user_regs_struct *regs)
{
    if(ptrace(PTRACE_GETREGS, pid, NULL, regs))
        printf("*** ptrace_readreg error ***\n");
    /*printf("ptrace_readreg\n");
    printf("%x\n",regs->ebx);
    printf("%x\n",regs->ecx);
    printf("%x\n",regs->edx);
    printf("%x\n",regs->esi);
    printf("%x\n",regs->edi);
    printf("%x\n",regs->ebp);
    printf("%x\n",regs->eax);
    printf("%x\n",regs->xds);
    printf("%x\n",regs->xes);
    printf("%x\n",regs->xfs);
    printf("%x\n",regs->xgs);
    printf("%x\n",regs->orig_eax);
    printf("%x\n",regs->eip);
    printf("%x\n",regs->xcs);
    printf("%x\n",regs->eflags);
    printf("%x\n",regs->esp);
    printf("%x\n",regs->xss);*/
 
}
 
/* 写进程寄存器 */
void ptrace_writereg(int pid, struct user_regs_struct *regs)
{
    /*printf("ptrace_writereg\n");
    printf("%x\n",regs->ebx);
    printf("%x\n",regs->ecx);
    printf("%x\n",regs->edx);
    printf("%x\n",regs->esi);
    printf("%x\n",regs->edi);
    printf("%x\n",regs->ebp);
    printf("%x\n",regs->eax);
    printf("%x\n",regs->xds);
    printf("%x\n",regs->xes);
    printf("%x\n",regs->xfs);
    printf("%x\n",regs->xgs);
    printf("%x\n",regs->orig_eax);
    printf("%x\n",regs->eip);
    printf("%x\n",regs->xcs);
    printf("%x\n",regs->eflags);
    printf("%x\n",regs->esp);
    printf("%x\n",regs->xss);*/
 
    if(ptrace(PTRACE_SETREGS, pid, NULL, regs))
        printf("*** ptrace_writereg error ***\n");
}
 
/* 关联到进程 */
void ptrace_attach(int pid)
{
    if(ptrace(PTRACE_ATTACH, pid, NULL, NULL) < 0) {
        perror("ptrace_attach");
        exit(-1);
    }
 
    waitpid(pid, NULL, /*WUNTRACED*/0);  
    
    ptrace_readreg(pid, &oldregs);
}
 
/* 进程继续 */
void ptrace_cont(int pid)
{
    int stat;
 
    if(ptrace(PTRACE_CONT, pid, NULL, NULL) < 0) {
        perror("ptrace_cont");
        exit(-1);
    }
    /*while(!WIFSTOPPED(stat))
        waitpid(pid, &stat, WNOHANG);*/
}
 
/* 脱离进程 */
void ptrace_detach(int pid)
{
    ptrace_writereg(pid, &oldregs);
 
    if(ptrace(PTRACE_DETACH, pid, NULL, NULL) < 0) {
        perror("ptrace_detach");
        exit(-1);
    }
}
 
/* 写指定进程地址 */
void ptrace_write(int pid, unsigned long addr, void *vptr, int len)
{
    int count;
    long word;
 
    count = 0;
 
    while(count < len) {
        memcpy(&word, vptr + count, sizeof(word));
        word = ptrace(PTRACE_POKETEXT, pid, addr + count, word);
        count += 4;
 
        if(errno != 0)
            printf("ptrace_write failed\t %ld\n", addr + count);
    }
}
 
/* 读指定进程 */
int ptrace_read(int pid, unsigned long addr, void *vptr, int len)
{
    int i,count;
    long word;
    unsigned long *ptr = (unsigned long *)vptr;
 
    i = count = 0;
    //printf("ptrace_read addr = %x\n",addr);
    while (count < len) {
        //printf("ptrace_read addr+count = %x\n",addr + count);
        word = ptrace(PTRACE_PEEKTEXT, pid, addr + count, NULL);
        while(word < 0)
        {
            if(errno == 0)
                break;
            //printf("ptrace_read word = %x\n",word);
            perror("ptrace_read failed");
            return 2;
        }
        count += 4;
        ptr[i++] = word;
    }
    return 0;
}
 
/*
 在进程指定地址读一个字符串
 */
char * ptrace_readstr(int pid, unsigned long addr)
{
    char *str = (char *) malloc(64);
    int i,count;
    long word;
    char *pa;
 
    i = count = 0;
    pa = (char *)&word;
 
    while(i <= 60) {
        word = ptrace(PTRACE_PEEKTEXT, pid, addr + count, NULL);
        count += 4;
 
        if (pa[0] == 0) {
            str[i] = 0;
        break;
        }
        else
            str[i++] = pa[0];
 
        if (pa[1] == 0) {
            str[i] = 0;
            break;
        }
        else
            str[i++] = pa[1];
 
        if (pa[2] ==0) {
            str[i] = 0;
            break;
        }
        else
            str[i++] = pa[2];
 
        if (pa[3] ==0) {
            str[i] = 0;
            break;
        }
        else
            str[i++] = pa[3];
    }
    
    return str;
}
 
 
 
 
/*
 将指定数据压入进程堆栈并返回堆栈指针
 */
void * ptrace_push(int pid, void *paddr, int size)
{
    unsigned long esp;
    struct user_regs_struct regs;
 
    ptrace_readreg(pid, &regs);
    esp = regs.esp;
    esp -= size;
    esp = esp - esp % 4;
    regs.esp = esp;
 
    ptrace_writereg(pid, &regs);
 
    ptrace_write(pid, esp, paddr, size);
 
    return (void *)esp;
}
 
/*
 在进程内调用指定地址的函数
 */
void ptrace_call(int pid, unsigned long addr)
{
    void *pc;
    struct user_regs_struct regs;
    int stat;
    void *pra;
 
    pc = (void *) 0x41414140;
    pra = ptrace_push(pid, &pc, sizeof(pc));
 
    ptrace_readreg(pid, &regs);
    regs.eip = addr;
    ptrace_writereg(pid, &regs);
 
    ptrace_cont(pid);
    //while(WIFSIGNALED(stat))
       // waitpid(pid, &stat, WNOHANG);
}

  这里面的东西我就不展开了,对ptrace的学习,请自行man。

  

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
/*
因为应用程序可能不存在hash表,所以通过读取源文件的section header获取符号表的入口数,
其实是被误导了,但也学习了hash表的作用,用来快速查找符号表中的信息和字符串表中的信息
*/
/*int getnchains(int pid,unsigned long base_addr)
{
    printf("getnchains enter \n");
    Elf32_Ehdr *ehdr = (Elf32_Ehdr *) malloc(sizeof(Elf32_Ehdr));      
    Elf32_Shdr *shdr = (Elf32_Shdr *)malloc(sizeof(Elf32_Shdr));
    unsigned long shdr_addr;
    int i = 0;
    int fd;
    char filename[1024] = {0};
    ptrace_read(pid, base_addr, ehdr, sizeof(Elf32_Ehdr));
    shdr_addr = base_addr + ehdr->e_shoff;
    //printf("getnchains ehdr->e_shoff\t %p\n", ehdr->e_shoff);
     
    snprintf(filename, sizeof(filename), "/proc/%d/exe", pid);
    fd = open(filename, O_RDONLY);
    if (lseek(fd, ehdr->e_shoff, SEEK_SET) < 0)
        exit(-1);
     
    /*while(i<ehdr->e_shnum)
    {
        read(fd, shdr, ehdr->e_shentsize);
        printf("getnchains i = %d\n",i);
        printf("getnchains shdr->sh_type = %x\n",shdr->sh_type);
        printf("getnchains shdr->sh_name = %x\n",shdr->sh_name);
        printf("getnchains shdr->sh_size = %x\n",shdr->sh_size);
        printf("getnchains shdr->sh_entsize = %x\n",shdr->sh_entsize);
        i++;
    }
     
    while(shdr->sh_type != SHT_SYMTAB)
        read(fd, shdr, ehdr->e_shentsize);
    nchains = shdr->sh_size/shdr->sh_entsize;
    //printf("getnchains shdr->sh_type = %d\n",shdr->sh_type);
    //printf("getnchains shdr->sh_name = %d\n",shdr->sh_name);
    //printf("getnchains shdr->sh_size = %d\n",shdr->sh_size);
    //printf("getnchains shdr->sh_entsize = %d\n",shdr->sh_entsize);
    //printf("getnchains nchains = %x\n",nchains); 
    close(fd);
    free(ehdr);
    free(shdr);
    printf("getnchains exit \n");
}
*/
 
 
/*
 取得指向link_map链表首项的指针
 */
struct link_map * get_linkmap(int pid)
{
    Elf32_Ehdr *ehdr = (Elf32_Ehdr *) malloc(sizeof(Elf32_Ehdr));      
    Elf32_Phdr *phdr = (Elf32_Phdr *) malloc(sizeof(Elf32_Phdr));
    Elf32_Dyn  *dyn =  (Elf32_Dyn *) malloc(sizeof(Elf32_Dyn));
    Elf32_Word got;
    struct link_map *map = (struct link_map *)malloc(sizeof(struct link_map));
    int i = 1;
    unsigned long tmpaddr;
 
    ptrace_read(pid, IMAGE_ADDR, ehdr, sizeof(Elf32_Ehdr));
    phdr_addr = IMAGE_ADDR + ehdr->e_phoff;
    printf("phdr_addr\t %p\n", phdr_addr);
 
    ptrace_read(pid, phdr_addr, phdr, sizeof(Elf32_Phdr));
    while(phdr->p_type != PT_DYNAMIC)
        ptrace_read(pid, phdr_addr += sizeof(Elf32_Phdr), phdr,sizeof(Elf32_Phdr));
    dyn_addr = phdr->p_vaddr;
    printf("dyn_addr\t %p\n", dyn_addr);
 
    ptrace_read(pid, dyn_addr, dyn, sizeof(Elf32_Dyn));
    while(dyn->d_tag != DT_PLTGOT) {
        tmpaddr = dyn_addr + i * sizeof(Elf32_Dyn);
        //printf("get_linkmap tmpaddr = %x\n",tmpaddr);
        ptrace_read(pid,tmpaddr, dyn, sizeof(Elf32_Dyn));
        i++;
    }
 
    got = (Elf32_Word)dyn->d_un.d_ptr;
    got += 4;
    //printf("GOT\t\t %p\n", got);
 
    ptrace_read(pid, got, &map_addr, 4);
    printf("map_addr\t %p\n", map_addr);
    map = map_addr;
    //ptrace_read(pid, map_addr, map, sizeof(struct link_map));
    
    free(ehdr);
    free(phdr);
    free(dyn);
 
    return map;
}
 
/*
 取得给定link_map指向的SYMTAB、STRTAB、HASH、JMPREL、PLTRELSZ、RELAENT、RELENT信息
 这些地址信息将被保存到全局变量中,以方便使用
 */
void get_sym_info(int pid, struct link_map *lm)
{
    Elf32_Dyn *dyn = (Elf32_Dyn *) malloc(sizeof(Elf32_Dyn));
    unsigned long dyn_addr;
    //printf("get_sym_info lm = %x\n",lm);
    //printf("get_sym_info lm->l_ld's offset = %x\n",&((struct link_map *)0)->l_ld);
    //printf("get_sym_info &lm->l_ld = %x\n",&(lm->l_ld));
    //dyn_addr = (unsigned long)&(lm->l_ld);
    //进入被跟踪进程获取动态节的地址  
    ptrace_read(pid,&(lm->l_ld) , &dyn_addr, sizeof(dyn_addr));
    ptrace_read(pid,&(lm->l_addr) , &link_addr, sizeof(dyn_addr));
    ptrace_read(pid, dyn_addr, dyn, sizeof(Elf32_Dyn));
    //if(link_addr == 0)
    //  getnchains(pid,IMAGE_ADDR);
    /*else
        getnchains(pid,link_addr);*/
    while(dyn->d_tag != DT_NULL){
        //printf("get_sym_info dyn->d_tag = %x\n",dyn->d_tag);
        //printf("get_sym_info dyn->d_un.d_ptr = %x\n",dyn->d_un.d_ptr);
        switch(dyn->d_tag)
        {
        case DT_SYMTAB:
            symtab = dyn->d_un.d_ptr;
             
            break;
        case DT_STRTAB:
            strtab = dyn->d_un.d_ptr;
            break;
        /*case DT_HASH://可能不存在哈希表,此时nchains是错误的,这个值可以通过符号表得到
            //printf("get_sym_info hash table's addr = %x\n",dyn->d_un.d_ptr);
            //printf("get_sym_info symtbl's entry = %x\n",(dyn->d_un.d_ptr) + 4);
            ptrace_read(pid, (dyn->d_un.d_ptr) + 4,&nchains, sizeof(nchains));
            break;*/
        case DT_JMPREL:
            jmprel = dyn->d_un.d_ptr;
            break;
        case DT_PLTRELSZ:
            totalrelsize = dyn->d_un.d_val;
            break;
        case DT_RELAENT:
            relsize = dyn->d_un.d_val;
            break;
        case DT_RELENT:
            relsize = dyn->d_un.d_val;
            break;
        case DT_REL:
            reldyn = dyn->d_un.d_ptr;       
            break;
        case DT_RELSZ:
            reldynsz = dyn->d_un.d_val;
            break;
        }
        ptrace_read(pid, dyn_addr += sizeof(Elf32_Dyn), dyn, sizeof(Elf32_Dyn));
    }
     
    //printf("get_sym_info link_addr = %x\n",link_addr);
    //printf("get_sym_info symtab = %x\n",symtab);
    //printf("get_sym_info relsize = %x\n",relsize);
    //printf("get_sym_info reldyn = %x\n",reldyn);
    //printf("get_sym_info totalrelsize = %x\n",totalrelsize);
    //printf("get_sym_info jmprel = %x\n",jmprel);
    //printf("get_sym_info nchains = %x\n",nchains);
    //printf("get_sym_info strtab = %x\n",strtab);
 
    nrels = totalrelsize / relsize;
    nreldyns = reldynsz/relsize;
     
    //printf("get_sym_info nreldyns = %d\n",nreldyns);
    //printf("get_sym_info nrels = %d\n",nrels);
 
    free(dyn);
    printf("get_sym_info exit\n");
}
/*
 在指定的link_map指向的符号表查找符号,它仅仅是被上面的find_symbol使用
 */
unsigned long  find_symbol_in_linkmap(int pid, struct link_map *lm, char *sym_name)
{
    Elf32_Sym *sym = (Elf32_Sym *) malloc(sizeof(Elf32_Sym));
    int i = 0;
    char *str;
    unsigned long ret;
    int flags = 0;
 
    get_sym_info(pid, lm);
    
    do{
        if(ptrace_read(pid, symtab + i * sizeof(Elf32_Sym), sym, sizeof(Elf32_Sym)))
            return 0;
        i++;
        //printf("find_symbol_in_linkmap sym->st_name = %x\tsym->st_size = %x\tsym->st_value = %x\n",sym->st_name,sym->st_size,sym->st_value);
        //printf("find_symbol_in_linkmap Elf32_Sym's size = %d\n",sizeof(Elf32_Sym));
        //printf("\nfind_symbol_in_linkmap sym->st_name = %x\n",sym->st_name);       
        if (!sym->st_name && !sym->st_size && !sym->st_value)//全为0是符号表的第一项
            continue;
        //printf("\nfind_symbol_in_linkmap strtab = %x\n",strtab);
        str = (char *) ptrace_readstr(pid, strtab + sym->st_name);
        //printf("\nfind_symbol_in_linkmap str = %s\n",str);
        //printf("\nfind_symbol_in_linkmap sym->st_value = %x\n",sym->st_value);
        if (strcmp(str, sym_name) == 0) {
            printf("\nfind_symbol_in_linkmap str = %s\n",str);
            printf("\nfind_symbol_in_linkmap sym->st_value = %x\n",sym->st_value);
            free(str);
            if(sym->st_value == 0)//值为0代表这个符号本身就是重定向的内容
                continue;
            flags = 1;
             
            //str = ptrace_readstr(pid, (unsigned long)lm->l_name);
            //printf("find_symbol_in_linkmap lib name [%s]\n", str);
            //free(str);
            break;
        }
         
        free(str);
    }while(1);
 
 
    if (flags != 1)
        ret = 0;
    else
        ret =  link_addr + sym->st_value;
 
    free(sym);
 
    return ret;
}
 
/*
 解析指定符号
 */
unsigned long  find_symbol(int pid, struct link_map *map, char *sym_name)
{
    struct link_map *lm = map;
    unsigned long sym_addr;
    char *str;
    unsigned long tmp;
    
    //sym_addr = find_symbol_in_linkmap(pid, map, sym_name);
    //return 0;
    //if (sym_addr)
     //   return sym_addr;
    //printf("\nfind_symbol map = %x\n",map);
    //ptrace_read(pid,(char *)map+12,&tmp,4);
    //lm = tmp;
    //printf("find_symbol lm = %x\n",lm);
    //ptrace_read(pid, (unsigned long)map->l_next, lm, sizeof(struct link_map));
    sym_addr = find_symbol_in_linkmap(pid, lm, sym_name);
    while(!sym_addr ) {
        ptrace_read(pid, (char *)lm+12, &tmp, 4);//获取下一个库的link_map地址
        if(tmp == 0)
            return 0;
        lm = tmp;
        //printf("find_symbol lm = %x\n",lm);
        /*str = ptrace_readstr(pid, (unsigned long)lm->l_name);
        if(str[0] == '/0')
            continue;
        printf("[%s]\n", str);
        free(str);*/
 
        if ((sym_addr = find_symbol_in_linkmap(pid, lm, sym_name)))
            break;
    }
 
    return sym_addr;
}
 
 
/* 查找符号的重定位地址 */
unsigned long  find_sym_in_rel(int pid, char *sym_name)
{
    Elf32_Rel *rel = (Elf32_Rel *) malloc(sizeof(Elf32_Rel));
    Elf32_Sym *sym = (Elf32_Sym *) malloc(sizeof(Elf32_Sym));
    int i;
    char *str;
    unsigned long ret;
    struct link_map *lm;
    lm = map_addr;
     
    //get_dyn_info(pid);
    do{
        get_sym_info(pid,lm);
        ptrace_read(pid, (char *)lm+12, &lm, 4);
        //首先查找过程连接的重定位表
        for(i = 0; i< nrels ;i++) {
            ptrace_read(pid, (unsigned long)(jmprel + i * sizeof(Elf32_Rel)),
                                                                     rel, sizeof(Elf32_Rel));
            if(ELF32_R_SYM(rel->r_info)) {
                ptrace_read(pid, symtab + ELF32_R_SYM(rel->r_info) *
                                                   sizeof(Elf32_Sym), sym, sizeof(Elf32_Sym));
                str = ptrace_readstr(pid, strtab + sym->st_name);
                if (strcmp(str, sym_name) == 0) {
                    if(sym->st_value != 0){
                        free(str);
                        continue;
                    }
                    modifyflag = 1;
                    free(str);
                    break;
                }
                free(str);
            }
        }
         
        if(modifyflag == 1)
            break;
        //没找到的话,再找在链接时就重定位的重定位表
        for(i = 0; i< nreldyns;i++) {
            ptrace_read(pid, (unsigned long)(reldyn+ i * sizeof(Elf32_Rel)),
                                                                     rel, sizeof(Elf32_Rel));
            if(ELF32_R_SYM(rel->r_info)) {
                ptrace_read(pid, symtab + ELF32_R_SYM(rel->r_info) *
                                                   sizeof(Elf32_Sym), sym, sizeof(Elf32_Sym));
                str = ptrace_readstr(pid, strtab + sym->st_name);
                if (strcmp(str, sym_name) == 0) {
                    if(sym->st_value != 0){
                        free(str);
                        continue;
                    }
                    modifyflag = 2;
                    free(str);
                    break;
                }
                free(str);
            }
        }
         
        if(modifyflag == 2)
            break;
         
    }while(lm);
    //printf("find_sym_in_rel flags = %d\n",flags);
    if (modifyflag == 0)
        ret = 0;
    else
        ret =  link_addr + rel->r_offset;
    //printf("find_sym_in_rel link_addr = %x\t sym->st_value = %x\n",link_addr , sym->st_value);
    free(rel);
    free(sym);
 
    return ret;
}
 
/*
 在进程自身的映象中(即不包括动态共享库,无须遍历link_map链表)获得各种动态信息
 */
/*void get_dyn_info(int pid)
{
    Elf32_Dyn *dyn = (Elf32_Dyn *) malloc(sizeof(Elf32_Dyn));
    int i = 0;
 
    ptrace_read(pid, dyn_addr + i * sizeof(Elf32_Dyn), dyn, sizeof(Elf32_Dyn));
    i++;
    while(dyn->d_tag){
        switch(dyn->d_tag)
        {
        case DT_SYMTAB:
            //puts("DT_SYMTAB");
            symtab = dyn->d_un.d_ptr;
            break;
        case DT_STRTAB:
            strtab = dyn->d_un.d_ptr;
            //puts("DT_STRTAB");
            break;
        case DT_JMPREL:
            jmprel = dyn->d_un.d_ptr;
            //puts("DT_JMPREL");
            //printf("jmprel\t %p\n", jmprel);
            break;
        case DT_PLTRELSZ:
            totalrelsize = dyn->d_un.d_val;
            //puts("DT_PLTRELSZ");
            break;
        case DT_RELAENT:
            relsize = dyn->d_un.d_val;
            //puts("DT_RELAENT");
            break;
        case DT_RELENT:
            relsize = dyn->d_un.d_val;
            //puts("DT_RELENT");
            break;
        }
 
        ptrace_read(pid, dyn_addr + i * sizeof(Elf32_Dyn), dyn, sizeof(Elf32_Dyn));
        i++;
    }
 
    nrels = totalrelsize / relsize;
 
    free(dyn);
}*/
 
/*void call_dl_open(int pid, unsigned long addr, char *libname)
{
    void *pRLibName;
    struct user_regs_struct regs;
 
    /*
      先找个空间存放要装载的共享库名,我们可以简单的把它放入堆栈
      
    pRLibName = ptrace_push(pid, libname, strlen(libname) + 1);
 
    /* 设置参数到寄存器
    ptrace_readreg(pid, &regs);
    regs.eax = (unsigned long) pRLibName;
    regs.ecx = 0x0;
    regs.edx = RTLD_LAZY;
    ptrace_writereg(pid, &regs);
 
    /* 调用_dl_open
    ptrace_call(pid, addr);
    puts("call _dl_open ok");
}*/
 
 
 
 
/*#define RTLD_LAZY 0x00001
#define RTLD_NOW    0x00002
#define RTLD_BINDING_MASK   0x3
#define RTLD_NOLOAD 0x00004
#define RTLD_DEEPBIND   0x00008
 
#define RTLD_GLOBAL 0x00100
 
#define RTLD_LOCAL  0
 
#define RTLD_NODELETE   0x01000 */
 
void call__libc_dlopen_mode(int pid, unsigned long addr, char *libname)
{
    void *plibnameaddr;
 
    //printf("call__libc_dlopen_mode libname = %s\n",libname);
    //printf("call__libc_dlopen_mode addr = %x\n",addr);
    //将需要加载的共享库地址压栈
    plibnameaddr = ptrace_push(pid, libname, strlen(libname) + 1);
    ptrace_push(pid,&mode,sizeof(int));
    ptrace_push(pid,&plibnameaddr,sizeof(plibnameaddr));
 
    /* 调用__libc_dlopen_mode */
    ptrace_call(pid, addr);
}
void call_printf(int pid, unsigned long addr, char *string)
{
    void *paddr;
 
    paddr = ptrace_push(pid, string, strlen(string) + 1);
    ptrace_push(pid,&paddr,sizeof(paddr));
 
    ptrace_call(pid, addr);
}

  作者所做的修改,读者可以对比文章最后的连接中的代码。

  这边对于程序的具体解释,就不具体展开了。

  需要注意的是,原来是采用_dl_open的方式加载库函数,但是ld库并没有这个符号导出。而libc库中导出了一个可以加载库的__libc_dlopen_mode函数。

  • 5.主函数

  先说一下流程,

  a.获取被跟踪进程的link_map地址

  b.根据link_map给出的信息,搜索符号表,遍历每一个link_map中的符号表,直到找到想要找的符号。这里是printf或者__libc_dlopen_mode函数

  c.将库路径包括库名称传递给调用__libc_dlopen_mode的函数,该函数即call__libc_dlopen_mode会把__libc_dlopen_mode函数需要的参数,路径和加载方式压栈,在让被跟踪进

   程开始运行之前,压入一个非法地址,当__libc_dlopen_mode返回时返回到一个非法地址时,就会发生中断,此时跟踪进程可以waitpid跟踪到。好,设置寄存器,并让被跟踪进程开

   始运行。打开库之后,被跟踪进程因中断而被跟踪进程再次获得控制权。

  d.再一次根据之前保存的link_map信息,当然完全可以直接用上一次搜索结果结束之后的link_map往后找,因为新库一定在最后,但是本文还是从头开始找,找到新库中的

   newmyprint地址。

  e.还是根据link_map信息查找printf的重定向地址,在rel.dyn节中,有关这个rel.dyn和rel.plt等节之间的关系,可以看我的其他博文。

  f.将newmyprint的地址填入printf的重定向地址。

  g.将被跟踪进程原先的寄存器设置回去,释放控制。

  h.被跟踪进程开始输出“哈哈哈哈哈”。

  上源码:

  

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
int main(int argc, char *argv[])
{
    int pid;
    struct link_map *map;
    char sym_name[256];
    unsigned long sym_addr;
    unsigned long new_addr,old_addr,rel_addr;
    int status = 0;
    char libpath[1024];
    char oldfunname[128];
    char newfunname[128];
    //mode = atoi(argv[2]);
    if(argc < 5){
        printf("usage : ./injso pid libpath oldfunname newfunname\n");
        exit(-1);
    }
    /* 从命令行取得目标进程PID*/
    pid = atoi(argv[1]);
     
    /* 从命令行取得新库名称*/
    memset(libpath,0,sizeof(libpath));
    memcpy(libpath,argv[2],strlen(argv[2]));
     
    /* 从命令行取得旧函数的名称*/
    memset(oldfunname,0,sizeof(oldfunname));
    memcpy(oldfunname,argv[3],strlen(argv[3]));
     
    /* 从命令行取得新函数的名称*/
    memset(newfunname,0,sizeof(newfunname));
    memcpy(newfunname,argv[4],strlen(argv[4]));
 
    printf("main pid = %d\n",pid);
    printf("main libpath : %s\n",libpath);
    printf("main oldfunname : %s\n",oldfunname);
    printf("main newfunname : %s\n",newfunname);
    /* 关联到目标进程*/
    ptrace_attach(pid);
    
    /* 得到指向link_map链表的指针 */
    map = get_linkmap(pid);                    /* get_linkmap */
 
     
    sym_addr = find_symbol(pid, map, "printf");      
    printf("found printf at addr %p\n", sym_addr); 
    if(sym_addr == 0)
        goto detach;
    call_printf(pid,sym_addr,"injso successed\n");
    waitpid(pid,&status,0);
    printf("status = %x\n",status);
     
    /*ptrace_writereg(pid, &oldregs);
    ptrace_cont(pid);
 
     
 
    waitpid(pid,&status,0);
    //printf("status = %x\n",status);
    //ptrace_readreg(pid, &oldregs);
    //oldregs.eip = 0x8048414;
    //ptrace_writereg(pid, &oldregs);
    ptrace_cont(int pid)(pid);
     
    ptrace_detach(pid);
 
    exit(0);*/
     
    /* 发现__libc_dlopen_mode,并调用它 */
    sym_addr = find_symbol(pid, map, "__libc_dlopen_mode");        /* call _dl_open */
    printf("found __libc_dlopen_mode at addr %p\n", sym_addr); 
    if(sym_addr == 0)
        goto detach;
    call__libc_dlopen_mode(pid, sym_addr,libpath);    /* 注意装载的库地址 */  
    //while(1);
    waitpid(pid,&status,0);
    /* 找到新函数的地址 */
    strcpy(sym_name, newfunname);                /* intercept */
    sym_addr = find_symbol(pid, map, sym_name);
    printf("%s addr\t %p\n", sym_name, sym_addr);
    if(sym_addr == 0)
        goto detach;
 
    /* 找到旧函数在重定向表的地址 */
    strcpy(sym_name, oldfunname);              
    rel_addr = find_sym_in_rel(pid, sym_name);
    printf("%s rel addr\t %p\n", sym_name, rel_addr);
    if(rel_addr == 0)
        goto detach;
 
    /* 找到用于保存read地址的指针 */
    //strcpy(sym_name, "oldread");              
    //old_addr = find_symbol(pid, map, sym_name);
    //printf("%s addr\t %p\n", sym_name, old_addr);
 
    /* 函数重定向 */
    puts("intercept...");                    /* intercept */
    //ptrace_read(pid, rel_addr, &new_addr, sizeof(new_addr));
    //ptrace_write(pid, old_addr, &new_addr, sizeof(new_addr));
    //rel_addr = 0x8048497;如果是静态地址,也就是未导出该符号地址,那么只能通过反汇编先找到该函数被调用的地方,将这个地方的跳转地址修改
     
    if(modifyflag == 2)
        sym_addr = sym_addr - rel_addr - 4;
    printf("main modify sym_addr = %x\n",sym_addr);
    ptrace_write(pid, rel_addr, &sym_addr, sizeof(sym_addr));
     
    puts("injectso ok");
detach:
    printf("prepare to detach\n");
    ptrace_detach(pid);
     
    return 0;
   
}

  这里面有一个很重要的地方,如果不先在目标进程中调用printf就不能够调用__lib_dlopen_mode成功,这个原因很奇怪,根据当时的core文件来看崩溃在了下面的这个函数,原因是_dl_open_hook这个全局变量为0,但实际上运行过printf之后,这个_dl_open_hook还是0。这个有待后续检验。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
void *
__libc_dlsym (void *map, const char *name)
{
  struct do_dlsym_args args;
  args.map = map;
  args.name = name;
 
#ifdef SHARED
  if (__builtin_expect (_dl_open_hook != NULL, 0))
    return _dl_open_hook->dlsym (map, name);
#endif
  return (dlerror_run (do_dlsym, &args) ? NULL
      : (void *) (DL_SYMBOL_ADDRESS (args.loadbase, args.ref)));
}

  运行结果:

root@leo-desktop:injso# ./test
1467364356 : original
injso successed
hahahahahahahahahahahahahaha

  • 6.如何替换未导出符号的地址

  被替换函数源码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
#include <stdio.h>
 
 
//int fun2();
 
int fun1()
{
        printf("fun1\n");
//      fun2();
}
 
int main()
{
        signed int i  = 0x40011673 ;
        i = i - 0x4001172d ;
        printf("i = %x\n",i);
        while(1){
                i = fun1();
                sleep(10);
        }
        return 1;
}

  这个怎么来替换fun1函数的地址呢?

  首先反汇编得到main的机器码,如下,

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
08048468 <main>:
 8048468:       55                      push   %ebp
 8048469:       89 e5                   mov    %esp,%ebp
 804846b:       83 e4 f0                and    $0xfffffff0,%esp
 804846e:       83 ec 20                sub    $0x20,%esp
 8048471:       c7 44 24 1c 73 16 01    movl   $0x40011673,0x1c(%esp)
 8048478:       40
 8048479:       81 6c 24 1c 2d 17 01    subl   $0x4001172d,0x1c(%esp)
 8048480:       40
 8048481:       b8 75 85 04 08          mov    $0x8048575,%eax
 8048486:       8b 54 24 1c             mov    0x1c(%esp),%edx
 804848a:       89 54 24 04             mov    %edx,0x4(%esp)
 804848e:       89 04 24                mov    %eax,(%esp)
 8048491:       e8 ce fe ff ff          call   8048364 <printf@plt>
 8048496:       e8 b9 ff ff ff          call   8048454 <fun1>
 804849b:       89 44 24 1c             mov    %eax,0x1c(%esp)
 804849f:       c7 04 24 0a 00 00 00    movl   $0xa,(%esp)
 80484a6:       e8 c9 fe ff ff          call   8048374 <sleep@plt>
 80484ab:       eb e9                   jmp    8048496 <main+0x2e>
 80484ad:       90                      nop
 80484ae:       90                      nop
 80484af:       90                      nop

  可以看到在地址0x8048496处的机器码是跳转到fun1函数的,那么这个ffffffb9就是call的操作数,操作数地址0x8048497,也就是说把这个地址中的数值改掉就可以了,有关这个call或者jmp的地址计算可以查看我的另外一篇博文。

  有关这个如何跳转的方法,已经在主函数的代码中给出了,但是被我注释掉了,大家感兴趣的话,可以自己试试。

  效果:

root@leo-desktop:lib2lib# ./a.out 
i = ffffff46
fun1
injso successed
hahahahahahaha^C

  这里面的无关代码,大家仔细看,是为了证明call的函数地址计算方式的。

  • 7.总结

  那么讲到现在的话,已经实现了不管函数符号是否导出都可以实现运行时替换的代码。

  这里面主要的技术是,elf文件格式,运行时加载的过程,跳转地址的计算,运行时链接的过程,也就是plt表(当然这个也可以从我的另一篇博文中看到)。

  比较遗憾的是有关那个奔溃,有网友如果找到了原因,请回复下,3q。当然我也会自己再研究下。

  最后补上全局变量和头文件:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
#include <stdio.h>
#include <string.h>
#include <elf.h>
#include <sys/types.h>
#include <stdio.h>
#include <sys/ptrace.h>
#include <sys/wait.h>
#include <sys/errno.h>
#include <sys/user.h>
#include <link.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <bits/dlfcn.h>
 
#define IMAGE_ADDR 0x08048000
 
int mode = 2;
 
struct user_regs_struct oldregs;
Elf32_Addr phdr_addr;
Elf32_Addr dyn_addr;
Elf32_Addr map_addr;
Elf32_Addr symtab;
Elf32_Addr strtab;
Elf32_Addr jmprel;
Elf32_Addr reldyn;
Elf32_Word reldynsz;
Elf32_Word totalrelsize;
Elf32_Word relsize;
unsigned long link_addr;
int nrels;
int nreldyns;
//int nchains;
int modifyflag = 0;
/*char libpath[128] = "/mnt/hgfs/svnroot/test/injectsov2/prj_linux/so.so";*/

  

  • 8.修正

  针对在调用__libc_dlopen_mode函数之前需要调用printf的问题,终于让我在晚上解决了。
  首先,我尝试了调用其他函数而不是printf函数,发现效果一样,包括第一次是调用__libc_dlopen_mode,第二次对该函数的调用都可以成功。
  其次,那么现在问题就集中在了这两个__libc_dlopen_mode调用之间的差别在哪里,程序段肯定是一致的,栈也是一致的,而堆空间未使用,还有一个重要的因素,那就是寄存器。
  最后,发现在调用__libc_dlopen_mode前,有四个寄存器不同,分别是eax,orig_eax,eflags和esp。我一开始认为,通用寄存器eax和orig_eax不会对程序的执行造成影响。但是通过实验,仅调一次__libc_dlopen_mode,部分寄存器赋正确执行时的值,发现对eax和orig_eax被赋于正确执行时的值时,程序可以正常运行,而且不仅仅必须是一种值,比如eax可以是0,1,0xffffffff,很多值都可以,但是被赋予0xfffffdfc和0xfffffdff等值时会失败,试验过并不是因为d这一位决定的,0xfffffdf0或者d00是可以运行成功的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(gdb) disassemble __libc_dlopen_mode
Dump of assembler code for function __libc_dlopen_mode:
   0x00232640 <+0>:   push   %ebp
   0x00232641 <+1>:   mov    %esp,%ebp
   0x00232643 <+3>:   sub    $0x1c,%esp
   0x00232646 <+6>:   mov    %ebx,-0x8(%ebp)
   0x00232649 <+9>:   mov    0x8(%ebp),%eax
   0x0023264c <+12>:  call   0x144a0f
   0x00232651 <+17>:  add    $0x519a3,%ebx
   0x00232657 <+23>:  mov    0xc(%ebp),%edx
   0x0023265a <+26>:  mov    %esi,-0x4(%ebp)
   0x0023265d <+29>:  mov    %eax,-0x14(%ebp)
   0x00232660 <+32>:  mov    %edx,-0x10(%ebp)
   0x00232663 <+35>:  mov    0x354c(%ebx),%esi
   0x00232669 <+41>:  test   %esi,%esi

  在实验中,还发现对eax赋于不正确的值时,当时忘了记了,还让程序跑飞了。崩了,但是新库已经加载上了。所以这个函数替换还是有一定的风险,或者说libc库本身存在一定的bug。
  所以现在问题找到了,在于eax和orig_eax上,但是对__libc_dlopen_mode反汇编发现,eax在函数开头就被赋予了通过栈传递的参数2的值,所以eax不应该影响程序的运行,但实际上影响了,这一点让我觉得很奇怪,如果有任何网友对这个原因知晓的话,麻烦回复,万分感谢。

  linux共享库注射地址:http://www.docin.com/p-634172083.html

  __simple原创

  转载请注明出处

04-20 22:42