考虑以下结构:
struct example_t {
char * a;
char * b;
};
struct example_t test {
"Chocolate",
"Cookies"
};
我知道char*的内存分配的特定于实现的特性,但是字符串文本是什么呢?
在这种情况下,对于“巧克力”和“饼干”的相邻放置,C标准是否有任何保证?
在我测试的大多数实现中,这两个文本没有填充,而是直接相邻的。
这允许使用memcpy快速复制结构,尽管我怀疑这种行为是未定义的。有人知道这个话题吗?
最佳答案
在您的示例中,无法绝对保证两个字符串文字之间的相邻/放置。在本例中,gcc碰巧展示了这种行为,但它没有义务展示这种行为。
在本例中,我们没有看到填充,甚至可以使用未定义的行为来演示字符串文本的邻接性。这适用于gcc,但是使用备用的编译器或不同的编译器,您可以获得其他行为,例如跨翻译单元检测重复的字符串文本,并减少冗余以节省最终应用程序中的内存。
此外,虽然您声明的指针是libc
类型,但文字实际上应该是char *
,因为它们将存储在const char*
中,写入该内存将导致segfault。
代码列表
#include <stdio.h>
#include <string.h>
struct example_t {
char * a;
char * b;
char * c;
};
int main(void) {
struct example_t test = {
"Chocolate",
"Cookies",
"And milk"
};
size_t len = strlen(test.a) + strlen(test.b) + strlen(test.c) + ((3-1) * sizeof(char));
char* t= test.a;
int i;
for (i = 0; i< len; i++) {
printf("%c", t[i]);
}
return 0;
}
样本输出
./a.out
ChocolateCookiesAnd milk
gcc-s的输出
.file "test.c"
.section .rodata
.LC0:
.string "Chocolate"
.LC1:
.string "Cookies"
.LC2:
.string "And milk"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
pushq %rbx
subq $72, %rsp
.cfi_offset 3, -24
movq $.LC0, -48(%rbp)
movq $.LC1, -40(%rbp)
movq $.LC2, -32(%rbp)
movq -48(%rbp), %rax
movq %rax, %rdi
call strlen
movq %rax, %rbx
movq -40(%rbp), %rax
movq %rax, %rdi
call strlen
addq %rax, %rbx
movq -32(%rbp), %rax
movq %rax, %rdi
call strlen
addq %rbx, %rax
addq $2, %rax
movq %rax, -64(%rbp)
movq -48(%rbp), %rax
movq %rax, -56(%rbp)
movl $0, -68(%rbp)
jmp .L2
.L3:
movl -68(%rbp), %eax
movslq %eax, %rdx
movq -56(%rbp), %rax
addq %rdx, %rax
movzbl (%rax), %eax
movsbl %al, %eax
movl %eax, %edi
call putchar
addl $1, -68(%rbp)
.L2:
movl -68(%rbp), %eax
cltq
cmpq -64(%rbp), %rax
jb .L3
movl $0, %eax
addq $72, %rsp
popq %rbx
popq %rbp
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size main, .-main
.ident "GCC: (Ubuntu 4.8.4-2ubuntu1~14.04) 4.8.4"
.section .note.GNU-stack,"",@progbits