实践中,发现直接在命令行终端运行cli_st时,能够得到预期的结果,但一将它放到crontab中,则只收到:
bye
相关的一段clit_st源代码如下:
if (FD_ISSET(0, &rfds)) { int rc; int len = sizeof(buffer) - bufoff -1; if (len fprintf(stderr, "Can't handle lines that long!\n"); exit(2); } rc = read(0, buffer+bufoff, len); if (rc fprintf(stderr, "bye\n"); break; } bufoff += rc; buffer[bufoff] = '\0'; while (strchr(buffer, '\n')) { char *ptr = strchr(buffer, '\n'); *ptr = '\0'; processline(buffer); ptr++; memmove(buffer, ptr, strlen(ptr)+1); bufoff = 0; } } zookeeper_process(zh, events); |
经推断和测试,以及借助strace工具调查,发现问题出在了“if (FD_ISSET(0, &rfds)) {”一处。正常它应当不成立的。
这导致cli_st主动断开了与zookeeper服务端的连接,从zookeeper的服务端日志文件可以看到这个动作:
caught end of stream exception Unable to read additional data from client sessionid 0x2513c8566c1000b, likely client has closed socket |
这段日志显示,cli_st关闭了连接。
问题的原因即是:
cron在fork子进程后,运行命令之前,会关闭stdin,这样导致clit_st中“if (FD_ISSET(0, &rfds)) {”成立,致使连接被关闭。
可以通过简单程序观察cron会关闭或重定向了stdint:
#include #include #include int main() { char buf[1024] = {0}; int n = read(0, buf, sizeof(buf)-1); printf("n=%d, errno=%d: %m\n", n, errno); return 0; } |
stdin正常,上面代码的进程会挂住,直接读取到stdin或stdin被关闭。但实际结果是:
n=0, errno=0: Success
read的返回值为0,表示stdin已关闭或重定向了。
可借助dup2让stdin复活:
#include #include #include #include #include #include
int main() { char buf[1024] = {0}; int n = read(0, buf, sizeof(buf)-1); printf("n=%d, errno=%d: %m\n", n, errno);
int fd = open("/tmp/abcde", O_RDONLY); printf("fd=%d\n", fd); if (-1 == dup2(fd, 0)) printf("dup2 error: %m\n");
n = read(0, buf, sizeof(buf)-1); printf("n=%d, errno=%d: %m\n", n, errno); if (n>0) { buf[n]=0; printf("%s\n", buf); }
return 0; } |
上面这段代码运行结果:
n=0, errno=0: Success fd=3 n=7, errno=0: Success dsfsfd |
要解决Zookeeper客户端cli_st在cron中运行的问题,最简单的办法是注释掉下段代码,然后重新编译,以跳过读标准输入:
bufoff=0; // 当注释下段代码时,需要加上它应付编译器 buffer[0]=0; // 当注释下段代码时,需要加上它应付编译器 #if 0 if (FD_ISSET(0, &rfds)) { int rc; int len = sizeof(buffer) - bufoff -1; if (len fprintf(stderr, "Can't handle lines that long!\n"); exit(2); } rc = read(0, buffer+bufoff, len); if (rc fprintf(stderr, "bye\n"); break; } bufoff += rc; buffer[bufoff] = '\0'; while (strchr(buffer, '\n')) { char *ptr = strchr(buffer, '\n'); *ptr = '\0'; processline(buffer); ptr++; memmove(buffer, ptr, strlen(ptr)+1); bufoff = 0; } } #endif |
cron的实现大致如下,它会将标准输入、输出和出错重定向到/dev/null,这导致后面对stdin的read返回0。有关cron的实现,可以浏览cron.c(http://blog.chinaunix.net/uid-20682147-id-5521210.html):
#include #include #include #include #include #include #include
int main() { int n; char buf[1024];
// 重定向stdin到/dev/null int fd = open("/dev/null", O_RDWR, 0); dup2(fd, 0); // 重定向0到fd,0即为stdin
pid_t pid = fork(); if (0 == pid) { n = read(0, buf, sizeof(buf)-1); // 返回0 printf("n=%d, errno=%d: %m\n", n, errno); exit(0); }
return 0; } |
相关文章:
http://blog.chinaunix.net/uid-20682147-id-4977039.html(Cron运行原理)
dup&dup2:
fid = dup(fildes);
等同于
fid = fcntl(fildes, F_DUPFD, 0);
fid和fildes都指向fildes。
fid = dup2(fildes, fildes2); // 重定向fildes2到fildes
等同于:
close(fildes2);
fid = fcntl(fildes, F_DUPFD, fildes2);
fid、fildes和fildes2指向fildes。