在 Linux 内核的之前的版本, 正式的睡眠要求程序员手动处理所有上面的步骤. 它是一 个繁琐的过程, 包含相当多的易出错的样板式的代码. 程序员如果愿意还是可能用那种方 式手动睡眠; <linux/sched.h> 包含了所有需要的定义, 以及围绕例子的内核源码. 但是, 有一个更容易的方式.

第一步是创建和初始化一个等待队列. 这常常由这个宏定义完成: DEFINE_WAIT(my_wait);

其中, name 是等待队列入口项的名子. 你可用 2 步来做:

wait_queue_t my_wait; init_wait(&my_wait);

但是常常更容易的做法是放一个 DEFINE_WAIT 行在循环的顶部, 来实现你的睡眠. 下一步是添加你的等待队列入口到队列, 并且设置进程状态. 2 个任务都由这个函数处理: void prepare_to_wait(wait_queue_head_t *queue, wait_queue_t *wait, int state);

这里, queue 和 wait 分别地是等待队列头和进程入口. state 是进程的新状态; 它应当 或者是 TASK_INTERRUPTIBLE(给可中断的睡眠, 这常常是你所要的)或者 TASK_UNINTERRUPTIBLE(给不可中断睡眠).

在调用 prepare_to_wait 之后, 进程可调用 schedule -- 在它已检查确认它仍然需要等 待之后. 一旦 schedule 返回, 就到了清理时间. 这个任务, 也, 被一个特殊的函数处理:

void finish_wait(wait_queue_head_t *queue, wait_queue_t *wait); 之后, 你的代码可测试它的状态并且看是否它需要再次等待.

我们早该需要一个例子了. 之前我们看了 给 scullpipe 的 read 方法, 它使用 wait_event. 同一个驱动中的 write 方法使用 prepare_to_wait 和 finish_wait 来实 现它的等待. 正常地, 你不会在一个驱动中象这样混用各种方法, 但是我们这样作是为了 能够展示 2 种处理睡眠的方式.

为完整起见, 首先, 我们看 write 方法本身:

/* How much space is free? */

static int spacefree(struct scull_pipe *dev)

{

if (dev->rp == dev->wp)

return dev->buffersize - 1;

return ((dev->rp + dev->buffersize -
dev->wp) % dev->buffersize) - 1;

}

static ssize_t scull_p_write(struct file *filp, const
char user *buf, size_t count,

loff_t
*f_pos)

{

struct scull_pipe *dev = filp->private_data; int
result;

if
(down_interruptible(&dev->sem)) return -ERESTARTSYS;

/* Make sure there's space to write */ result =
scull_getwritespace(dev, filp); if (result)

return result; /* scull_getwritespace called
up(&dev->sem) */

/*
ok, space is there, accept something */ count = min(count,
(size_t)spacefree(dev)); if (dev->wp >= dev->rp)

count = min(count, (size_t)(dev->end -
dev->wp)); /* to end-

of-buf */

else /* the write pointer
has wrapped, fill up to rp-1 */ count = min(count, (size_t)(dev->rp -
dev->wp - 1));

PDEBUG("Going to accept %li bytes to %p from
%p\n", (long)count, dev-

>wp, buf);

if (copy_from_user(dev->wp, buf, count))

{

up (&dev->sem); return -EFAULT;

}

dev->wp += count;

if (dev->wp == dev->end)

dev->wp =
dev->buffer; /* wrapped */ up(&dev->sem);

/* finally, awake any reader */

wake_up_interruptible(&dev->inq); /* blocked
in read() and select() */

/* and signal asynchronous readers, explained late in
chapter 5 */ if (dev->async_queue)

kill_fasync(&dev->async_queue,
SIGIO, POLL_IN); PDEBUG("\"%s\" did write %li
bytes\n",current->comm, (long)count); return count;

}

这个代码看来和
read 方法类似, 除了我们已经将睡眠代码放到了一个单独的函数, 称为 scull_getwritespace. 它的工作是确保在缓冲中有空间给新的数据, 睡眠直到有空间可
用. 一旦空间在, scull_p_write 可简单地拷贝用户的数据到那里, 调整指针, 并且唤醒 可能已经在等待读取数据的进程.

处理实际的睡眠的代码是:

/* Wait for space for writing; caller must hold
device semaphore. On

* error the semaphore will be released before
returning. */

static int scull_getwritespace(struct scull_pipe
*dev, struct file *filp)

{

while (spacefree(dev) == 0)

{ /* full */

DEFINE_WAIT(wait);

up(&dev->sem);

if (filp->f_flags
& O_NONBLOCK) return -EAGAIN;

PDEBUG("\"%s\" writing: going to
sleep\n",current->comm); prepare_to_wait(&dev->outq, &wait,
TASK_INTERRUPTIBLE); if (spacefree(dev) == 0)

schedule(); finish_wait(&dev->outq, &wait); if
(signal_pending(current))

handle it */

}

return
-ERESTARTSYS; /* signal: tell the fs layer to

if
(down_interruptible(&dev->sem)) return -ERESTARTSYS;

return 0;

}

再次注意
while 循环. 如果有空间可用而不必睡眠, 这个函数简单地返回. 否则, 它必 须丢掉设备旗标并且等待. 这个代码使用 DEFINE_WAIT 来设置一个等待队列入口并且
prepare_to_wait 来准备好实际的睡眠. 接着是对缓冲的必要的检查; 我们必须处理的情 况是在我们已经进入 while 循环后以及在我们将自己放入等待队列之前
(并且丢弃了旗 标), 缓冲中有空间可用了. 没有这个检查, 如果读进程能够在那时完全清空缓冲, 我们

可能错过我们能得到的唯一的唤醒并且永远睡眠. 在说服我们自己必须睡眠之后, 我们调 用 schedule.

值得再看看这个情况: 当睡眠发生在 if 语句测试和调用 schedule 之间, 会发生什么? 在这个情况里,
都好. 这个唤醒重置了进程状态为 TASK_RUNNING 并且 schedule 返回 -

- 尽管不必马上. 只要这个测试发生在进程放置自己到等待队列和改变它的状态之后, 事 情都会顺利.

为了结束, 我们调用 finish_wait. 对
signal_pending 的调用告诉我们是否我们被一个 信号唤醒; 如果是, 我们需要返回到用户并且使它们稍后再试. 否则, 我们请求旗标, 并 且再次照常测试空闲空间.

05-25 19:16