我有如下形式的日志文件:
日志.txt

Unavailable 06.08.2014 23:59:36 - 07.08.2014 00:00:36
Unavailable 15.08.2014 04:53:32 - 15.08.2014 04:53:32
Available   15.08.2014 04:54:32 - 15.08.2014 05:17:32
Unavailable 15.08.2014 05:18:32 - 15.08.2014 05:18:32
Unavailable 15.08.2014 08:22:00 - 15.08.2014 08:22:00
Available   15.08.2014 08:23:00 - 17.08.2014 01:44:27
Unavailable 17.08.2014 01:45:27 - 17.08.2014 01:52:33
Available   17.08.2014 01:53:33 - 02.09.2014 11:07:21

我需要以秒为单位计算不可用时间。我不是任何sed/awk专家,所以我对这个问题的看法非常简单:
cat log.txt | grep "Unav" | sed -r 's/\<Unavailable\>//g;s/:/ /g;s/\./ /g' |
awk -F- '{d2=mktime($2);d1=mktime($1);print d2-d1;}' | awk '{s+=$1} END {print s}'

我惊讶地发现,当日期在白天(午夜)到来时,计算就出错了。第一行的计算结果表明,两者的时差为31449660秒,因此将是1970年12月31日星期四01:01:00。但计算结果应该是60秒。有人能解释一下为什么这个结果是从系统返回的吗?

最佳答案

如果要使用sed,您不需要所有这些grepawk。而且,从样本数据来看,差异应该是60秒。
man页:
mktime(datespec)将datespec转换为与原来格式相同的时间戳
由systime()返回。它类似于同名函数
在ISO C中,参数datespec是“YYYY-MM-DD”格式的字符串
高-毫米不锈钢[夏令时]”。
请尝试以下命令:

awk '
$1 == "Unavailable" {
    split ($2, d1, /[.]/);
    split ($3, t1, /:/);
    split ($5, d2, /[.]/);
    split ($6, t2, /:/);
    end   = mktime (d2[3]" "d2[2]" "d2[1]" "t2[1]" "t2[2]" "t2[3])
    start = mktime (d1[3]" "d1[2]" "d1[1]" "t1[1]" "t1[2]" "t1[3])
    print end - start
}' log.txt
60
0
0
0
426

这将以秒为单位打印差异。如果希望以其他格式打印输出,可以使用GNUstrftime库中的awk函数。

08-05 10:35