尝试获取Spark应用程序的YARN日志时,日志似乎已压缩为gzip格式,如何将其解压缩。 LogType:stdout.gz

LogType:stdout.gz
Log Upload Time:Tue Jan 21 03:38:17 +0000 2020
LogLength:1074
Log Contents:
       řϲ£8Ưy
½ þ!    ߶⌔kRك²[µ'1Î
pv歷±ɄA²]ö!券ߏ£²¢ڶ蕷eź6f÷-нOϯ«¿^��zùǪ񟽼¼¿Cû¯UQ

使用yarn logs -applicationId <applicationId> > file_name.log提取日志,在输出结果时,需要在命令后附加一些内容以解压缩文件。

最佳答案

请看一下这种方法:

gunzip -c stdout.gz | myScript.pl -o myoutfile.txt -i -

或者您可以选择:
zcat stdout.gz > yarnstdout

资料来源:https://askubuntu.com/questions/418771/uncompress-and-pipe-the-output-to-script

类似问题:
https://unix.stackexchange.com/questions/156261/unzipping-a-gz-file-without-removing-the-gzipped-file/156324#156324
how to pipe contents of large tar.gz file to STDOUT?

干杯!

关于apache-spark - YARN记录.gz格式如何使用命令解压缩,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/59872315/

10-16 05:34