本文介绍了如何在linux中查看Hive orc文件的内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

有没有办法查看hive 0.11及以上版本使用的orc文件的内容.我一般都是cat gz文件,解压看看里面的内容例如:cat part-0000.gz |猪-d |更多的注意:pigz 是一个并行的 gz 程序.

Is there a way to see the contents of an orc file that hive 0.11 and above use. I usually cat gz files and decompress them to see the contentseg: cat part-0000.gz | pigz -d | moreNote: pigz is a parallel gz program.

我想知道兽人文件是否有类似的东西.

I would like to know if there is something similar to this for orc files.

推荐答案

2020 年更新答案:

根据@Owen 的回答,ORC 已经长大并成熟,因为它是自己的Apache 项目.ORC 采用者 的完整列表显示了它现在在多种大型数据技术.

Per @Owen's answer, ORC has grown up and matured as it's own Apache project. A completed list of ORC Adopters shows how prevalent it is now supported across many varieties of Big Data technologies.

感谢@Owen 和 ORC Apache 项目团队,ORC 的项目站点有一份关于使用 JavaC++ 存储在 Linux 本地文件系统上的 ORC 文件的独立工具.其中为原始 Hive+ORC Apache wiki 页面.

Credit to @Owen and the ORC Apache project team, ORC's project site has a fully maintained up-to-date documentation on using either the Java or C++ stand alone tool on ORC file stored on a Linux local file system. Which carried on the torch for the original Hive+ORC Apache wiki page.

原始答案日期:2014 年 5 月 30 日 16:27

ORC 文件转储实用程序随 hive(0.11 或更高版本)一起提供:

hive --orcfiledump <hdfs-location-of-orc-file>

来源链接

这篇关于如何在linux中查看Hive orc文件的内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

06-17 19:36