问题描述
有没有办法查看hive 0.11及以上版本使用的orc文件的内容.我一般都是cat gz文件,解压看看里面的内容例如:cat part-0000.gz |猪-d |更多的注意:pigz 是一个并行的 gz 程序.
Is there a way to see the contents of an orc file that hive 0.11 and above use. I usually cat gz files and decompress them to see the contentseg: cat part-0000.gz | pigz -d | moreNote: pigz is a parallel gz program.
我想知道兽人文件是否有类似的东西.
I would like to know if there is something similar to this for orc files.
推荐答案
2020 年更新答案:
根据@Owen 的回答,ORC 已经长大并成熟,因为它是自己的Apache 项目.ORC 采用者 的完整列表显示了它现在在多种大型数据技术.
Per @Owen's answer, ORC has grown up and matured as it's own Apache project. A completed list of ORC Adopters shows how prevalent it is now supported across many varieties of Big Data technologies.
感谢@Owen 和 ORC Apache 项目团队,ORC 的项目站点有一份关于使用 Java 或 C++ 存储在 Linux 本地文件系统上的 ORC 文件的独立工具.其中为原始 Hive+ORC Apache wiki 页面.
Credit to @Owen and the ORC Apache project team, ORC's project site has a fully maintained up-to-date documentation on using either the Java or C++ stand alone tool on ORC file stored on a Linux local file system. Which carried on the torch for the original Hive+ORC Apache wiki page.
原始答案日期:2014 年 5 月 30 日 16:27
ORC 文件转储实用程序随 hive(0.11 或更高版本)一起提供:
hive --orcfiledump <hdfs-location-of-orc-file>
这篇关于如何在linux中查看Hive orc文件的内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!