我正在使用 hive 的histogram_numeric函数,并且要将选择查询输出到文件。
但是,我在文件中得到了无效的字符,并且无法将其用于绘制数据。

这是我的代码:

INSERT OVERWRITE LOCAL DIRECTORY '/home/cloudera/queries/histograms/q1'
      ROW FORMAT DELIMITED
      FIELDS TERMINATED BY ','
     select explode(histogram_numeric(operationTime,30)) from transaction;

结果我得到:
3.1968591661070107"someInvalidCharacter"196572.0
14.41629947203365"someInvalidCharacter"725191.0
27.84241052482667"someInvalidCharacter"27069.0

但我希望使用“,”而不是“someInvalidCharacter”。

可能是什么问题

最佳答案

对于Hive LanguageManualhistogram_numeric创建一个结构数组。尝试使用inline来“爆炸”您的输出,而不是使用explode

关于hadoop - 配置单元histogram_numeric函数输出无效字符,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25267795/

10-16 01:53