本文介绍了在OpenRefine中组合第x列到第n列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个具有未知列数的表,并且我需要合并某个点之后的所有列。请考虑以下事项:
| A | B | C | D | E |
|----|----|---|---|---|
| 24 | 25 | 7 | | |
| 12 | 3 | 4 | | |
| 5 | 5 | 5 | 5 | |
A-C列是已知的,并且其中的信息是正确的。但是,D列到N列(从D开始的未知数量的列)需要组合,因为它们都是同一字符串的一部分。如何在OpenRefine中合并未知数量的列?由于某些列可能有空单元格(字符串的长度可能不同),我还需要忽略空单元格。
推荐答案
有两个步骤的方法,适用于您。
从要合并的第一列(本例中为D列)中,选择转置->将列中的单元格转置为行
系统将要求您设置一些选项。您需要选择‘From Column’D和‘To Column’N,然后选择转置为一列,为该列指定一个名称,确保选中了‘Ignore Blank Cells’(忽略空白单元格)选项(默认情况下应选中)。然后单击"转置"。
您将获得以前在列D-N中显示的值。例如| A | B | C | D | E | F |
|----|----|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 |
转置为:
| A | B | C | new |
|----|----|---|-----|
| 1 | 2 | 3 | 4 |
| | | | 5 |
| | | | 6 |
然后,您可以使用‘new’列头的下拉菜单来选择编辑单元格->联接多值单元格系统将询问您要使用什么字符来分隔连接的单元格中的字符。可能在您的用例中,您可以删除连接字符并合并不带任何连接字符的单元格。这将为您提供:
| A | B | C | new |
|----|----|---|-----|
| 1 | 2 | 3 | 456 |
这篇关于在OpenRefine中组合第x列到第n列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!