我有多行多列的矩阵。我想删除第一列和第二列中具有相同字符串的行。例如文件-

wheat_tae-miR1127       wheat_tae-miR1127       100.00  19      0
wheat_tae-miR1131       wheat_tae-miR1131       100.00  22      0
wheat_tae-miR164        Rice_osa-miR164        100.00  21      0
wheat_tae-miR164        Maize_miRBase_zma-miR164a-5p    100.00  21      0
wheat_tae-miR444a       Maize_zma-miR444a       100.00  21      0
wheat_tae-miR444a       Rice_osa-miR444a-3p_1   100.00  21      0
wheat_tae-miR444a       wheat_tae-miR444a       100.00  21      0

期望输出为-
wheat_tae-miR164        Maize_miRBase_zma-miR164a-5p    100.00  21      0
wheat_tae-miR444a       Maize_zma-miR444a       100.00  21      0
wheat_tae-miR444a       Rice_osa-miR444a-3p_1   100.00  21      0

最佳答案

事实证明,使用awk

awk -F' ' '$1!=$2' input_file

07-25 22:05