嗨,我正在使用基因表达矩阵,碎片计数来计算差异表达的基因。我想知道如何删除值为0的行。然后,我的数据集将变得紧凑,并且对于我使用此矩阵进行的下游分析,将得到较少的虚假结果。

输入项

gene    ZPT.1   ZPT.0   ZPT.2   ZPT.3   PDGT.1  PDGT.0
XLOC_000001 3516    626 1277    770 4309    9030
XLOC_000002 342 82  185 72  835 1095
XLOC_000003 2000    361 867 438 454 687
XLOC_000004 143 30  67  37  90  236
XLOC_000005 0   0   0   0   0   0
XLOC_000006 0   0   0   0   0   0
XLOC_000007 0   0   0   0   1   3
XLOC_000008 0   0   0   0   0   0
XLOC_000009 0   0   0   0   0   0
XLOC_000010 7   1   5   3   0   1
XLOC_000011 63  10  19  15  92  228


所需的输出

gene    ZPT.1   ZPT.0   ZPT.2   ZPT.3   PDGT.1  PDGT.0
XLOC_000001 3516    626 1277    770 4309    9030
XLOC_000002 342 82  185 72  835 1095
XLOC_000003 2000    361 867 438 454 687
XLOC_000004 143 30  67  37  90  236
XLOC_000007 0   0   0   0   1   3
XLOC_000010 7   1   5   3   0   1
XLOC_000011 63  10  19  15  92  228


到目前为止,我只想删除所有碎片计数列均为0的那些行,如果在任何行中某些值均为0而另一些值都不为零,那么我想保持该行不变,就像您在上面的示例中看到的那样。

请让我知道该怎么做。

最佳答案

df[apply(df[,-1], 1, function(x) !all(x==0)),]

10-08 20:08