可复制的数据:

data(crabs, package = "MASS")
df <- crabs[-(1:3)]
set.seed(12345)
df$GRP <- kmeans(df, 4)$cluster
df.order <- dplyr::arrange(df, GRP)

数据描述:
df具有5个数字变量。我根据这5个属性进行了K均值算法,并生成了一个新的分类变量GRP,它具有4个级别。接下来,我将其与GRP一起订购,并将其命名为df.order

我对pheatmap所做的操作:
## 5 numerical variables for coloring
colormat <- df.order[c("FL", "RW", "CL", "CW", "BD")]

## Specify the annotation variable `GRP` shown on left side of the heatmap
ann_row <- df.order["GRP"]

## gap indices
gapRow <- cumsum(table(ann_row$GRP))

library(pheatmap)
pheatmap(colormat, cluster_rows = F, show_rownames = F,
         annotation_row = ann_row, gaps_row = gapRow)



这是我有些奇怪的地方:

首先,我猜想问题是由annotation_row参数引起的。我检查了两个数据帧的行名。
all.equal(rownames(colormat), rownames(ann_row))
# [1] TRUE

您可以看到它们是平等的。但是,我执行了以下代码和热图工作。
rownames(colormat) <- rownames(ann_row)
pheatmap(colormat, cluster_rows = F, show_rownames = F,
         annotation_row = ann_row, gaps_row = gapRow)

从理论上讲,此代码 "rownames(colormat) <- rownames(ann_row)" 应该是没有意义的,因为这两个对象本来是相等的,但是为什么它使pheatmap()函数起作用呢?

编辑:从@steveb的评论中,我什至不必使用ann_row设置行名。我刚设定
rownames(colormat) <- rownames(colormat)

并且秘谱图也可以使用。这种情况仍然是违反直觉的。

最终输出:

r - Pheatmap中有些奇怪的东西(有错误吗?)-LMLPHP

最佳答案

简而言之,colormatrownames之前没有rownames(colormat) <- rownames(colormat),但在rownames之后没有pheatmap。这个答案开始触及问题的本质,但没有深入探讨为什么rownamesattributes(colormat)运行于此,或为什么R以这种方式工作。换句话说,我没有深入研究如何在R中处理行名的细节。

此问题的性质与$row.names返回行号的默认向量有关;每个元素都是数值,但表示为字符串,因此第10行成为行名“10”。使用rownames(colormat) <- rownames(colormat)时,您会看到rownamesattributes(colormat)之前的数字矢量,后面是字符矢量(现在具有行名)。我不清楚在未设置行名的情况下为什么会返回任何内容(NULL或NA除外)。

attributes(colormat)
## $names
## [1] "FL" "RW" "CL" "CW" "BD"
##
## $row.names
##   [1]   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38
##  [39]  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76
##  [77]  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114
## [115] 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152
## [153] 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190
## [191] 191 192 193 194 195 196 197 198 199 200
##
## $class
## [1] "data.frame"

rownames(colormat) <- rownames(colormat)

attributes(colormat)
## $names
## [1] "FL" "RW" "CL" "CW" "BD"
##
## $row.names
##   [1] "1"   "2"   "3"   "4"   "5"   "6"   "7"   "8"   "9"   "10"  "11"  "12"  "13"  "14"  "15"  "16"  "17"  "18"  "19"  "20"  "21"  "22"  "23"  "24"  "25"
##  [26] "26"  "27"  "28"  "29"  "30"  "31"  "32"  "33"  "34"  "35"  "36"  "37"  "38"  "39"  "40"  "41"  "42"  "43"  "44"  "45"  "46"  "47"  "48"  "49"  "50"
##  [51] "51"  "52"  "53"  "54"  "55"  "56"  "57"  "58"  "59"  "60"  "61"  "62"  "63"  "64"  "65"  "66"  "67"  "68"  "69"  "70"  "71"  "72"  "73"  "74"  "75"
##  [76] "76"  "77"  "78"  "79"  "80"  "81"  "82"  "83"  "84"  "85"  "86"  "87"  "88"  "89"  "90"  "91"  "92"  "93"  "94"  "95"  "96"  "97"  "98"  "99"  "100"
## [101] "101" "102" "103" "104" "105" "106" "107" "108" "109" "110" "111" "112" "113" "114" "115" "116" "117" "118" "119" "120" "121" "122" "123" "124" "125"
## [126] "126" "127" "128" "129" "130" "131" "132" "133" "134" "135" "136" "137" "138" "139" "140" "141" "142" "143" "144" "145" "146" "147" "148" "149" "150"
## [151] "151" "152" "153" "154" "155" "156" "157" "158" "159" "160" "161" "162" "163" "164" "165" "166" "167" "168" "169" "170" "171" "172" "173" "174" "175"
## [176] "176" "177" "178" "179" "180" "181" "182" "183" "184" "185" "186" "187" "188" "189" "190" "191" "192" "193" "194" "195" "196" "197" "198" "199" "200"
##
## $class
## [1] "data.frame"

问题不是行名的数字值与字符值,而是行名是否设置。如果您执行以下操作:
rownames(colormat) <- 1:nrow(colormat)

您会发现这也可以解决此问题,因为tibble::has_rownames(colormat)现在已设置为行号的数字值(请参见rownames(colormat) <- rownames(colormat)输出)。

如果在FALSE之前使用TRUE,则将获得pheatmap。分配后,您将获得colormat
tibble::has_rownames(colormat)
## [1] FALSE
rownames(colormat) <- rownames(colormat)
tibble::has_rownames(colormat)
## [1] TRUE

我不确定rownames在内部如何使用ojit_code,但它一定会遇到未设置ojit_code的问题。如果您与该软件包的作者联系(可能通过GitHub:https://github.com/raivokolde/pheatmap),则他们可能会更新代码以应对下一个发行版的特殊情况。

关于r - Pheatmap中有些奇怪的东西(有错误吗?),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/53871845/

10-12 16:43