我有几个SNP ID(例如rs16828074,rs17232800等),我想在UCSC genome website的Hg19基因组中对其进行协调。
我更喜欢使用R
来实现此目标。怎么做?
最佳答案
这是使用Bioconductor软件包biomaRt
的解决方案。它是先前发布的代码的稍作更正和重新格式化的版本。
library(biomaRt) # biomaRt_2.30.0
snp_mart = useMart("ENSEMBL_MART_SNP", dataset="hsapiens_snp")
snp_ids = c("rs16828074", "rs17232800")
snp_attributes = c("refsnp_id", "chr_name", "chrom_start")
snp_locations = getBM(attributes=snp_attributes, filters="snp_filter",
values=snp_ids, mart=snp_mart)
snp_locations
# refsnp_id chr_name chrom_start
# 1 rs16828074 2 232318754
# 2 rs17232800 18 66292259
鼓励用户阅读全面的
biomaRt
vignette并尝试以下biomaRt
功能:listFilters(snp_mart)
listAttributes(snp_mart)
attributePages(snp_mart)
listDatasets(snp_mart)
listMarts()