本文介绍了R提取字符串的一部分的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我对提取字符串的一部分有疑问.例如,我有一个像这样的字符串:

I have a question about extracting a part of a string. For example I have a string like this:

a <- "DP=26;AN=2;DB=1;AC=1;MQ=56;MZ=0;ST=5:10,7:2;CQ=SYNONYMOUS_CODING;GN=NOC2L;PA=1^1:0.720&2^1:0"

我需要提取GN=;之间的所有内容,因此这里是NOC2L.

I need to extract everything between GN= and ;.So here it will be NOC2L.

有可能吗?

注意::这是INFO列形式 VCF文件格式. GN是基因名称,因此我们要从INFO列中提取基因名称.

Note: This is INFO column form VCF file format. GN is Gene Name, so we want to extract gene name from INFO column.

推荐答案

尝试一下:

sub(".*?GN=(.*?);.*", "\\1", a)
# [1] "NOC2L"

这篇关于R提取字符串的一部分的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-03 06:46