我正在以编程方式制作大量的seqlogos。它们的宽度为数百列,因此运行seqlogo
通常会创建太薄而看不到的字母。我注意到,我只关心其中的几列(不一定是连续的列)……大多数是噪音,但有些高度保守。
我使用类似以下代码段的内容:
wide_seqs = cell2mat(arrayfun(@randseq, repmat(200, [500 1]), 'uniformoutput', false));
wide_seqs(:, [17,30, 55,70,130]) = repmat(['ATCGG'], [500 1])
conserve_cell = seqlogo(wide_seqs, 'displaylogo', false);
high_bit_cols = any(conserve_cell{2}>1.0,1);
[~, handle] = seqlogo(wide_seqs(:,high_bit_cols ));
尽管执行此操作时,我会丢失有关数据来自哪些列的信息。
通常,我只需要更改
seqlogo
的x轴即可。但是,seqlogo
是某种疯狂的基于Java的对象,其调用类似于:set(handle, 'xticklabel', num2str(find(high_bit_cols)))
不工作。任何帮助将不胜感激。
谢谢,
将要
编辑:
赏金大方,我愿意接受各种疯狂的方法来更改轴标签,包括(但不限于):保存后使用图像处理工具箱修改图像,使用文本框创建新的seqlogo函数,修改Java代码(如果可能)等。我不愿意接受“使用python”,“使用此R库”或任何其他非Matlab解决方案。
最佳答案
好的,我为此问题花了几个小时。看来您无法在该hgjavacomponent对象的顶部放置任何MATLAB对象(轴或文本框)。当然,我无法修改Java代码。因此,我找到的唯一可行的解决方案是从头开始创建图形。
我不想重写代码来计算权重矩阵(符号高度),您已经做到了。但是,如果您根本不想使用MATLAB的seqlogo,则可以这样做。因此,我对您的最后一行进行了一些更改以获取矩阵:
[wm, handle] = seqlogo(wide_seqs(:,high_bit_cols ));
文本符号的问题在于,您无法精确控制其大小,无法将符号适合文本框。这可能就是MATLAB决定使用Java图形对象的原因。但是我们可以创建符号图像并对其进行处理。
这是创建字母图像的代码:
letters = wm{1};
clr = [0 1 0; 0 0 1; 1 0.8 0;1 0 0]; % corresponding colors
for t = 1:numel(letters)
hf = figure('position',[200 200 100 110],'color','w');
ha = axes('parent',hf, 'visible','off','position',[0 0 1 1]);
ht = text(50,55,letters(t),'color',clr(t,:),'units','pixels',...
'fontsize',100,'fontweight','norm',...
'vertical','mid','horizontal','center');
F = getframe(hf); % rasterize the letter
img = F.cdata;
m = any(img < 255,3); % convert to binary image
m(any(m,2),any(m,1))=1; % mask to cut white borders
imwrite(reshape(img(repmat(m,[1 1 3])),[sum(any(m,2)) sum(any(m,1)) 3]),...
[letters(t) '.png'])
close(hf)
end
然后,我们使用这些图像绘制新的seqlogo图:
xlabels = cellstr(num2str(find(high_bit_cols)'));
letters = wm{1};
wmat=wm{2}; % weight matrix from seqlogo
[nletters npos] = size(wmat);
wmat(wmat<0) = 0; % cut negative values
% prepare the figure
clf
hAx = axes('parent',gcf,'visible','on');
set(hAx,'XLim',[0.5 npos+0.5],'XTick',1:npos,'XTickLabel',xlabels)
ymax = ceil(max(sum(wmat)));
ylim([0 ymax])
axpos = get(hAx,'Position');
step = axpos(3)/npos;
% place images of letters
for i=1:npos
[wms idx] = sort(wmat(:,i)); % largest on the top
let_show = letters(idx);
ybot = axpos(2);
for s=1:nletters
if wms(s)==0, continue, end;
axes('position',[axpos(1) ybot step wms(s)/ymax*axpos(4)])
ybot = ybot + wms(s)/ymax*axpos(4);
img = imread([let_show(s) '.png']);
image(img)
set(gca,'visible','off')
end
axpos(1)=axpos(1)+step;
end
结果如下:
alt text http://img716.imageshack.us/img716/2073/seqlogoexample.png
当然,可以进一步改善代码和图形,但是我希望这是您可以开始使用的东西。让我知道我是否想念什么。