Rosetta InterfaceAnalyzer是一种用于分析蛋白质相互作用界面的工具,可以计算结合能、埋藏界面表面积、包装统计数据和其他有用的界面指标。

这里以(PDB:3R2X)为例,介绍如何利用Rosetta中InterfaceAnalyzer来快速分析蛋白-蛋白相互作用,并提取有价值的信息。

InterfaceAnalyzer的主要应用:

  • 蛋白-蛋白分子对接
  • 蛋白-蛋白相互作用界面突变设计
  • 蛋白-蛋白相互作用界面分析

注意: InterfaceAnalyzer不可用于蛋白质-小分子相互作用界面分析。


快速修复输入PBD结构:

使用Rosetta score_jd2 app对输入的PDB文件进行打分可以快速修复结构的方法,确保输入文件能够正确地被Rosetta读取。(提示: 3r2x中存在残基插入码,如A链的264A Gly,因此需要对整个PDB结构进行重编号,否则packsat计算异常。)

# 进入工作文件夹
cd $ROSETTA/demos/public/analyzing_interface_quality/rosetta_inputs

# 对输入文件进行打分
score_jd2.mpi.macosclangrelease -s ../starting_files/*.pdb.gz -no_optH false -ignore_unrecognized_res -out:pdb

# 重命名,以便于与输入文件区分开来。
mv 3r2x_0001.pdb 3r2x_scored.pdb

score_jd2 app选项注释:

  • -no_optH false:是否考虑谷氨酰胺、天冬酰胺以及组氨酸的构象翻转?(设置为True,将有利于优化包埋在蛋白内部而又未饱和成键极性原子)。
  • -ignore_unrecognized_res:删除水分子以及其他未能被Rosetta识别的残基分子。
  • -out:pdb:这会强制score_jd2应用程序输出PDB文件,以便稍后使用。

运行后,我们将得到3r2x_0001.pdb,并将其重命名为3r2x_scored.pdb,作为下一步的输入文件。

准备运行参数文件

新建文件,输入以下参数来控制InterfaceAnalyzer计算模式:

  • 优化侧链的模式(推荐使用!)
  • 非优化侧链的模式(除非输入的结构已经是经过优化和能量最小化处理,避免使用)

以优化侧链的模式的参数文件: pack_input_options.txt文件为例说明参数意义。

#specific options for InterfaceAnalyzer
-use_input_sc 
-compute_packstat true # 是否输出packstat值进行运算,评估蛋白作用界面的契合度。
-tracer_data_print true # 是否在屏幕上输出结果

# 蛋白质侧链优化选项。
-out:file:score_only pack_input_score.sc # 输出的打分文件名称
-pack_input true     # 是否对输入文件的相互作用界面进行氨基酸侧链重排优化?
-pack_separated true # 将每条蛋白质链分离,并进行侧链优化,这对界面ddG分析有用
-add_regular_scores_to_scorefile true # 是否使用标准打分函数?

#these are some tweeks that we have found helpful
-atomic_burial_cutoff 0.01 # 鉴别包埋极性原子的标准。
-sasa_calculator_probe_radius 1.4 # 蛋白表面探针的半径
-pose_metrics::interface_cutoff 8.0 # 蛋白-蛋白相互作用界面截断半径。设置越大,界面范围越大。

 

2 运行InterfaceAnalyzer

在3R2X模型中,甲型流感病毒H1N1亚型血凝素由A、B链组成的异源二聚体,HA结合蛋白为C链。我们将AB作为一个整体考虑,因此需额外加上fixedchains选项。

  • -fixedchains A B 代表:将A链与B链作为一个整体考虑,不对AB之间的相互作用进行分析。

打开终端,输入以下命令:

  • 如果需要使用非优化侧链的模式,将pack_input_options.txt替换为no_pack_input_options.txt即可。
  • 如果想要packstat值更收敛,需要加上: -packstat::oversample 100
InterfaceAnalyzer.mpi.macosclangrelease -s 3r2x_scored.pdb -fixedchains A B @pack_input_options.txt

3 结果分析

查看终端输出:(需要将参数文件中,将compute_packstat设置为true),打分结果详细罗列在屏幕上,同时,我们也可以用文本编辑器或电子表格应用程序打开pack_input_score.sc文件,查看分析结果。

【蛋白-蛋白】Rosetta InterfaceAnalyzer 学习笔记-LMLPHP

 InterfaceAnalyzer中几个重要的指标:

  • 蛋白结合自由能(dG_separated):如果没有使用优化侧链的模式的参数,你会发现计算所得的ddG值是不真实的,因为输入文件中存在原子对之间的不合理排布。因此在计算过程中对侧链重排是必要的。
  • 未饱和成键的极性原子数量(delta_unsatHbonds): 未成对的极性原子越多,蛋白-蛋白相互作用越弱。值得注意的是,经过Rosetta优化后可能会出现更多的未饱和成键的极性原子,因为程序试图缓解结构之间冲突。
  • 堆积紧密度(packstat):这是衡量界面填充程度如何的一个指标(区间0~1.0)当值为1.0时,代表蛋白之间完美互补。(通常值大于0.65是好的)
  • 形状互补度(shape_complementarity): 对于抗体分析而言shape_complementarity打分能更好地代表两个分子之间的互补度。(from Jared Adolf-Bryfogle)
  • 包埋表面积(dSASA_int):衡量相互作用界面大小的指标,单位 Angstroms^2。
  • 每单位面积的结合自由能(dG_separated / dSASAx100):以dG_separated结合能除以包埋表面积值(dSASA_int)所得。通常低于-1.5的值就非常好。

 

 

08-18 08:51