生物信息上机实验报告(四):蛋白质序列分析

实习目的

  1. 掌握蛋白质序列的基本特性的分析方法;
  2. 掌握蛋白质序列一维序列、二级结构分析方法;
  3. 熟悉蛋白质结构数据库(PDB)的检索方法;
  4. 掌握蛋白质序列三级结构的展示、标注方法。

实习内容

  1. 蛋白质基本特性分析:用Protparam程序, 对如下任一蛋白质(P02754,P63326,AAM91227)的氨基酸序列的基本特性进行分析,包括氨基酸组成、分子量、等电点(PI)、疏水性等;同时观察(P02754,P63326)在UniProt的相关介绍。

    • SignaIP程序对P02754进行信号肽预测分析;

    • Tmpred 预测(AAM91227)蛋白质的跨膜区;

  2. 蛋白质一维序列分析:用BLAST程序搜寻上述蛋白质的相似蛋白序列,并展示比对信息和熟悉各个超链接;
  3. 蛋白质二级结构分析:用interproscan程序预测AAM91227蛋白质序列的motif;
  4. 蛋白质三级结构分析: 利用蛋白名称、所属物种信息,检索蛋白质(AAM91227)在PDB数据库中是否存在已被解析的蛋白结构;若有下载其解析精度最高的蛋白结构文件(*.pdb);
  5. 了解重要蛋白质分析网站:

蛋白质结构预测流程:
Figure 1. 蛋白质预测流程

实习报告

  1. 用Protparam程序,对蛋白质(AAM91227)的基本特性进行预测,包括分子量、等电点(PI)、含量最高的三种氨基酸所占百分比;
    Figure 2. ProtParam蛋白质基本特性分析结果图

    • 分子量:42568.13
    • 氨基酸等电点:5.90
    • 含量最高的三种氨基酸:Gly甘氨酸(8.5%),Ser丝氨酸(8.7%),Val缬氨酸(9.7%)
    • 带正电荷的氨基酸残基总数:39
    • 带负电荷的氨基酸残基总数:45
    • 分子式:$C{1883}H{2977}N{503}O{561}S_{29}$
    • 摩尔消光系数:在生物化学里,蛋白质在280nm的消光系数几乎全由芳香族残基,由其是色氨酸所决定,可由氨基酸序列预测。Abs 0.1%(= 1g/l) 0.821
    • 不稳定系数: 39.75<40 蛋白质稳定
    • 脂肪族氨基酸系数:86.64
    • 总平均亲水性:0.043
  2. 用SignalP程序,预测蛋白质(P02754、AAM91227)是否存在信号肽,若存在,具体区段在哪?;
    Figure 3. SignalP_P02754结果图
    Figure 4. SignalP_AAM91227结果图
    P02754存在信号肽,具体区段为1~16bp;AAM91227不存在信号肽

  3. 用Tmpred程序,预测蛋白质(AAM91227)的最可能跨膜区段;
    蛋白质跨膜区特性:

    • 典型的跨膜螺旋区主要是由20~30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等);
    • 亲水残基往往出现在疏水残基之间,对功能有重要的作用;
    • 基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。
      Figure 5. TMPred结果图
      由结果图可知,最可能的跨膜区段是179~197(19bp)由内侧朝向外侧;205~224(20bp)由外侧朝向内侧
  4. 用interproscan程序,预测蛋白质(AAM91227)是否存在NAD(P)结合区域,若存在,该区域在三个数据库中的ID分别是什么,结合域的起始和终止区域是?
    Figure 6. interproscan结果图
    存在NAD(P)结合区域;
    起始到终止区域是177~352
    各数据库编号为:

    1. Homologous superfamilies数据库

      • NAD(P)-binding domain superfamily (IPR036291)
    2. Domains and repeats

      • Alcohol dehydrogenase, C-terminal (IPR013149)
    3. Detailed signature matches
      • SSF51735 (NAD(P)-binding Rossmann-fold domains) Model: 0046114
      • PF00107 (ADH_zinc_N)
      • G3DSA:3.40.50.720 (G3DSA:3.40.50.720)
        Model: 3ukoA02
Author: Lu Shan & Lu Qiumei
Link: http://www.lslqm.com/2018/06/13/生物信息上机实验报告(四)-蛋白质序列分析/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.