蛋白质序列功能域

参考教材:《生物信息学》(第二版) 樊龙江 主编

蛋白质功能域

一条蛋白质序列中的一段保守区域,该区域能够独立行使功能、进化等。
在蛋白质结构中,是一个蛋白质结构的一部分,能形成一个紧密的三级结构,能独立折叠且结构稳定,同样具有独立功能和进化等特征。

功能域模型

目的:除了多序列联配的结果,用更好的方式描述功能域并应用。

一致序列consensus sequence

多序列联配结果中每一列出现最多的碱基或氨基酸构成的序列,是一条单一序列。

正则表达式regular expression

把每一列出现的碱基或氨基酸都列出而形成的。

概型profile

是一个类似PSSM的矩阵,但它可以包含匹配、错配、插入和缺失等情况。提供了多序列联配中每一列出现各种氨基酸(或空格)的概率(经过对数转换并取整数)。

HMM概型(隐马尔可夫模型)

用参数表示的用于描述随机过程统计特性的概率模型,是一个双重随机过程,由两部分组成:马尔可夫链和一般随机过程。
详情见书P381

熵与不确定性

信息量IC=2-H(H越大,IC越低)


公式

WechatIMG208.jpeg
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容