基因本体论

一、什么是生物学功能

根据Paul D. Thomas的说法,现在关于什么是生物学功能的讨论主要有两种:"causal role function"和"selected effect function"。

1、causal role function

此观点首先由Cummins[1]提出,其核心是描述包含在整体中的部分(部件)如何参与并贡献整体的能力。比如“心脏的功能是泵血”,其含义就是心脏作为循环系统的一部分,其功能是参与并帮助循环系统运输营养和物质交换。该观点的主要难点是如何系统地界定部件所在的整体。

2、selected effect function

该观点由Wright[2]提出,核心是一个实体的功能应该是回答这个实体存在的原因。其他人进一步解释为:在进化过程中,实体的哪部分影响是被选择的。这个观点的好处就是考虑了进化论,同时将实体的功能约束到受选择的部分,避免了主观上的定义。
两种观点的核心差异是它们尝试回答的问题:causal role function试图回答“运行”:一个实体如何贡献包含它的整体的能力;selected effect function试图回答的是“起源”:为什么这个实体会在那存在。从这里可以看出目前绝大多数生物学家接受的观点是causal role function。

经过分子生物学家改进的观点是:对于指定目的的特定的协调的活动(specific, coordinated activities that have the appearance of having been designed for a purpose)。所以生物学家都支持“biological program”这种说法,当这个程序执行时就产生功能,也就是说产生了特定的从进化上选择的影响。(个人感觉就是糅合了上面的两种观点)。一个小的低层次的生物学程序也可以融合到层次高的程序。如在低层次上,一个蛋白:由基因转录成RNA,然后翻译成具有特定结构的蛋白,该蛋白和其他蛋白互作行使功能;在高层次上,该蛋白形成的复合物能够调控其他物质的活动。

二、基因本体论

上一篇文章简要地介绍了本体论,基因本体论就是以结构化的方式用核心实体来表示生物学功能。这些实体主要分三个方面:Molecular Function(MF),Biological Process(BP)和Cellular Component(CC)。
MP定义了分子层面的过程或活动,
CC定义了该过程发生的特定区域,
BP定义了该过程更广范围的生物学过程。
这三个方面的关系可以用一个例子来说明:某个基因编码了一个蛋白,该蛋白在细胞的特定区域(CC)的分子层面执行某个功能(MP),而这个功能又是某个更大的生物过程的一部分(BP)。


GO 的结构

三、GO注释文件的主要内容

GO注释就是将一个基因产物或ncRNA与GO term相关联,同时提供这些注释的支撑信息。GO的注释信息储存格式有GAF(Gene Associatin File)和GPAD(Gene Product Association Data)两种,两种文件内容相同,只是信息表示方式不同。
注释文件的主要内容有:


Annotation Object(注释对象):某个基因、蛋白、非编码RNA或大分子复合体以及其他基因产物;
GO Term, Annotation Extension and Qualifier(限定词):这三个条目主要是对注释对象的功能进行说明。GO term包含MP,BP和CC,qualifier包含三个限定词:contributes_to, colocalizes_with和NOT,这不是必须的,但如果有能改变注释的意义;
Evidence Code and Reference Field:主要是注明支撑信息来源。主要包含实验支持信息或非实验支持信息。


需要说明的是基因本体论中的功能描述是关于现有生物学知识的“快照”,所以GO注释也只是关于基因功能的不完整的说明。

参考文献

[1]、Cummins R (1975) Functional analysis.
[2]、Wright L (1973) Functions.
[3]、The Gene Ontology Handbook

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • gene ontology 在早两个月前,按照班长的RNAseq教程,把整个流程模仿了一遍,最终得出很多差异表达的...
    Hypdoctor阅读 852评论 2 1
  • 本体是给定域内的知识体系的正式表示。本体通常由一组具有在它们之间运行的关系的类(或术语或概念)组成。基因本体论(G...
    Amy_Cui阅读 2,184评论 0 7
  • 首先,基因本体论(Gene Ontology)和基因文库不是同一概念。 我从下面几个方面讲一下GO的一些概 念和基...
    wangchuang2017阅读 38,952评论 2 41
  • 原书共371页,总计34万字,拆解版大约2.8万字,你仅需要2小时就能读完整本书。 《自私的基因》作者理查德·道金...
    惜她阅读 6,231评论 1 53
  • 作者用细腻的笔触构筑了一个小世界里渴望飞向上流社会的女子,最终精神屈服肉体,一次次的飞蛾扑火,最后只剩下阵阵毒药撕...
    一片诗阅读 180评论 0 0