主要研究成果


Promotor生物信息处理平台是一个基于"曙光3000"高性能计算机的生物信息并行处理平台,该平台集成大量国际通用算法以及我们自己开发的原创性算法,具有高度并行化、运行速度快、功能丰富的特点,适于海量数据处理;同时具有用户友好界面以及可视化功能,可以为生物学家提供良好的、高效的计算服务。


一套有完整基因标注的人类基因组序列,其基因识别的准确性及其在基因组中的位置(包括内含子和外显子的详细位置)的精确度都要达到90%以上,处于世界先进水平;


两个二级数据库,即:SNP和mRNA可变剪接位点数据库,涵盖范围主要为人类第三条染色体,特别是在我国所负责测序的区域,准确率要高于80%。


几个生物信息处理软件包,它们是有自己特色和独立知识产权的(基于自己发展的算法和编写的源码)、易用的(都有可视化友好界面)和高效的(基于曙光3000高性能计算机,实现并行化,能处理海量数据)。它们包括:

* 基因的电脑克隆软件包:该软件包既可用于大规模的基因电脑克隆,也可为用户提供从cDNA片段延长为全长cDNA的服务,可以通过调节拼接的条件来平衡敏感度和精确度的关系。其总体性能要达到国际上ePCR的水平,某些方面超过之。

* 基因相关的SNP分析软件包:该软件包通过和我们的SNP数据库的比较,可对用户的待分析序列中可能含有的SNP的位点和性质进行预报,准确率要高与80%。

* DNA序列综合特征信息分析软件包:除了可进行通常的分析(如同源性分析,寻找蛋白质编码区等等)外,还可对用户的待分析序列进行分维度、周期性、复杂度、(密码学)重合指数和唯一距等指标的加权综合分析,对序列属性(如:是否为编码区、重复序列、调控单元等等)做出预报,准确率达到国际先进水平。

* 蛋白质组数据分析研究软件包:分析方法建立在"系统学"和"控制论"的理论上,并以分析蛋白质的网络调控特征为目标,目前国际上还没有类似的软件,因此是独特和世界先进水平的。

实验室简介