| |
随着大规模测序技术的日趋完善,生物学的各种实验数据正以指数级速率增长,成为海量甚至天量的数据库规模。对这些数据的整理、分析和发现有用信息必然要求存储量大,运算速度快的高性能大型计算机。 目前生命科学发展的主要瓶颈也正在于此。华大基因投巨资引进了由国家智能计算机研究开发中心研制的曙光3000型大型计算机,是目前国内性能最高、运算速度最快的超级服务器。该系统峰值浮点运算速度为每秒4032亿次,内存总量为168GB,磁盘总容量为3.63TB。它具有先进的体系结构,丰富而完善的软件系统和一大批行业应用软件。 它在整体上达到了当前国际先进水平,部分技术如机群操作系统和并行编程环境等达到国际领先水平。曙光3000的到来加上原有的曙光2000计算机,从硬件上保证了杭州华大在生物信息数据处理、分析能力上领先的优势地位,加上自己研究开发的分析技术和强大的研究队伍,使我们在基因组信息学研究领域中处于国内遥遥领先,并跻身国际先进行列的水平。
杭州华大基因研发中心生物信息部由一批生物信息学 、基因组学和计算机技术领域的青年科研人员组成,工作人员中还包括一部分浙江大学生物信息学专业的研究生,同时聘请中科院郝柏林院士、浙江大学叶修梓教授等专家为各相关领域的首席科学家,指导部门工作。
目前由部门使用和管理的高性能运算设备有IBM p690服务器、曙光3000超级计算机、Sun 4500服务器以及多台小型服务器组成的集群,这一高性能运算平台为从事大规模生物信息分析和数据处理提供了条件。
生物信息部参与了人类基因组计划中国部分的分析工作、超级杂交水稻基因组计划、中(国)丹(麦)家猪基因组和EST计划等一系列大型科研项目,独立承担了国家自然科学基金重大研究计划(真核生物重要生命活动的信息基础)课题“动植物基因组中可变剪接形式的比较分析”,以及沙门氏菌基因组、黄单胞菌基因组、水稻EST等一批项目,在科研领域取得了一定成果。部门还积极与国内外科研机构合作,为中科院海洋研究所、动物研究所、广西大学、中山大学、南京林业大学、浙江大学、台湾长庚医院等提供生物信息分析服务。通过这些科研项目和技术服务,培养出一支高素质的人才队伍,建立了成熟先进的技术平台。
在系统总结以往工作经验的基础上,我们开发了多个生物信息学软件,包括BLC(Bioinformatics on Linux Clusters)系统、EST Analysis Pipeline系统等,这些软件整合了一批常用的生物信息应用软件,提供了统一的界面和切实有效的分析流程,大大降低了使用难度,简化了分析过程。这些软件已取得计算机软件著作权,并提供给国内一些科研单位使用,为生物信息学研究在国内的普及和提高做出了贡献。此外,生物信息部还开发了实验室管理信息系统,具备数据库、网站开发服务能力,并正在向更多的领域,如医学服务软件等方面拓展。
杭州华大生物信息部目前可以提供的服务和软件包括:基因组分析、EST和SAGE序列分析,蛋白质三维结构预测,以及其它高性能运算服务,BLC系统,EST Analysis Pipeline系统等。我们期待着为来自全国各地和世界各国的合作者提供更好的服务和产品,一起推进我们的事业。

|