编者按:
自年美国总统奥巴马提出“大数据”(BigData)以来,生物大数据如火如荼地发展。通过高通量测序,我们已经积累了庞大的基因数据,通过移动互联网,我们也获得了海量的健康信息。这些数据的应用,将为疾病的诊断、分型、医药开发提供新方向以及新工具。然而如何分析基因以及健康数据,是横亘在大数据本身与解决健康问题之间难以逾越的鸿沟。不过有一点我们可以确信:当大数据分析的精度越来越高时,我们对疾病发生的过程就会有更深入的了解。
编译
翟文珠
责编
叶水送
● ● ●
21世纪初,人类基因组计划(HGP)发布了第一张人类基因草图,人的基因组约有30亿个碱基对,意味着每一个人的基因组有3Gb以上的数据。该计划曾与上世纪的曼哈顿计划(原子弹制造)、阿波罗登月计划并称为三大科学计划,为本世纪的一个里程碑式的科学工程。
15年过去了,基因组测序技术发展之快已经超乎人们的想象。十年前,这项技术还只是实验室中一个“迷人”但又昂贵的研究工具。现在,它却已经渐渐步入医疗界,成为一种略显“尖端”的诊断技术。该技术也引领生物医学领域进入大数据时代。
早前,曾有人预言,当个人基因组测序费用下降到美元时,就标志着我们的医学将进入个体化医疗(PersonalizedMedicine)的时代。现在,这个目标已基本达到,随着这项技术的迅猛发展和成本的扁平化,它已经开始给我们带来了庞大的数据,包括基因组、蛋白组等各类组学(omics)的出现,也带来了不少数据。
1海量数据的产生刚过去的七八年间,我们储存的个人基因组数据量已达到规模,这个数量如此惊人,且这只是刚刚开始。每年Illumina公司的HiSeqX10测序仪已经可以完成超过人的基因组测序工作,该测序系统已分布在全球顶尖测序中心,每天产生大量的数据。英国年也启动了“十万人基因组计划”,美国和中国则宣布要完成多达一百万人的基因组数据收集工作。
?基因测序数据正在以更快的速度翻倍。年以后,以历史累积的测序数据来看,每7个月就能翻一番,Illumina仪器测序所得的数据,每12个月就能翻一番;如果仅以摩尔定律来看,每18个月数据量就能翻一番。这种情况将带来一个巨大的“数据黑洞”。图片来自nature.北京治白癜风的最好医院在北京治疗白癜风哪个医院最好
转载请注明地址:http://www.qwhcm.com/zcmbzl/2783.html