܄

瀚海基因董事长贺建奎:大数据存储和分析依旧是基因测序的难题

【数据猿导读】 测序仪这个行业与大数据不一样,大数据是瞬间爆发,但做测序仪,通常是要五年才能做起来。目前在国内,测序仪并不算是主流业务,而且大量数据都只专注在基因组方面,所以未来该行业依旧面临两个难题:高通量测序技术和大数据的存储和分析

瀚海基因董事长贺建奎:大数据存储和分析依旧是基因测序的难题

6月16日,“魔方大数据之——基因大数据产业应用发展高层思享会”在上海贝壳社成功举办。超过70位国内基因领域顶级专家及国内外基因行业领袖企业代表共聚一堂,就基因大数据产业链各环节所面临的机遇与挑战进行了深度探讨。

本次活动由上海大数据联盟、数据猿主办,贝壳社、上海市生物医药科技产业促进中心、上海超级计算中心联合主办;得到上海市科技创业中心、上海市浦东新区科学委员会、上海众创空间联盟的大力支持。

以下是数据猿现场整理的“瀚海基因董事长贺建奎”的精彩分享:

贺建奎:非常感谢,也非常抱歉,由于飞机的原因,来的比较晚。我代表瀚海基因,来给大家介绍一下我们公司过去几年的发展情况。

市场上第一个出现的,不一定是最后成功的

瀚海基因,2002年创办,到现在已经有几年,我们主要从事基因测序仪的研发、生产和销售。在国内,这并不算是主流业务,因为测序仪属于整个行业的上游。就我个人来看,现在做仪表面临的挑战主要有两点,其中我们比较关注的是高通量测序技术,另一个是大数据的存储和分析。

高通量的测序技术已经发展了很长时间。1987年左右,自动化测序技术出现,产生第一代测序仪。2000年到2003年,二代测序仪推出。最先发明测序仪的人叫沃森宝,一个著名化学家。“第一个出现的不一定是市场上最后成功的”。后面的公司实施收购后吸取了第一家公司的经验,然后就在二代测序仪市场上占有了一定地位。

刚入行的人,你问他们用什么测序仪,他们可能只知道Illumina(第一代测序仪)。第三代测序是单分子测序,首先提出这个测序原理的是斯蒂文,他的公司2007年在美国纳斯达克上市,但是到2008年还没有开始销售就遇到金融危机,哪怕上市也融不到钱,后来卖了十几台试用机,一台150万美元,最后在金融危机下公司做空,直接做到50美分就“挂了”。美国有一个规矩,一项技术原理发布到某一公司,公司产生上百项专利,一项专利孵化一家公司。为什么现在市面上的测序仪公司,美国就那么几家,因为只有这几条技术路线被开发出来。然后说说我们公司,是怎么来的呢?当时我们在美国很难再做的更好,大家聊了很多,觉得失败是大环境引起的,但前景还是好的,所以我们决定回国做测序。

2014年刚开始的时候,大家都不相信我们能做出来,尤其是我们这么年轻的人,如果国家找几个院士来做可能靠谱一点。但幸运的是,有好的技术,就有好的成功方式,拿过来抄一下,这是过去十年来在中国比较成功的方法。当然,我们不是从美国拿回来技术直接用,而是重新开发,并得到了美国的支持。当时,大概有20个顾问,每月的顾问费都要几十万,所以我们觉得必须要从源头上拿到专利和人才。在深圳、上海,资本比较活跃,我们招来了最优秀的人才,有十几个博士,几个海归。

100美元做测序,这就是未来

测序仪这个行业,跟大数据不一样,大数据是瞬间爆发的,但做测序仪,通常是要五年才能做起来。做药品要十年,做创新的医疗器械是五年,从开始研发到最后全面占领市场,大概又五年时间。我们做这个事情的出发点在哪里呢?我们都知道测序仪便宜,越来越便宜。早在2003年测序仪就已经形成了市场,市场价是30亿美元,后来美国非常有前瞻性的提出了一个理念,他们要实现1000美元做测序,于是资助了很多公司做技术做开发,现在确实也接近1000美元了。

接下来,业界都在想,能不能100美元实现一个基因组测序?这是什么概念?1000美金,大部分的研究项目都可以测了,做研究嘛,不计较成本。任何一项新技术,首先都要在科研里面广泛使用,然后三四年后进入临床,在临床爆发应用。但在临床1000美元的价格也还是太高,那么什么价格合适呢?最好是100美元。这样每个人都可以做,普通人也能接受得了这价格。1000美元,一万人或几万人做可能没问题,但做到100美元,才属于普通人、上亿人都能做的测序。当然,这不是现在能实现的,五年之后才能实现。100美元测序,将成为每个人都可以做的事,这就是未来。

第一代测序价格是30亿美元,第二代是1000美元,一周时间可以测,第三代我们还没有实现。为什么第三代100美元就可以,而二代再怎么做都很难达到这一水平呢?这是因为云建设。如果PCR是上百万条,就需要大量的酶和试剂,耗材成本降下不去。第三代是单分子测序,可以从根本上降低成本。我们的任务是再过三五年,微量测序就是100美元的水平,这个目标只有第三代测序能实现。回到我们的产品,单分子测序平台,我们叫GenoCare,Care是关照的意思,现在已经逐渐从科研领域转向临床。在座的可以看到,三四年前是测基因组最黄金的时代,现在做一万个才有可能发现一个。这个基因测序的技术,跟所有的技术一样,在科研领域的应用是四五年以后,之后是临床应用,也是未来市场爆发的阶段。斯蒂文我很熟。2013年以前,他公司的市值是200亿美金,大家觉得他太牛了,但是后来发现,他的产品并没有在临床上应用。不能走到临床,就无法获得价值,这就是为什么被收购的原因?二代测序,或者三代测序,开始做的时候都有忧虑,但现在考虑这些是多余的,因为它确实可以用于临床,第三代是有持久发展前景的,会带来一段时间的繁荣。

这是我们做的测序仪,因为商业原因,展示的不是最后的产品,最终的设计10月才会公布,是我们在上一代基础上进一步设计的。三代测序仪拿过来就可以测,这是我们提供的解决方案,可以直接拿报告。去年10月,我们第一次做出样机,今年4月,做了第二批产品,还办了一个鉴定会,专门刊发两页文章报道这事。我们一直坚信只有最好的科学,才能有最好的公司,最好的产品。

这项技术到底有什么特点呢?可以做定位靶向测序。我们生产的测序仪上带有十个基因探针,测出的结果是一步式靶向测序;我们用的化学体系和Illumina完全不同,测序全程只用2种酶,而Illumina需6种酶。二代测序时间非常长,而三代测序第二天可以拿到结果,不仅时间短,还不需要PCR,解决了实验室建库成本高且使用者操作难度大的问题。PCR污染一直是临床试验一个非常头痛的问题,为了杜绝PCR污染,我们做了很多努力,现在它可以广泛的应用在很多地方。这是陈润生院士。我们做出来的产品跟专家们讲,他们都很高兴。

数据不标准,很难被再次挖掘

实际上我们正紧锣密鼓准备做云计算平台,这是什么意思?首先,现在产生的大量数据专注在基因组方面,我相信未来基因组领域里的数据量比现在想象的规模还要大很多。不知道大家有没有看过美国NCBI(美国国立生物技术信息中心)数据,化学类文章发表之后,通常会上传到文库,所以那上面收集了海量的基因组数据,一直是以指数级增长。那么为什么已经有这么多数据,还会有那么多公司自己收集数据呢?

一个基本的观点是,这些数据虽然多但不能用。做数据分析的有一个认知,“垃圾放进去,出来的也还是垃圾”,你要做一个好的分析,但数据来源是垃圾的话,出来的东西肯定也是垃圾。大数据是全世界各个国家提交的,零散、碎片化、没有标准,但是有量。如果不是统一的方法做出来,要进一步分析基本不可能。虽然数据多,但能用的真的非常少。没有标准的数据,不具备挖掘可能性,也可以说很难再被挖掘。再来看数据的统计或分析,数据越来越多,那又是什么限制了目前行业的发展?网速、带宽。无论你在哪里测,都要把数据寄回来。现在各地都可以买测序仪,每家医院都想买一台,测序仪已经进入了平民化时代,跟早年高大上的“形象”不一样了。几百万的测序仪,对很多医院来说,不是特别大的仪器。不过,很多地方想买测序仪,面临的困难是不仅需要有专人管理,还有再买一个服务器,除了要收集信息,数据处理方面也要有诸多投入。所以,云计算是未来趋势。未来的测序不只是化学的,还是生物学的,只有这样才能产生更深远的影响,影响这个社会,影响健康产业。

大家花一百万买个机器,又要买服务器,还要有人照顾,价格估计就要翻一番。该怎么办呢? 这就是我们想解决的事。测序仪做出来之后,五年之内全国所有三甲医院,CPC总数达到上千台,每一台都可以直接插网线,无论是在北京、上海、武汉、云南、深圳还是其它地方,测序过程中把所有数据自动上传到我们的Space上,意味着医院无需再花几十万做这件事。一天几千台测序仪同步上传,这是一个很大的数据存量。

那么分析该怎么做?我们提供的解决方案是,数据全部上传后,我们自己或者与他人合作开发APP,测试的时候点一下,自动化分析报告就能出来,包括标准化的400个分析,有PGS的,也有常见疾病的。我举的例子很少,因为我们只做了几个,但我觉得可以做几百个,我们希望通过合作把这个事情做起来。从用户的角度来看,不需要买服务器,不需要有专门的人做这事,只要完成这个测试,用非常简单的方式得到结果。其实医生并不想知道生物学的一些事情,他们只想知道数据的分析结果是什么,究竟这个病人到底有没有病。

注:本文由数据猿记者yilia(微信:zhangye1209)整理发布

更多精彩内容请点击:

WeGene陈钢:Genos基因组数据可以给用户带来收益

大咖思想碰撞:投资人眼中基因大数据产业的应用创新

聚道科技CEO李厦戎:如何从基因组数据流做到数据协作网络

相关视频:

魔方大数据:2016 基因大数据产业应用发展高层思享会


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部