推荐活动

细数2017-2018基因大数据分析领域的全球投资

首页 » 产业 » 企业 2018-06-21 美柏医健 赞(2)
分享: 
导读
上周结束的ASCO 2018年会可以说是精准医学在肿瘤领域的一次年中大盘点,而作为精准医学基础和关键所在的基因测序,与其中绝大多数的研究项目都有着紧密的关联。 随着第二代高通量测序仪的不断完善,基因测序成本大幅下降,必然带来基因数据的指数增长,那么对大数据如何安全、高效的存储和分析就成为了一项新的挑战。


1


基因大数据分析在基因测序产业链中的地位


基因测序产业链主要由上游基因测序设备制造厂商、中游测序服务机构及基因数据分析服务机构和下游医院、科研机构组成。从上游的发展来看,Illumina最新一代测序仪NovaSeq已经可以把单个基因组测序成本控制在1000美元以下。


▲ 图片来源:NIH


上游测序设备成本的下降,带来的是下游应用领域的扩张,尤其是临床检测领域。未来可能每个人都会有自己的DNA序列信息,就像血型一样成为个人医疗记录的一部分。截至2017年12月31日,中国有340家医疗机构经批准可开展产前诊断技术服务,可以预计基因测序数据必然大幅增加,而肿瘤领域的应用空间则更大,未来生成的数据已远非“海量”足以形容。


在上述几个因素的推动下,最终结果是市场对中游基因数据分析领域的需求激增。基因数据本来就是天生的大数据, 储存1个基因组就需要约60Gb的储存空间,大约1000个CPU时间来处理,更不用说还要把基因数据与全球医学文献、信息和药理数据库进行一一比对。


所以,未来基因测序的工作重心会从人工测序转到数据分析上,未来基因数据分析的价值很可能会超过测序本身。这个环节涉及到分子生物学、云计算架构、生物信息学等多学科,因此全球的大型测序公司科技公司都在利用自己的专长积极的布局基因数据存储分析领域,中国这个巨大的市场自然倍受关注。



2


近一年基因大数据分析领域的投资动向


相对于测序仪领域Illumina一家独大而言,基因数据分析领域市场集中度较低,可谓百家争鸣,别有精彩。


illumina



不过,首先还是要从Illumina说起。Illumina这两年积极布局基因产业链的中下游,自然不会放弃数据分析这个领域,三周前Illumina刚刚以1亿美元收购了Edico Genome,Edico Genome的DRAGEN™ Bio-IT平台——提供新一代测序(Next-generation sequencing, NGS)数据分析的加速解决方案。


该平台利用现场可编程门阵列(Field Programmable Gate Array, FPGA)技术以及专有的软件算法,可减少数据占用空间,并且缩短获得结果所需要的时间。之前美国瑞迪儿童基因组医学研究所(Rady Children's Institute for Genomic Medicine)打破世界纪录,成功地在19.5小时内对一个全基因组进行测序与分析,依赖的就是Illumina的测序仪和DRAGEN数据分析平台。


▲ 图片来源:Edicon Genome


中国市场方面,今年年初,Illumina的云计算平台BaseSpace终于在北京落地,该平台可以提供基因数据的存储、管理和分析,帮助企业提高测序能力。


BaseSpace在国内的运行由Illumina的合作伙伴光环新网技术有限公司负责,这是一家Amazon网络服务公司的合作伙伴,获得了ISO27001认证,符合中国的基因数据隐私和合规规定。BaseSpace是Illumina在大中华区市场除去之前的仪器和试剂销售,上线的一项新业务,从5年前就开始布局了,是Illumina在中国市场重要的一步棋。


aliyun


2015年英特尔、华大基因和阿里云三家企业共同推出大规模生物信息分析平台BGI Online,2017年5月英特尔再次宣布与博德研究所(Broad Institute)、华大基因及阿里云达成协议,将通过BGI Online为用户免费提供最新版的基因组分析工具箱GATK4(Genome Analysis Toolkit 4)的使用授权。过去完成3000份的全基因组数据分析至少需要6个星期,而应用GATK4,在两个星期内就可以同时完成1.5万个全基因组数据的分析。


华大基因这些年发展迅猛,早已由Illumina的合作伙伴变成强有力的竞争对手,自然要完善基因检测产业链的每一个环节。作为一个简单、高效、安全的基因数据分析平台,BGI Online堪称基因行业的“应用市场”,该平台可以为研究机构、药厂和临床实验室等用户提供基因组学的数据和应用,满足行业需要。


用户可以在BGI Online上访问自己的数据,获取标准分析结果,也可以定制个性化的数据分析方案,并与其他授权用户分享数据和成果。依托部署在阿里云计算平台的服务,BGI Online更轻松地拥有了处理大规模基因组数据分析的能力。


合作过程中,阿里云为华大基因提供企业级支持服务和专家服务,保障华大基因的云上业务搭建与运转。包括指导产品选型与使用技术、提供应用性能管理(Application Performance Management,APM)报告及相应性能的分析优化;排查整改系统安全隐患、对生产高峰的任务支持进行专门保障。从曾经3-4天才能输出一人基因分析,到如今实现了22小时内千人基因组分析。



英特尔公司除了与华大合作之外,还与上海交通大学、上海市儿童医院,香港大学,北京诺禾致源生物信息科技有限公司,以及北京荣之联科技股份有限公司签署战略合作备忘录,合力推动精准诊断、疾病预防等服务的落地和实践。


2017年6月,英特尔和上海市儿童医院宣布启动儿童健康协作云中心,这是一个开放式平台,目的是把儿童遗传基因组研究和数据交换应用于临床。该平台已在上海市儿童医院、联盟医院和上海交大生物医学转化中心上线。上海市儿童医院和联盟医院利用该平台,在不同站点之间对儿童发育迟缓案例进行基因变异识别和比较。


英特尔在合作中最大的贡献是,显著提高了基因组分析速度,通过硬件和系统解决方案,将测序和处理时间显著降低,可以在24小时内实现精准医疗的主要过程,包括数据采集、分析、找出病因、给出个性化的靶向药等等,不过目前成本还比较高。英特尔公司全球副总裁兼中国区总裁杨旭曾称:“2020年要把24小时内完成一个人全基因分析的费用降到500美元。”我们拭目以待。


Google


2007年至2015年间,谷歌投资了多家医疗健康领域的公司,其中一家就是致力于打造云端基因数据库的创业公司DNAnexus。


该公司2011年A轮融资的风险投资方为Google Ventures和TPG Biotech。今年1月,DNAnexus正式完成5800万美元E轮融资。E轮融资由Foresite Capital领投,微软、GV(原谷歌风险投资公司)、TPG Biotech、药明明码(WuXi NextCODE)、Claremont Creek Ventures和MidCap Financial跟投。其中,药明明码是继2015年4月其集团公司药明康德投资继续跟投DNAnexus。


除了投资之外,Google 同时也推出自己的Google Genomics数据存储服务,用于收集基因组数据。到目前为止,谷歌基因组平台上已经整合了许多公共数据,包括1000基因组计划、Illumina Platinum Genomes和MSSNG Database for Autism (自闭症)Researchers等。


此外,基因数据创业公司Tute Genomics也把自己大量的数据公开在了谷歌基因组上,包括基因组数据和差异的注释结果。任何谷歌基因组的用户都可以查询或将自己的数据与公共数据进行比对。


多年前,DNAnexus就开始与国内的药明明码(药明康德集团旗下企业)等公司合作,为药厂、科研院校等机构提供基因大数据的云平台服务。2015年4月,中国药明康德公司向DNAnexus注资1500万美金,作为交换,DNAnexus公司将助力药明康德公司在基因组数据云端存储和基因分析处理等方面的研发工作。


合作后,药明康德公司独有的基因组学数据库模型、临床和研究接口可以直接放置在DNAnexus云端使用,用户可以在同一平台上存储、展示测序数据,并且与全球同行共享。这两次的投资,既加强了药明康德在基因组领域的实力,也让DNAnexus公司的业务范围开始拓展到无限潜力的中国市场。


DNAnexus建立在Microsoft Azure和亚马逊网络服务的基础之上,并拥有可扩展的基础架构,可通过“单一平台”立即满足各类计算和数据存储需求。为了保证数据能够快速上传至云端,DNAnexus提供多种方式上传云端数据。


用户可以使用命令行上传;通过网络平台上传;从URL获取;或者通过DNAnexus API直接上传。除了丰富的统计功能,DNAnexus平台还允许医疗机构开发新的分析工具。DNAnexus平台可以说是代表了未来DNA数据储存和分析的方法,巧妙地将云计算基础设施、灵活的系统设计和专业的生物信息学结合在一起。


Microsoft

自2016年,微软也全面展开了其在医疗领域的布局,今年对DNAnexus的投资再次展示了它的野心。投资DNAnexus项目也为Microsoft Genomics发展铺平了道路, Microsoft Genomics提供一种易于使用的Web服务,用于分析比较用户的基因组,这一服务比传统手段要快数千倍,而且遵循麻省理工学院和哈佛大学Broad研究所确定的一致性和准确性准则,这些特性都使其可以广泛应用于癌症、罕见疾病、大健康和精准医疗领域。


IBM



IBM Watson是认知计算系统的杰出代表,Watson health板块中与基因大数据相关的项目包括:Watson for oncology、Watson for genomics、Watson for drug discovery。


2017年3月末,IBM将Watson Health(沃森健康)的Watson for oncology(沃森肿瘤解决方案)3年独家总代分销权授予中国本土企业百洋智能科技,借此共同推进肿瘤基因组分析于中国市场的落地应用。今年,IBM与百洋智能科技又把独家总代分销权从3年延长到8年。


Watson基因解决方案可以读取基因组测序数据,并将这些数据与大量的临床、科学和药理数据库进行比较,为执业医师提供分析工具,通过由临床医生上传的已删除个人身份信息的患者肿瘤活检测序结果,对患者的基因组数据执行分析,发现与患者病情发展情况相关的DNA变化,并针对这些变化提供更为精准、有理有据的可选治疗方案报告,供医生参考、判断基于患者的致癌因素变化的治疗方案或标准治疗方案。


Amazon


作为全球最大的云计算公司,Amazon与Google在基因大数据处理领域的竞争可谓激烈。Amazon除了给多个生物信息公司提供网络服务外,与Google一样也为知名基因组项目提供免费云存储服务。根据分析师、基因科学家和公司披露的相关数据,亚马逊云服务可能略胜一筹。


亚马逊为Multiple Myeloma Foundation的项目提供存储服务(该项目旨在为新型药物靶标提供病人的基因信息)。亚马逊还赢得了Alzheimer's Disease Sequencing Project项目。美国制药公司Regeneron Pharmaceuticals和医疗机构Geisinger Health Systems合作测序了250,000个基因组序列。这些DNA数据也被上传到亚马逊云服务。




3


结语


基因组医学代表着一个尤为重大的机遇,因为数据的规模和复杂性是前所未有的。目前,全球共有100多家生物信息公司从事基因数据的分析和处理。这些开源的基因组云数据平台,在为基因公司和研究机构提供便利的同时,也收集到了大量的基因数据。


当数据库越发完整和壮大后,更多的疾病将会与基因直接联系起来,而基因药物的研发也会得到极大的帮助。但是现阶段生物信息公司业务往往大而杂,专注某一医疗领域的生物信息公司(如精准癌症)少之又少。国内市场专注基因组数据分析的生物信息公司也还很少。


据统计,2017年中国基因行业融资总额超过90亿,同比增长超过60%,融资阶段整体趋于B轮,天使轮数目降低;2018年基因检测行业火爆程度持续高热。然而,2018将会是逐步拉开差距的开始,未来几年会在基因检测的上、中、下游的各个细分领域,出现一批具有一定优势的企业。


届时,会不会有专注于基因大数据分析的中国公司脱颖而出呢?中国投资方又能从中获益多少呢?让我们静观其变吧!







参考资料:

1.全球精准医疗产业链解析之基因测序(https://www.jianshu.com)
2.2017年中国基因测序行业产业链及政策汇总(https://www.qianzhan.com/analyst/detail)
3. With Edico Buy, Illumina to Focus on Rare Disease Diagnostic Sequencing Market (https://www.genomeweb.com/sequencing)
4. Business Report:Marketing to the Big Data Inside Us(https://www.technologyreview.com)


本期作者:田雨
毕业于北京大学口腔医学院,2010年于北京大学获得博士学位。2017年于美国贝勒牙科学院访问学习,从事口腔多基因遗传病研究,对行业分析和相关技术前沿有浓厚兴趣,长期关注基因行业的市场动向。现任美柏医健研究员。

(转化医学网360zhyx.com)


评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发

相关阅读