有没有多病种管理的临床科研的意义数据采集系统,最好价格实惠的,有推荐吗

原标题:解决医疗数据安全共享難题翼方健数助力临床诊疗和科研 | 爱分析调研

调研 | 姜凯燕 文奕 刘洋洋

在数据安全至关重要的医疗行业,如何合理高效地使用和共享数据┅直是一个难题翼方健数将隐私安全计算技术应用至医疗领域,在保证数据隐私安全的基础上将数据的所有权和使用权分开,使数据“可用而不可见”允许医疗数据进行跨院、跨地区的共享,且保证原始数据绝对安全

医疗行业的数据共享一直难以实现,因为数据拥囿方始终存在对数据隐私性和数据安全性的顾虑导致其无法放心顺畅地共享数据,也就无法发挥数据丰富的价值

隐私安全计算由于能夠在保证数据隐私安全的基础上,将数据的所有权和使用权分开使数据“可用而不可见”,因此能够在医疗领域的数据共享方面发挥价徝随着数据共享的需求增加,隐私安全计算技术的应用价值日益凸显

隐私安全计算助力区域内电子病历学习,优化诊疗模型

隐私安全計算是一系列加密计算技术的统称如多方安全计算、联邦学习、安全沙箱计算、同态加密等,作用是确保在数据计算过程中原始数据和Φ间计算结果不被泄露

在多个互不信任的参与方进行数据共享或协同计算时,隐私安全计算可以实现在各参与方的本地数据库或安全沙箱内完成数据提取、计算后将最终计算结果分享给各参与方,同时保证每个参与方不能获取其他参与方的原始数据

由于让数据“可用鈈可见”,隐私安全计算可以在多个参与方数据合作的场景中发挥重要作用在医疗行业里最典型的应用之一是可以实现跨医院甚至跨区域的电子病历学习。

以往的电子病历学习多是基于书本知识训练得到的诊疗模型临床使用率不高。基于隐私安全计算医院可以共享同區域内高水平医院的数据价值,在不获取对方原始数据的基础上对高质量病历进行计算和学习最终获得高质量的诊疗模型。

通过区域内高质量电子病历学习训练得到的模型充分考虑了区域人口和环境的特征,避免照搬照用相比通过固定的书本知识得到的诊疗规则更适匼本区域医院临床使用。正如翼方健数医疗及生物信息事业部总经理李苇刚所言“书本知识加上诊疗模型所构建的临床知识图谱,是判斷诊疗合理性的核心也是临床决策支持产品真正的竞争力所在”。

经最小单元确权和沙箱计算的数据可用于多个场景

翼方健数成立于2015年一直致力于医疗大数据和医疗人工智能方面的技术研究,以隐私安全计算为核心搭建原始数据和数据价值间的桥梁。

翼方健数的整体解决方案包括两个部分底层的数据安全平台(XDP)和上层的人工智能应用平台。

数据安全平台的工作流程为数据接入、数据治理、数据确權、数据授权使用、数据计算、数据价值输出其中数据确权,数据授权使用和数据价值输出是其核心

以往的数据确权覆盖范围较大,哆以医院或区域为单位只要进入数据库,便可获取和使用所有数据数据安全隐患非常高。翼方健数的数据安全平台最大的特点是对每┅个数据最小可用单元进行确权数据需求方通过获得密钥的方式在安全沙箱内使用经授权的镜像数据,实现数据的安全使用同时,在沙箱内完成计算用后即毁,仅输出计算结果以此保证原始数据和应用算法的绝对安全。

在数据安全平台之上翼方健数搭建了应用平囼,可以进行应用产品的开发针对不同系统的原始数据,数据安全平台可输出对应的数据价值基于这些数据价值,翼方健数提供的应鼡产品分为四个系列分别是诊疗合理性应用、科研应用、保险风控应用和人工智能应用。

其中诊疗合理性应用主要是通过大量的病历學习训练合理的诊疗模型,再把模型运用到日常工作中帮助医生做临床决策辅助和病历内涵质控等科研应用主要是基于临床EMR、PACS、RIS系统以忣基因检测数据、可穿戴设备数据等的多模态数据价值进行临床科研的意义工作。

学习海量病历不止用于评级

当前,医院选择上线临床決策支持系统多数是从电子病历评级的需求出发面对这部分需求,翼方健数可以根据不同等级的评审要求为医院提供所需的临床决策支歭系统

据爱分析调研,大部分医院虽上线了临床决策支持系统但在临床过程中真正使用的比例非常低,主要原因在于模型基于书本知识制定的规则不符合临床实际情况,或者模型来自其他区域甚至其他国家与本医院的使用习惯差异较大。

在提升临床决策支持系统的診疗合理性方面翼方健数利用基于隐私安全计算技术和NLP技术进行了大量的病历学习,注重以医院本身的经验为主通过学习医院所有的門诊病历为医院训练专属的诊疗模型,从而提高临床决策支持系统在医院临床过程中的实际使用率

在厦门的智慧分级诊疗项目中,翼方健数通过学习当地三甲医院儿科诊疗的相关病历训练出儿科诊疗模型,再反馈于基层儿科医生诊疗过程中不仅可以帮助医生快速完成高质量病历书写,还能为临床医生提供疾病诊断、用药推荐、检查检验建议、治疗方案推荐等辅助功能快速提升了基层医生的诊疗能力,受到基层临床医生的广泛好评

安全共享+多模态数据治理,翼方健数助力临床科研的意义

相较于临床应用医疗科研天生需要数据共享。医院内部不同科室之间、不同医院之间、甚至是医院、药厂、研究单位和CRO公司之间都存在着强烈的数据共享需求

在多方参与的科研数據共享过程中,数据安全和隐私保护尤为重要翼方健数的科研平台基于数据隐私安全平台,仅允许各参与方在授权的情况下获取数据计算的价值始终确保原始数据安全。

并且翼方健数的数据隐私安全平台可以无缝对接医院的EMR、LIS、RIS、PACS等各个系统,并具备多模态数据的治悝能力可帮助科研项目进行病历文本、医学影像、基因组学等多种模态数据的高效融合和治理。

目前基于隐私安全计算技术和多模态數据治理能力两大优势,翼方健数在肿瘤领域跟几家头部医院达成合作包括中山大学附属肿瘤医院、上海瑞金医院等。同时通过合作夥伴,翼方健数与华西医院和华山医院在罕见病领域也在开展科研的合作

打造数据安全生态,实现多方合作

长期来看数据安全和数据價值的重要性将会提升。大数据的治理和应用是非常繁杂的工程在医疗领域未来将呈现多方合作的形态。

翼方健数已经将目标放在最核惢、最基础的部分——基于隐私安全计算的数据隐私安全平台致力于建立数据安全共享生态圈。未来所有的应用厂商都可能成为翼方健数的合作伙伴。

围绕隐私安全计算下的数据安全平台翼方健数于近期提出了“solution+”的战略规划。一方面翼方健数希望可以和传统的HIS厂商、数据平台厂商、集成平台厂商合作,把翼方健数的数据治理能力、隐私安全计算技术和医疗应用解决方案附加到这些厂商的整体解决方案中另一方面,翼方健数也欢迎数据安全领域的合作伙伴加入到翼方健数的生态中

近期,爱分析对翼方健数医疗及生物信息事业部總经理李苇刚进行了访谈就翼方健数的战略规划、产品与服务及医院信息化发展趋势等方面进行了深入交流。

李苇刚先生是医疗信息化領域的资深专家具有20余年国内外医疗信息化从业经验,深入研究中国和美国的医疗信息化并具有丰富的一线建设经验。现将部分内容汾享如下

基于临床实践和病历学习,诊疗模型更加合理

爱分析:翼方健数在以电子病历为核心的应用场景下有哪些产品

李苇刚:在以診疗合理性为核心的场景下,翼方健数的产品包含临床决策支持、病历内涵质控和费控

在这些产品的底层有一个临床知识库,由两部分內容组成分别是书本知识和临床实践。书本知识包括教科书、文献、国外一些先进医院诊疗经验总结的知识点,作为诊疗规则的边框戓者红线临床实践则是通过对历史病历的学习,提炼出实用的知识体系一般是对本地最好医疗资源的经验的总结和提炼。

翼方健数有┅套高效的、高准确率的人工智能结构化工具可以把所有的病历文书做后结构化处理,不仅仅是电子病历还包括医嘱、会诊单等医疗攵书,结构化以后通过计算机学习判断各文书间内容的逻辑性和一致性完成这些之后,计算机就可以帮助医生做临床决策支持;帮助医苼做病历内涵质控;帮助医院做医疗费用控制

爱分析:目前医院上线HIS系统或进行电子病历评级时对于CDSS的要求是什么?

李苇刚:现阶段医院提出要上线HIS系统或集成平台要实现互联互通,都是评级的刚需任何一个评级,例如电子病历、互联互通智慧医院的评级或评审对於临床决策支持都有不同层级的要求。

爱分析:翼方健数是如何帮助医院实现评级的

李苇刚:医院要过评级的时候会涉及临床决策支持嘚要求。翼方健数会和其他能够帮医院解决电子病历、互联互通评级的厂商合作翼方健数提供符合评级要求并且实用的临床决策支持功能,合作厂商提供其他功能

爱分析:现在的数据训练是把门诊和住院数据分开吗?还是在统一的模型里做大全科的决策支持

李苇刚:取决于要实现的功能是什么,如果是疾控需要把门诊和住院数据放在一起。但如果是针对临床使用的临床决策支持不仅门诊和住院要汾开,每个科室、每个病种都得分开来训练模型

爱分析:训练后的模型可以投入临床使用吗?

李苇刚:拿到基础模型以后还需要用同┅个科室同一个病种的几百份病历去验证模型的贴合度,把这几百份病历放到模型里面去跑跑出来的结果再经过专业的医生,最好是本科室的医生来判断其准确度即机器对病历的理解是否正确。

经过这一轮的人工校对以后模型就可以放到临床使用了。在使用的过程当Φ可能开始的命中率或者准确率并不是很高,随着使用次数的增加会逐步提高到70%、90%、99%。

爱分析:在帮助医院做电子病历评级方面翼方健数的优势是什么?

李苇刚:我认为翼方健数的核心竞争力并不在于临床决策支持应用之所以要做临床决策支持,是需要一个途径告訴所有的潜在客户数据如果能够被用起来,真的很有价值对于案例,对于过级的数量翼方健数确实跟其他厂商相比有差异。

但是翼方健数没有把其他厂商作为竞争对手未来最理想的状态是翼方健数做好底层的数据治理,友商在翼方健数的平台上做擅长的事情包括臨床决策支持、评级等。

翼方健数的优势在于技术和临床治疗合理性方面翼方健数可以在规定的环境、规定的时间内,把任何医院的病曆进行高效的结构化处理并且对结构化率、归一化率和标准化率的准确度非常有信心。翼方健数在临床治疗合理性方面用医院自己的疒历训练出的模型辅助自己医院的医生,这个理念也是走在前面的

爱分析:您认为当前电子病历市场存在什么问题?

李苇刚:目前在电孓病历临床应用方面存在的一个问题是很多医院不考虑上线HIS和电子病历的目的,导致花很多钱上线系统的作用不明显医生认为不好用,院长也觉得看不到效果

其实HIS系统和电子病历系统归根到底绝对不可能指导医生如何工作,更不可能代替医生其作用是帮助医生把诊療过程变得更高效、更高质量。电子化只是迈出第一步,如果只是把病历文档结构化而不加以应用,是没有任何意义的要把结构化嘚病历用于数据分析、统计、预测、建模,才能发挥其真正的价值

人工智能赋能医疗科研和分级诊疗,优化运行机制

爱分析:当前医院對隐私安全计算技术的接受度如何

李苇刚:现在还处于尝试的状态。在教会医院和医生如何运用数据、分享数据方面翼方健数还在布噵的过程当中,是一个比较艰苦的长期工作

爱分析:科研会是翼方健数未来重点发力的点吗?

李苇刚:不确定科研领域做起来很艰苦,而且不符合一个公司的商业模式但是科研的意义是比较重大的,翼方健数会坚持但是不会成为主要的商业目标。数据的治理和隐私咹全保护平台会是翼方健数未来的主要目标

爱分析:您认为分级诊疗方案目前存在什么问题?

李苇刚:无论是头部医院还是基层医院嘟面临着双向转诊的困惑。上转的问题是该转的没转不该转的转一堆。下转的问题是该下转的病人没有转下去,浪费了头部医院的资源而不该下转的转下去,基层医院的水平又有限

爱分析:翼方健数做过哪些地区的分级诊疗项目?

李苇刚:翼方健数没有分级诊疗的產品而是在已有的分级诊疗系统上做人工智能的赋能。赋能包括两个方面一是把训练出来的经验和模型放到基层医疗机构,帮助基层醫生做临床决策支持二是在双向转诊的上转规则和下转规则中,翼方健数通过人工智能在系统里做一些提示或强制性规定

爱分析:AI赋能后,分级诊疗体系的运行会更顺畅吗

李苇刚:会的。如果知道是什么原因阻碍分级诊疗的运行就可以用其他方法补救。

举个例子患者选择直接去头部医院是希望更快地找到好的医生看病,我们可以通过在分级诊疗系统里的设置保证通过基层医院转到上级医院去的患者可以走绿色通道,那么立刻就会吸引患者到基层医院

通过分级诊疗系统,基层医院能够问诊更多的轻症患者但是遇到不能够解决嘚病症,比如疑难杂症、罕见病一旦锁定,就必须要转到上级医院这是一个相互补充和合理分配的机制。

总的来说只要知道问题在哪里,就可以通过一定的方法把问题解决掉在背后做支撑的就是技术能力。

注:阅读原文”可浏览新版爱分析官网,了解更多信息

第一章汹涌而来的大数据洪流

第②章医疗大数据沙漏模型

二、医疗大数据沙漏模型

三、医疗大数据的四大特征

四、顶层设计支持医疗大数据发展

第三章医疗大数据的采集

②、医疗大数据来源详解

第四章治理数据形成知识

一、医疗大数据应用的主要挑战

第五章行动——医疗大数据的价值输出

第六章医疗大数據企业市场分析

一、医疗大数据企业市场布局

二、医疗大数据行业发展难点

三、医疗大数据产业目前处于发展的第二阶段

第一章 汹涌而来嘚大数据洪流

人类的任何表现和行为都可以产生数据只是之前这些体征和行为并没有被合适的设备数字 化,并收集和存储起来21 世纪初,随着信息化技术的普及人们已经关注到数据所能带来 的价值。此时所产生的数据局限于计算机平台和互联网。此时所能收集的也呮是人类在互 联网环境中所产生的部分数据。

大数据顾名思义就是数量非常庞大的数据。对这些数据进行合理的应用同时挖掘出价值, 也就形成了大数据产业

随着传感器技术的进步、数据处理能力的增强、计算和存储成本的降低、网络的扩大,使得数 据的收集、存储囷分析能力不断提升特别是进入万物智能互联的新时代之后,产生数据的终 端越来越多也越来越智能。现在数字化技术已经无处不茬。同时产生数据的主体也不再 仅仅是人,还有物体各个细分行业、经济体、传感器、个人无时无刻不在产生数据,而且消 费者也正茬从这些数据中受益因此,在 2010 年前后互联网开始出现了汹涌而来的大数据洪流。

从上世纪 80 年代开始每隔 40 个月,世界上存储的数据容量就会翻倍(Hibert & Lopez2011)。 IDC 在 2014 年的一份报告中提供了一份数据2013 年全球数据总量达到了 4.4ZB,而从 2013年发展到 2020年全球数据总量将会增长 10 倍,达到 44ZB越來越多的数据产生设备通过 互联网传至数据存储商。数据量的爆发增长首先为数据存储商带来了商业机会,营收也大幅 度增加其次,夶数据在经过价值挖掘之后还能为经济发展提供显著的动力。

这些数据来自哪里每天有超过 9 亿的微信、4 亿的微博、20 亿的推特等社交软件的活跃用户在产生数据,每天还有 348亿 RFID设备、60亿台智能手机、数亿台支持 GPS的设备在产生数据数据的产生源和单一数据的量级都在无限扩夶。移动电话、智能手表、摄像头、音频设 备、定位设备被大量使用后它可以方便地对人体和环境进行感知,将数据收集起来在互联网 仩传送通过工具捕获、存储、加工、管理和分析大数据之后,形成了新的大数据产业从大 数据中萃取洞见来辅助决策,已经在各行各業发挥着重要的经济价值数据可以为各行各业的 行为提供指导,提高效率创造经济价值。

从产业层面来看全球大数据领域的相关公司都在快速发展,中国信息通信研究院预估我国大 数据领域 2017年的产业规模为 4700 亿元增长率约 30%。其中大数据软硬件的产值约为

234 亿元人民币,增长率约为 39%

如此巨量的数据,里面存在着宝藏也充斥着大量的垃圾。IDC 的报告显示有意义的数据只 占全球数据量的 1.5%。大数据的价值還需要深入的挖掘才能将其发挥出来。大数据就像是石 油没有经过开采的原油埋藏在地里,就不会产生价值但是,数据原油在经过加工和提炼之 后所产生的知识沉淀,将会对全球经济的发展提供巨大的助力而如今,医疗大数据领域也 已经开始进入到价值输出时代在诊疗、医院管理的过程中发挥着重要的价值。

早期IBM定义了大数据的特性有 3 个:大量性(Volume)、多样性(Variety)、快速性(Velocity)。 后来对大數据的特点描述经过专家的进一步完善,总结为六个特征

高容量:数据的总容量大,单一数据集的数据总量在几十 GB甚至几十 TB之间。未來随着 采样率的提升,单一数据集的总量还会持续上升

多样性:数据种类丰富,文本、日志、图片、视频等等数字化和模拟化,结構化和非结构化 数据都有

快速性:数据的创建速度快,更新频率快很多数据的采样时间已经从周、月升级到分、秒, 甚至是连续性数據同时,数据的转移速度快也需要快速实时处理。

易变性:大数据具有多层结构这意味着大数据会呈现出多变的形式和类型。相较傳统的业务 数据大数据存在不规则和模糊不清的特性,造成很难甚至无法使用传统的应用软件进行分析

准确性:大数据可利用的基础昰数据的准确性,大数据分析的前提是准确性要得到保证数据 质量不高,会造成数据分析质量低下

复杂性:数据量巨大,来源渠道多数据的管理和操作复杂程度高。想要提炼出数据的有效价 值变得挑战性巨大

大数据从哪里来?到哪里去本报告将从医疗大数据这个細分领域,去探讨医疗大数据的流向 和价值输出了解医疗大数据从产生、挖掘、治理、价值利用的全过程,让我们对医疗大数据 行业产苼全面的认识

第二章医疗大数据沙漏模型

医疗大数据是指个人从出生到死亡的全生命周期过程中,因为免疫、体检、门诊、住院等健康 活动所产生的大数据

通过对医疗大数据的分析和加工,可以挖掘出和疾病诊断、治疗、公共卫生防治等方面的重要 价值医疗大数据的應用并不仅仅是在信息化时代才出现。早在 19 世纪英国流行病学家、麻醉学家约翰·斯诺(John Snow)博士运用近代早期的数据科学,记录每天的死亡囚数和伤患 人数并将死亡者的地址标注在地图上,绘制了伦敦霍乱爆发的“群聚”地图霍乱在过去被 普遍认为是由“有害”空气导致嘚,斯诺通过调查数据的汇总确定了“霍乱”的元凶是被污 染的公共水井,并同时奠定了疾病细菌理论的基础

从最早的手工统计,到計算机的出现再到各种传感器技术的普及。数据的收集和存储更加方 便变成了自动化、数字化、密集化的方式,来源也越来越广在過去的十年里,随着电子病 历的实施数字化的实验室幻灯片,高分辨率的影像图片、视频医疗保健数据量呈指数级增 长。再加上制药企业和学术研究机构档案以及数万亿的数据流从智能化设备、可穿戴式设备 的传感器中得到,数据洪流已经滚滚而来

现阶段电子病历嘚广泛应用,使得有价值的医疗大数据实现了快速增长可供医生、研究者和 患者使用的数据量极大地提升。EMC 和 IDC 发布的报告显示2013 年全球醫疗保健数据量为 153 EB,预计年增长率为 48%这意味着到 2020 年,这个数字将达到 2314EB(2.26ZB)因 此,我们计算出医疗数据的总量约占到全球所有数据容量嘚 5.1%

大数据分析可以帮助医生确定治疗方案、药物种类和剂量、公共卫生防疫等临床指导。也可以 帮助医院的管理者制定更好的管理方式帮助保险方制定更好的医疗保险支付模式。医疗服务 的提供者获取了更多的大数据信息之后从经验医疗向循证医学进行转变。我们需偠不断引入 新技术、新概念提升对这些数据的管理和分析能力,为管理者和临床医务人员做出准确的工 作决策提供依据

二、医疗大数據沙漏模型

动脉网从医疗大数据的从数据采集、数据治理和数据应用三个方面描述了医疗大数据的发展流 向,绘制了医疗大数据的沙漏模型数据的采集、治理和应用这三步,反映了大数据的状态变 化从数据形成知识,从知识指导行动的过程

更细分一些,大数据领域可鉯分成数据采集、数据存储、数据治疗、数据分析、数据应用五个 方面医疗大数据的输入端,是各种信息化系统、传感器、智能设备所產生的医疗健康数据 庞大的医疗大数据在收集完成后存储在数据中心,然后经过清洗加工之后挖掘其内在有用的 数据。最后通过大數据分析之后产生的知识来指导医疗行为,从而产生价值

通常,人们只认识到医疗大数据的数据来源越来越丰富也认识到医疗大数据鈳以为医疗服务 提供有价值的参考意见。前面我们提到大数据量虽大,但是垃圾数据居多有价值的数据比 例不高。医疗大数据如果能夠经过中间步骤的清洗和加工那么医疗大数据所能发挥的价值会 越大。所以医疗大数据从输入、加工到应用三个步骤缺一不可。我们所绘制的医疗大数据沙 漏模型描绘了医疗大数据从数据形成知识,再形成行动指导的三个重要步骤

医疗大数据行业不是一开始就形成嘚,在大数据解决方案出现之前医疗大数据所能发挥的价 值很低。随着信息化、物联网、云计算、人工智能等技术的发展大数据的利鼡价值在增大。 我们从数据获取时代逐步向信息挖掘时代和价值输出时代过渡。而数据的价值也从医疗行 为的总结,逐步升级为医疗決策的支持和全方位医疗辅助决策

三、医疗大数据的四大特征

医疗大数据呈现以下四个特点:

第一,数据量大从 TB 到 PB 到 EB,再到 ZB医疗大數据以 48%的年增长率快速增长(IDC, 2014)这些数据早已超过了人力所能处理的极限。预计到 2020 年全球医疗大数据将达到

第二,数据种类多医療数据中既有结构化的数据,也有非结构化的数据结构化数据包括 Oracle、MySql 等数据库的数据,半结构化数据如 XML 文档非结构化数据包括 Word、PDF、 音視频、影像等。多种类型的数据对数据的处理能力提出了更高的要求

第三,数据产生快处理快。医疗信息服务中会存在大量在线或实時数据分析处理的需求需 对数据进行实时或准实时的处理、秒级的查询需求响应。例如临床中的诊断和处方数据健康 指标预警等。

第㈣数据缺乏标准。各个医生、各家医疗机构、各个地区的数据没有统一的规范标准数据 的质量不佳。患者的基础信息和各种临床信息資源分散、重复、孤立导致有效信息闲置、信 息重复或标准不一致,很难得到有效利用

健康医疗大数据是一种高附加值的信息资产,雖然个体健康医疗数据对于医疗技术革新的价值有限但通过对海量、来源分散、格式多样的数据进行采集、存储、深度学习和开发,可鉯从中发现新知识、创造新价值、提升新能力从而进一步反哺健康医疗服务产业。因此健康医疗大数据的发展关乎国计民生,具有重夶的战略性意义

四、顶层设计支持医疗大数据发展

当前,社会整体信息化程度不断加深信息技术对健康医疗事业的影响日趋明显,以夶数据、 云计算、移动互联等新兴信息技术为核心的新一轮科技革命推动了人口健康信息化和健康医 疗大数据应用发展,加速了健康医療领域新模式、新业态、新技术的涌现国家已陆续出台关 于扶持医疗大数据发展的相关政策,初步做好顶层设计并构建出医疗大数据发展的宏伟蓝图

2014 年国家卫计委制定“46312”工程,即建设国家级、省级、地级市、县级 4 级卫生信息平 台依托于电子健康档案和电子病历,支撐公共卫生、医疗服务、医疗保障、药品管理、计划 生育、综合管理等 6 项业务应用构建电子监控档案数据库、电子病历数据库、全员人ロ个案

数据库 3 个数据库,建立一个安全的卫生网络加强卫生标准体系和安全体系建设。

人口数据库:主要包含人口信息数据来源于各夶部门(卫计委、公安、民政、统计、人力社 保、教育等)交互共享。

健康档案数据库:主要包含定期或不定期的健康体检记录、卫生服務过程中的各种服务记录、 专题健康或疾病调查记录数据来源于体检机构、医院和基层。

电子病历数据库:主要包含医院诊断治疗全过程原始记录数据来源于医院,其商业化价值最 高

除此之外,近两年和医疗健康大数据相关的政策也出台不少从顶层设计、具体规划指导、数 据隐私和安全、数据管理等多个方面提出了相关的指导意见。

2015 年《“互联网+”行动计划》 第十二届全国人民代表大会上,总理提出制定“互联网+”行动计划“互联网+医疗行业”进 一步推动互联网与传统医疗行业的融合。

2015 年 9 月《关于促进大数据发展的行动纲要》大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合消除信息孤岛,推 进数据资源向社会开放推动大数据发展囷应用,在未来 5 至 10 年打造精准治理、多方协作 的社会治理新模式

2016 年 6 月,《关于促进和规范健康医疗大数据应用发展的指导意见》健康医療大数据是国家重要的基础性战略资源规范和推动健康医疗大数据融合共享、开放应 用,将健康医疗大数据应用发展纳入国家大数据战畧布局

2016 年 7 月《国家信息化发展战略纲要》实施国家大数据战略,从三个方面加快推进政府数据开放尽快建立政府数据采集质量保障和 咹全管理标准,加强政府数据开放的标准化以方便社会各方面利用。

“健康中国 2030”是我国未来 15 年推进健康中国建设的行动纲要其中特別强调发展健康产 业和医疗大数据、培育健康医疗大数据应用新业态。由此可见在国家政策的引导和激励下, 医疗大数据有潜力成为未來健康医疗产业发展新的增长极但与此同时,纲要也明确指出需 加强健康医疗大数据相关法规和标准体系建设。

2017 年 1 月《“十三五”铨国人口健康信息化发展规划》

《规划》将明确全面建成人口健康信息平台,从人口健康信息化和健康医疗大数据基础建设、 人口健康信息化和健康医疗大数据应用方向、创新发展等三个方面着手规范和推动“互联网+健康医疗”应用等 13 项重点任务。

2018 年 9 月《国家健康医疗夶数据标准、安全和服务管理办法(试行)》国家卫生健康委印发了《国家健康医疗大数据标准、安全和服务管理办法(试行)》,对医療 健康大数据行业从规范管理和开发利用的角度出发进行规范《办法》从医疗大数据标准、医 疗大数据安全、医疗大数据服务、医疗大數据监督四个方面提出指导意见,直击目前医疗大数 据领域的痛点未来对数据的统筹标准管理、落实安全责任、规范数据服务和管理具囿重要意 义。

目前健康医疗大数据领域的法律法规存在明显的滞后性,因缺乏全面、细致、明确的指引和 规则健康医疗大数据的发展受到严重制约。虽然很多民营企业和外资企业都已迫不及待投身 该领域并希望进行深耕布局但受制于市场准入和产业政策的不确定性,目前尚在摸着石头过 河市场热情和活力并未得到充分、有效的释放。

第三章医疗大数据的采集

原国家卫计委副主任、中国卫生信息与健康医疗大数据学会会长金小桃预测在我国人口总量 峰值达到 15 亿的时候,仅是我国的健康医疗大数据总量就会达到 ZB 以上他认为,医疗健康 大数据因其宏大的数据总量,将产生宏大的产业规模取得宏大的经济效益。

医疗大数据的沙漏模型描绘了医疗大数据从数据形成知識再形成行动指导的三个重要步骤。 第一个重要的步骤就是收集和存储医疗数据。巧妇难为无米之炊要获得有价值的诊疗行动 指导,需要增加医疗数据的来源扩大数据所覆盖的范围。

医疗大数据是指个人从出生到死亡的全生命周期过程中因疾病、体检、门诊、住院等健康活 动所产生的大数据。医疗大数据狭义上是从因疾病而产生的数据现在已经扩展到健康状态下 的人体所有体征数据,以及和医療健康相关的所有费用数据、行为数据

通常是和医疗行为相关的数据才被称为医疗大数据,但是现在已经扩展到健康人群的健康数 据鉯及和医疗健康相关的行为、物资数据。所以医疗大数据按类型可以分为两种,个人医 疗健康数据和物资数据

疾病数据是生病的患者洇为疾病就诊所产生的病历、影像、检验等数据,以及健康人群的通过

体检、智能设备所收集的体征、基因等健康大数据生产数据的主體是人。

其他数据是由器械等设备的状态数据、医药流通数据组成数据的产生主体不是个人,而是和 医疗行为相关的各种器械、物品、藥品

如果我们把医疗大数据按场景分,可以分成两类包含院内数据和院外数据。

院内数据是在医院所产生的数据医院的信息化程度ㄖ趋成熟,医院信息系统(HIS)、电子 病历系统(EMR)、影像采集与传输系统(PACS)、实验室检查信息系统(LIS)、病理系统(PS)、 医疗器械等信息化系统和设备所记录下来的疾病、体征数据还包括医院物资管理、医院运营 系统所产生的数据。

院外数据主要是人类在日常生活中所產生的数据比如通过体检机构、智能穿戴获取的人体体 征数据。还包括医药流通数据、移动问诊等行为数据物联网和互联网的发展,吔让和医、药 相关的行为数据量大大提升

基因数据其产生环境可能在院内,也可能在院外根据其产生的目的,用于疾病的诊断、预测 或者健康人群的个体特征。

国内医疗系统相对较为封闭公立医院的医疗数据单独存储在院内,数据之间互不流通、不开 放大量优质嘚患者健康数据封闭在医院的围墙之内,难以利用这固然有对患者健康信息安 全性进行考虑的因素,但大量数据躺在医院也造成了数據的浪费。

二、医疗大数据来源详解

1.电子病历数据 这是患者就医过程中所产生的数据包括患者基本信息、疾病主诉、检验数据、影像数據、诊

断数据、治疗数据等,这类数据一般产生及存储在医疗机构的电子病历中这也是医疗数据最 主要的产生地。电子化的医疗病历方便了病历的存储和传输但是并未达到进行数据分析的要 求。大约 80%的医疗数据是自由文本构成的非结构化数据其中不仅包括大段的文字描述,也 包括包含非统一文字的表格字段通过医学自然语言理解技术,将非结构化医疗数据转化为适 合计算机分析的结构化形式是医疗夶数据分析的基础

电子病历中所采集的数据是数据量最多、最有价值的医疗数据。通过和临床信息系统的整合 内容涵盖了医院内的方方面面的临床数据集。在电子病历的互通互联上出于各自的利益性(限制病人转诊),各大电子病历企业也不愿意使数据互通互联根據美国政府相关报告显示,其 电子病历共享比例也仅为 30%左右

数据采集难度★★★☆☆

案例:联众电子病历系统联众电子病历系统集成各種临床医疗系统的数据,以最终建立完整、共享的临床数据中心(CDR)为软件的核心思想系统以病人为中心,全面整合HIS、LIS、PACS、RIS、病理、超聲、内镜、病案、输血、手麻、院感、医保、体检、合理用药等系统实现医院业务数据的共享,消除医院内部信息孤岛联众电子病历涵盖患者在诊疗过程中的图片、文字、表格、语言等多媒体信息的实时采集、传输、存储、处理、整合和利用。

医院检验机构产生了大量患者的诊断、检测数据也有大量存在的第三方医学检验中心也在产生数据。检验数据是医疗临床子系统中的一个细分小类但是可以通過检验数据直接患者的疾病发展和变化。目前临床检验设备得到迅速发展通过LIS系统对检验数据进行收集,可以对疾病的早发现早诊断和囸确诊断做出贡献

数据采集难度★★☆☆☆

东软LIS系统由检验工作站系统、报告查询系统、采血系统、质量控制系统、微生物系统、试剂管理系统组成。以“服务临床”为核心通过基于TAT检验样本全流程管理,以及智能化的临床支持和精细化的检验科室管理能力东软拥有電子病历、LIS、EMR 等齐全的医疗信息化系统,并在其基础上组建了东软医疗大数据科研分析平台借助这个平台,整合全院来自不同医疗业务系统的各类临床数据借助大数据平台的海量数据并发处理能力,为科研医生提供一个集数据获取、探索、处理、分析、挖掘于一体的自助式分析平台支持PB级医疗数据的存储管理,查询分析特别适合于大型三甲医院的科研用户。

随着数据库技术和计算机通讯技术的发展数字化影像传输和电子胶片应运而生。医疗影像数据是通过影像成像设备和影像信息化系统产生的医院影像科和第三方独立影像中心存储了大量的数字化影像数据。医学影像大数据是由DR、CT、MR等医学影像设备产生所产生并存储

PACS系统内的大规模、高增速、多结构、高价徝和真实准确的影像数据集合。与检验信息系统(LIS)大数据和电子病历(EMR)等同属于医疗大数据的核心范畴

医学影像数据量非常庞大,影像数据增速快标准化程度高。影像数据和临床其他数据比较起来它的标准化、格式化、统一性是最好的,价值开发也最早

数据采集难度★★☆☆☆

案例:锐珂医疗锐珂医疗前身是美国柯达医疗集团。锐珂医疗推出了全新的云网信息化解决方案Carestream VueSolution涵盖了全面的专业影潒处理和流程管理应用,为医院的所有医技临床科室提供 “一站式”的全Web工作平台锐珂医疗全球从2011年开始,就从传统PACS逐渐转型到影像云迄今为止,锐珂在全球已经建设了14个影像云数据中心管理的数据高达三亿人次,而且数据量每天都在飞速地增加

医院门诊费用、住院费用、单病种费用、医保费用、检查和化验收入、卫生材料收入、诊疗费用、管理费用率、资产负债率等和经济相关的数据。除了医疗垺务的收入费用之外还包含医院所提供医疗服务的成本数据,包含药品、器械、卫生人员工资等成本数据在DRGs按疾病诊断相关组付费模式中,需要详细的成本数据核算通过大样本量的测算,建立病种标准成本加强病种成本核算和精细化成本管理。

数据采集难度★★★★☆

东软望海作为1600余家医院HRP与成本核算软件和服务的提供商获得了CN-DRG官方授权,通过DRG智能管理平台帮助中国医疗在支付方式上进行改革東软望海DRG平台可以灵活支持全国各地不同编码类型的病案数据进行分组,为医疗机构、支付方和卫生部门提供成本监管、绩效评估、审核等功能DRGs医院绩效评价通过目标管理、绩效方案、绩效考核和绩效分析等模块,可灵活设置绩效方案及其评价指标促使医院提高医疗工莋效率和整体医疗技术水平;DRGs医院控费则依托大数据,建立病组医疗费用和成本的动态分析模型提供区域、机构及病组有效控费指标及參考值;而DRGs财政补偿可以精准测算医院补偿金额和政策性亏损,有效防止重复补偿提高补偿资金使用效率和投放准确性;DRGs智能审核与支付从患者入院到出院的全程信息跟踪,可帮助社保和商保提升其基金使用的有效性同时,其对基金使用情况进行实时监控可针对异常疒历进行深入挖掘分析和反馈。

5.基因测序数据 基因检测技术通过基因组信息以及相关数据系统预测罹患多种疾病的可能性。基因测序会產生大量的个人遗传基因数据一次全面的基因测序,产生的个人数据则达到300GB一家基因 测序企业每月产生的数据量可以达到数百TB甚至1PB。

測序技术的发展让基因数据以远超摩尔定律的速度在积累海量的数据亟待深度解读和挖掘。

基因大数据的价值非常巨大但是现在的数據利用和解读都在初级阶段。

数据采集难度★★★★☆

资料显示华大基因目前拥有超过200台测序仪,是世界上最大的基因测序机构其中鼡于新生胎儿NIPT基因测序每天大约产生10000个样本,需要与数万个正常胎儿几十TB的基因组数据进行差异统计分析数据计算量巨大。每月产生的基因数据高达300TB-1PB目前累计基因

6.医药研发数据 制药公司在新药研发及临床过程中产生的数据。制药公司主要对临床试验数据进行系统分析 收集和解读非结构化数据,从而优化生产流程最大限度地利用研发潜力。

数据采集难度★★★★☆

拜耳公司依靠大数据分析在2017年年底嶊出了既重点突出又多样化的开发战略,将50多个项目几乎同期投入临床开发最大限度地利用了研发潜力。拜耳公司的研发重点项目在肿瘤学、心血管疾病和妇科学领域同时在营销方面拜耳也在利用大数据进行推广的辅助决策。

药品和疫苗的运输、流通、存储、销售、接種数据药品运输、销售数据虽然和疾病的诊治无关,但是医药流通企业可以通过物流数据、库存数据、销售数据中进行挖掘获取药品鋶向、用户健康等关键信息,实现系统智能化引导满足顾客准确选药、合理用药、健康保健的多元化服务需求

数据采集难度★★★★☆

案例:国药集团国药集团通过大数据平台,搭建医药流通全过程的电子化追溯平台探索实现医药产品从生产完成到销售终端机构(医院、藥房、诊所等合法经营机构)之间的全程追踪、追溯与召回,有效地提高医药流通的监管水平同时,探索基于药品流通领域追溯大数据的應用为药品紧急调拨配送、药品流动趋势、医药储备可视化等提供数据支撑。

各种智能可穿戴设备的出现使得血压、心率、体重、体脂、血糖、心电图等健康体征数据的监测都变成可能,患者的单一体征健康数据以及运动数据快速上传到云端而且数据的采集频率和分析速度大大提升。除了生命体征之外还有其他智能设备收集的健康行为数据,比如每天的卡路里摄入量、喝水量、步行数、运动时间、睡眠时间等等

智能穿戴设备虽然在这两年遇冷,用户很难形成粘性但是并不意味着智能穿戴设备所产生的数据没有意义。提供健康数據和服务可能是智能穿戴厂商未来的转型之路。健康大数据的收集必须依靠硬件载体智能穿戴设备还将会遇到自己的第二春。

数据采集难度★★★☆☆

通过移动设备端或者PC端连接到互联网医疗机构产生的轻问诊数据和行为数据。动脉网蛋壳研究院就曾经通过互联网问診企业春雨医生的数据分析各地医生互联网问诊的活跃度、细分疾病种的问诊行为。通过这些数据的分析对行业发展、互联网问诊企業的决策有非常重要的帮助。

数据采集难度★★★☆☆

体检数据是体检机构所产生的健康人群的身高、体重、检验和影像等数据这部分數据来自医院或者第三体检机构,大部分是健康人群的体征数据随着亚健康人群、慢病患者的增加,越来越多的体检者除了想从体检报告中了解自己的健康状况还想从体检结果中获得精准的健康风险评估,以及如何进行健康、慢病管理

数据采集难度★★★☆☆

美年大健康是中国知名的专业健康体检和医疗服务集团,全国布局400余家体检中心2017

年完成2160万人次健康体检服务,2018年体检人次预计将突破3000万大关媄年大健康,是中国最大的个人体检数据平台通过建立了美年大健康研究院,开展基于健康大数据的科研创新和公共卫生服务加强在囚工智能、基因检测、肿瘤早筛、智能诊断、健康服务、健康保险等核心赛道的控制力。

20186月美年大健康和北大医学部共同发起成立“丠京大学医学部美年公众健康研究院”,意在打造国际顶尖的公众健康与大数据研究和实践平台通过这个数据研究平台,承担国家健康領域科研项目、开展健康大数据挖掘分析等工作

第四章 治理数据形成知识

医院信息化程度日趋成熟,医院信息系统(HIS)、电子病历系统(EMR)、影像采集与传输系统(PACS)、实验室检查信息系统(LIS)、病理系统(PS)等等甚至包括手术管理系统、 耗材及物流管理系统等等。这些信息系统每天产生大量的数据多源异构的数据类型汇聚在一起后,传统的计算分析方式已经很难处理快速增长的海量数据这些大数據需要通过特殊的手段进行清洗和加工,才能利用起来

大数据平台以现有业务系统为基础,通过数据抽取的方式实现多源异构数据的采集和汇聚目前,医院的信息化系统大多采用关系型数据库兼有少量的非关系型数据库架构,适合使用全量或增量的方式进行抽取汇聚数据清洗过程中的最大挑战,是不同机构、不同部门、不同业务系统多源异构数据的标化融合

一、医疗大数据应用的主要挑战

医疗大數据采集完成后,遇到的第一个问题就是数据集成阶段现阶段医疗机构的信息化水平不低,但是数据的互联互通是首先需要解决的问题先不谈医疗机构之间的数据互联互通,就是同一家医院在不同信息化系统中的数据都很难实现互联互通。数据集成平台的出现解决了鈈同信息化系统中的接口问题让数据流动起来。但是这些数据分散、规模大都是多系统的异源异构数据,质量规模大又参差不齐,鈈完整性显著

医院采用统一信息编码体系的情况。数据来源CHIMA,《中国医院信息化状况调查年度》

其次,难在数据的处理阶段医疗夶数据的标准化程度低,数据质量偏低CHIMA发布的《中国医院信息化状况调查,年度》中调研数据显示医院全部采用统一信息编码体系的仳例仅占28.10%。临床数据大多是业务过程中产生的数据录入目的不同,每家机构、每 个系统的标准、接口规范有差异导致底层数据采集和整合困难。而通过移动终端收集的患者行为数据和体征数据数据的标准化程度更低,垃圾数据居多标化融合困难。

医疗领域的数据专業化强细分领域多。很多医院的电子病历系统对病种没有按标准疾病编码而且医疗器械、药品都没有标准的编码。各家厂商、医院各个地区都采用不同的数据标准,数据难以沉淀数据处理更加困难。

第三数据难以理解,医疗大数据中的病历信息以文本、图像等非結构化数据为主处理与分析困难。在具体应用中标准复杂、数据量庞大、新技术攻关、管理协调庞杂都是实践过程中需要面对和处理嘚问题。

当前大数据的快速增长已经超出了传统的信息处理能力,因此医疗大数据需要不断引入新技术、新概念提升对运行数据的清洗、加工和分析能力,为管理者和临床医务人员做出准确的工作决策提供依据

医疗机构的数据在质量上偏低是有其主观和客观原因的。醫疗机构的信息化建设以业务流程、医保支付和医管政策为核心驱动力产生的数据是有客观限制的。如医保处方规定的出院带药最大天數、跨科开药限制等因素导致开单医生不能如实开具反映实际情况的处方;分工细化数据价值链路过长,导致前端缺乏数据生产动力;數据生产者缺乏对数据对象进行完整和精确描述的能力导致关键信息缺失,标准化程度差的特点;信息系统难以学习和使用缺少防错設计,导致人为差错问题因此,在二次利用的价值充分体现之前数据的完整性、准确性、一致性、关联性、规范性等方面的质量挑战將存在且长期存在。

如果数据不能及时进行结构化、标准化的治理和分类存储那么带来的存储成本也是巨大的。前面我们提到过到2020年,数据存储将达到44ZB而其中的有价值的数据仅有1.5%。如果不能及时的发掘出其他数据的有效价值那么垃圾数据将会过多的占据企业的存储荿本。

医疗数据的治理分成两种一种是前治理,一种是后治理

后治理是将已经存储在数据平台的医疗数据的质量问题,通过清洗、校驗、脱敏等常见方法结合二次应用需求,对数据的结构化、标准化进行数据质量的提升和优化基于海量存储和计算平台的集成能力,夶数据平台应覆盖包括至少元数据管理、文件管理、检索设计、节点任务、流程任务、任务调度、运行监控等功能支撑后治理过程中数據的基础处理。

在治理过程中需要基于通用标准和临床基础字段集,把症状、疾病生命体征、家族史、婚育史、检验、检查、手术、输液、药品医嘱等文字内容进行结构化处理对结构化和非结构化数据、集中式和分布式数据进行统一建模,提取临床、科研分析所需特征同时完成重点概念的标准化和统一描述。后治理具有数据基础差、要求高、流程和环节复杂的特征涉及的自动化和人工处理的工作量極其巨大,二次污染难以避免需建立针对数据处理环节的质控流程和工具。通过溯源工具追溯每个处理后数据到原生数据的血缘关系,定位和处理过程中引入的新问题

前治理是后治理能力、经验和治理工具到医疗机构的向前延伸,以原生数据质量问题的评价为基础解决数据在医疗业务信息系统中生产、传输、转化、存储等环节中产生的质量问题。前治理可以显著提升医疗数据质量

案例:医渡云数據智能平台DPAP

医渡云利用数据人工智能技术,构建了可追溯、可监管的医学数据智能平台该平台数据处理量大、数据完整度高、开发流程透明,帮助政府、医院和整个产业界充分挖掘医疗大数据智能化政用和民用价值建立可覆盖全国、统筹利用、统一接入的医疗行业大数據生态平台。

医渡云已与全国700余家医疗机构、近100所顶级医院建立战略合作为医院集成融合了横跨

10余年的3亿多名患者、12 亿人次的医学数据,覆盖了30余类重大病种建立了3000多个专科疾病模型、2000万个标准化字段,实现了医院近200种系统、几百个厂商的多种数据、全量全周期的采集與数据结构化与标准化处理可以说是在充分发挥“医疗大脑”的作用下, 构建了中国数据处理量最大、数据完整度最高、开发流程最透奣的可追溯、可监管的医学数据智能平台

在与数十家顶级医院的建设合作中,医渡云数据智能平台形成了一套成熟可控的方法轮和一支經验丰富的数据抽取、清洗、汇聚的团队能做到在完全可控的实施成本和周期的要求下,以人工和自动的方式适配多源异构的数据源洎定义数据处理流程以及智能映射等工作。

该平台支持并行计算基础架构或混合式架构可以基于传统分布式网络和云计算平台等多种模式部署,支持大数据计算资源管理支持资源预约、排队、按优先级抢占,支持资源占用分析、计算瓶颈分析使资源得到更充分利用。叧外架构还配备了多种算法库,具备大数据存储访问及分布式计算任务调度等功能支持多维索引数据的深度搜索、过滤、聚合、统计汾析和全文检索等功能,支持图形化界面大数据查询引擎方便非技术人员利用大数据平台进行统计分析工作。

海量的医疗大数据来自于各个业务信息子系统数据的标准化程度低,在完成数据收集之后随后就面向后续的数据的清洗和加工步骤。如何把这些海量数据按照統一的标准进行清洗是很多行业和企业现在面对的最大困境。阿里数据中台为的数据ODS层设计包含了三个特性:其一是数据同步功能支歭结构化数据增量或全量同步到ODPS;其二是实现全结构化数据转换, 能够将非结构化数据(如日志)进行结构化处理后再存储;其三是支持曆史数据的积累和清洗能根据数据业务需求及稽核审计要求保存信息。总结阿里云数据中台的作用和功能如下:

全域数据采集与引入:鉯需求为驱动以数据多样性的全域思想为指导,采集与引入全业务、多终端、多形态的数据;

标准规范数据架构与研发:统一基础层、公共中间层、百花齐放应用层的数据分层架构模式 通过数据指标结构化规范化的方式实现指标口径统一;

连接与深度萃取数据价值:形荿以业务核心对象为中心的连接和标签体系,深度萃取数据价值;

统一数据资产管理:构建元数据中心通过资产分析、应用、优化、运營四方面对看清数据资产、降低数据管理成本、追踪数据价值。

统一主题式服务:通过构建服务元数据中心和数据服务查询引擎面向业務统一数据出口与数据查询逻辑,屏蔽多数据源与多物理表;

第五章行动——医疗大数据的价值输出

伴随万物的行为逐步被数据所量化醫疗大数据的形式和数量将极大地丰富起来,整个医疗领域会迎来一个新的时期就是持久而深远的大数据革命。医疗大数据在治理之后接下来就需要把有用的知识形成行动指南,让我们的诊断和治疗过程可以变得更精准医疗大数据可以辅助医生进行诊疗,辅助医院进荇管理或者辅助居民进行健康管理,我们不再摸着石头过河

医疗大数据的价值,取决于使用者和应用场景如果从使用对象来看,医療大数据的应用者主要包含五个对象现阶段,医生、医院是医疗大数据的主要产生者和使用者

一是为医生服务。提高他们的诊疗行为优化诊疗决策。

二是为医疗机构的管理者服务帮助他们进行人员、物资管理,辅助管理决策

三是为个人服务。通过疾病和健康大数據结合患者基因学数据,能针对不同疾病建立个性化的治疗方式为患者提供健康行为指导。

四是为药企服务药企通过医疗大数据和銷售大数据,降低医药研发成本制定精准的市场营销方案。

五是为保险服务通过医疗大数据、医疗费用大数据,建立保险模型降低保费的同时,提高利润率扩大保险覆盖范围。

医疗大数据的价值还取决于数据从数据的采集、存储、治理、分析,达到终端用户进行應用产业链条中的每个步骤都能产生相应的盈利模式,不同环节上的企业都可以向上下游延伸发展出对应的医疗大数据解决方案

医疗夶数据可以用来做什么?我们总结了八个方面的内容每一个领域,都可以通过数据的总结直接形成我们的行动指导。

通过收集医院各信息化子系统的临床数据将疾病的表征、患者体征和治疗方式的数据存储起来,建立特定疾病的数据库再根据数据的智能分析,可以對患者进行多种诊疗措施比较分析制定有效的诊疗路径,帮助医生进行决策在临床诊断辅助系统中,人工智能技术是一项非常重要的輔助技术它可以通过知识的学习,进一步提炼数据的价值

临床数据首先反映的是人的疾病特征,再辅以以往的医生诊疗数据就可以實现辅助诊疗。医疗大数据最大的价值输出就是在临床诊断辅助系统方面。因为医疗大数据的应用可以明显提高医疗服务水平,降低夨误这类应用和医生、医院所追求的目标是一致的,所以医院的付费意愿较强医院内部的临床数据是存在数据孤岛的,系统和系统之間医院和医院之间,医院和社会公众之间均存在不同程度的数据壁垒医院现在在政策、技术的推动下,有强烈的意愿先消除内部的数據壁垒建立医院临床数据中心,所以对临床数据的集成和应用有较为强烈的需求

1.临床数据辅助诊疗。医生在诊疗过程中需要很多相關信息的辅助,最重要的信息来源是患者的各种临床检验检查数据这些检验检测数据,汇入到疾病数据库之后能够形成疾病辅助决策支持,对医生的工作进一步形成指导从而准确判断疾病,给出诊疗方案

临床数据反映了患者的疾病情况,但是疾病千变万化疾病种類繁多,医生还需要一些临床指南、知识库来辅助进行判断医生在计算机(电子病历)中输入主诉的时候,系统结合症状等患者综合信息并智能“匹配”后台医疗大数据知识库提示医生患者可能存在的疾病,避免漏诊、误诊和医疗纠纷医生在下医嘱的时候,利用规则引擎推出相应诊断的治疗方案并对用药、手术、护理等治疗方案进行详细指导,减少技术上的失误

案例:惠每科技CDSS临床辅助决策系统

惠每科技CDSS临床辅助决策系统根据Mayo Clinic(梅奥)知识体系和最新指南文献为知识 内核,基于病历数据不断运算更新的知识图谱绘制更加符合临床经验的决策路径。可以实现疾病的辅助诊断、推荐治疗方案、合理性审核、检验检查结果解读、病案缺陷提醒等功能惠CDSS利用自然语訁处理智能识别、分析非结构化病历文本,从EMR、RIS、LIS等医院数据平台中读取患者病历数据经结构化存储形成完整的、符合临床术语标准的Φ间数据平台,为医生、医技人员、护士、管理者提供多维度决策支持通过人工智能技术不断汲取病历经验,丰富AI大脑训练诊疗模型。开发满足各级医疗机构管理与临床需求的人工智能系统融入门诊、急诊、住院环节。通过惠每辅助决策支持系统能有效提升医疗质量,保障患者安全降低医疗风险,助力医疗智能化建设

嘉和美康专注于医疗临床信息系统的软件开发和系统建设,在电子病历系统、臨床路径系统、移动医疗系统、心电信息系统、手术麻醉系统、口腔专科化电子病历系统、医学科研平台、医

院信息集成平台、CDSS等领域建竝了独立的产品线和专业实施团队围绕临床数据处理的核心能力,嘉和美康的产品在临床专科纵深方向和数据二次利用方向不断扩展開发了集中部署的基层医疗信息系统,区域心电采集报告系统和区域临床路径系统等临床信息化应用在CDSS 系统构成中,知识库是非常基础囷重要的部分但除以往的临床指南、循证医学、文献资料等数据外,它还可通过自然语言处理、机器学习等技术从医院各业务系统的曆史病历数据中学习、整理出更多的信息,导入知识库形成一套从临床到用药等丰富的知识图谱体系,为后续构建临床业务规则库及实現业务功能提供支撑在知识库基础上,嘉和美康根据临床提出的业务规则将规则引擎和规则流作为基础核心,使用人工智能技术构建嶊理系统形成临床预警提示规则库、辅助诊断规则库、辅助诊疗规则库,满足业务逻辑的多变性最终,实现CDSS 在辅助诊断、辅助诊疗、醫嘱追踪、诊疗提醒、依从规则设置、依从监控、临床指南、不良反应监测、相似病例推荐等方面的功能

2.影像数据辅助诊疗。影像数据雖然也是临床数据中的一种但是市场的应用规模非常大,所以在这里把它单列出来影像在医院临床疾病的诊断过程中起到了非常重要嘚作用,无论是在病情评估、病灶性质判定、手术方案的制定或是评估治疗后效果,尤其在创伤性治疗过程中医学影像学结论都是必偠的指征。影像数据主要辅助对象是影像科、病理科的医生通过人工智能对影像数据进行价值提炼,可以形成快速的诊断意见

影像数據的利用也需要借助人工智能技术,在提高医生效率的同时还可以提高准确率,替代医生的重复劳动目前,我国大部分的人工智能企業都是以影像数据入手通过标注后的影像数据库对人工智能产品进行训练。

推想科技是国内第一家形成临床应用的医学影像人工智能公司成立于2015年年初。目前推想科技的产品可以提供三个方面的服务:智能影像报告检验、智能辅助筛查、智能鉴别诊断

推想科技智能CT线輔助筛查产品可自动标记出CT各层面上病灶的位置,辅助医生快速准确的完成CT诊断减少影像科重复性劳动,把时间用在重大疾病的诊治上提高诊断准确度的同时减低医生的疲劳度。

在诊断速度方面一个医生完成20个病例的诊断需要3个半小时,利用推想人工智能产品就

算是朂低配置的电脑也只需615

在诊断准确率方面,人工智能针对大小结节综合灵敏度是85%左右针对不同大小的结节,情 况不同推想科技201739日的测试数据显示,对于0-3mm的结节推想科技模型敏感度为84.03%,3-6mm的结节模型敏感度度为88.31%>6mm的结节模型的敏感度为100%。

随着算法模型的不断完善迭代速度不断加快,推想科技的服务领域也逐渐向头部、腹部、股骨头、病理、超声等领域延伸覆盖100多种疾病。截至20183月推想科技已经为近45 万病患提供了影像辅助诊断服务。

万里云由医疗影像器械企业万东医疗和阿里健康共同持股通过构建医学影像大数据云平台,提供远程影像诊断平台、移动影像诊断平台、影像学术、个人健康管理、影像综合解决方案等服务实现影像云存储、云共享。万里云艏先提供的是影像数据的云存储、云诊断功能后来也是首个将医疗AI引入实际应用的远程影像诊断平台。万里云构建的医学影像大数据平囼 不仅提供疑难会诊、读片会,为临床诊断积累经验为科研教学提供素材,还积极开展医生培训和再教育业务

通过对医疗大数据的整理,形成医生的辅助工具帮助医生诊疗过程中更好地进行处方管理、病历管理、手术规划,诊疗结束后对患者进行随访管理或者加赽科研数据分析进程,提高工作效率促进转化医学研究。

在单一病种的垂直领域中临床科室往往缺少针对具体疾病的专业信息化工具,将患者的多源头医疗数据、治疗方案、用药情况、治疗效果等信息全面整合起来医生想要在繁忙的诊疗工作中抽出时间来整理相关医療数据、进行临床研究并不容易。

临床中还有一个常见的现象是由于行业标准不统一不同医院、不同医生在病历书写时难免在表述上会囿差异,这就给数据录入和分析造成困难要获取高质量的数据,就要建立统一病历填写标准和规范从源头保证数据的真实和准确。有企业对医疗机构所产生的电子病历进行数据治理形成有科研价值的结构化数据。虽然利用的仍然是临床数据使用者也都是医生,但是醫生辅助工具的应用对象和临床辅助决策不同临床辅助决策是医生为患者服务,而医生辅助工具是为医生服务

索闻博识科技(北京)囿限公司致力于深度开发各类疾病专业信息化工具,打造医疗数据的收-分析-应用-管理为一体的专业化平台为医生们提供“疾病专业化、数据结构化”服务, 满足其科研与临床的需求博识医疗云自主开发了底层数据架构和核心技术,产品功能完全以医生需求为导向最初通过结构化电子表单为临床科研的意义提供数据分析工具入手,进而不断加入了随访、查房、会诊、手术质控、多中心合作等多种功能目前的博识医疗云平台已经涵盖临床学术研究、科室运营分析、病患整合管理等多个模块,为医护人员的临床研究、患者管理、科室管悝、学术交流提供支持极大缩短了医生的工作时间,让医生获益20176月,索闻博识获得经纬中国数千万人民币A轮融资当时博识医疗云覆盖了全国超过400家三甲医院的涵盖肿瘤,血液骨科,神经内科、神经外科等重大疾病领域的超过2700个临床科室为

国内超过20000名临床医生提供临床数据服务。

零氪科技从肿瘤大数据出发与医院合作,对临床数据进行集成、治理、分析让沉睡的数据发挥价值。零氪科技的思蕗是与医院、医生合作搭建大数据平台,提供数据集成、数据结构化、离院随访、数据管理与质控、数据交付与洞察等工具和服务简洏言之就是帮助医生从临床中获取数据、处理数据、分析数据、应用数据。

医疗机构在临床数据应用方面主要有两大需求其一是数据能夠被处理,从病历转化为可用的

数据;其二是随访需求能够打通院内、院外环节。

其一是数据治理临床病历很多时候表现形式是大段嘚文字,但是大段的文字并不能被有效地进行分析需要转化为可用于建立疾病诊疗模型的数据“点位”。过去病历很难被利用但病历結构化之后,就可以实现对病历的分析和发掘这是临床科研的意义的核心需求。零氪通过数据的集成、治理、分析为医生在科研、数據管理中提供可视化数据应用。截止2017下半年零氪科技为超过500家综合及专科三甲医院提供大数据解决方案,深度处理肿瘤科研级病历近200万份帮助集成及清洗区域医疗数据超千万份,处理医学影像数据超千万份形成了真正

其二是患者管理,在重病尤其是肿瘤领域患者很尐会一直在一家医院进行治疗,而是在北京、上海等地的多个医院“迁徙”得到综合性的诊疗意见或是寻求新的疗法。作为医生而言唏望能够持续跟踪该患者的病情进展,看到后续治疗的疗效以及治疗的结局零氪科技建立了100多人的专业随访队伍,在患者知情同意的情況下主动去做患者随访,对患者院后、康复进展进行跟踪咨询从患者入院、院内治疗到院外治疗及康复,沉淀了完整的数据院内外數据可以进行合并,形成数据闭环给医生更多治疗参考。

零氪科技的产品除了面向医疗机构和患者的服务之外对药企、保险公司也提供基于人工智能和大数据技术的服务。目前零氪科技产品线包括:

医疗机构大数据解决方案——医疗大数据一体化、标准化智能随访、医學影像智能诊断、一站式医学科研服务;

制药企业大数据解决方案——患者招募、真实世界研究、数据洞察、药物临床研究; 保险企业大數据解决方案——保险精算、欺诈识别、药物经济学; 患者院外服务——互联网医院+DTP+门诊模式建立医疗新模式和医药流通新渠道。

梅斯醫学(MedSci)通过互联网和大数据计算等技术为医生的临床科研的意义和临床实践提供智慧、精准的决策支持,让医生与患者受益梅斯医學主要从事医学科研学术支持、推动临床医生职业成长、智慧医疗和慢病管理等服务,推动和加速临床医生的职业成长在科研学术层面,为梅斯医学提供从临床研究设计、数据库建立、医学统计、以及发表计划支持等一系列服务梅斯医学团队从2015年就深入研究真实世界研究的特征,以及其价值产出并开始与客户合作,从事大量的真实世界研究的服务从研究的设计,EDC数据库建立以及到项目管理与操作,后期的统计分析都具有丰富的经验。同时梅斯医学利用众多创新的技术,如人工智能化随访中心化数据转录等极大降低研究成本,提高效率针对药企和医生,开展回顾性数据分析通过HIS等数据源导出数据,进行统计策略制订数据分析处理等工作。在智慧医疗方媔通过大数据技术和虚拟/增强现实技术的应用,为临床提供辅助决策支持;在慢病管理方面 采用大数据疾病发展预测等技术,为疾病發展提供精准地干预改善患者生活质量,降低医疗费用

慢病的管理行为通常在院外发生,通过智能终端、数据管理系统、移动医疗设備和医疗健康应用软件实现多项检测数据的网络接入,同时对患者的行为习惯、用药记录进行智能的监护和跟踪通过数据监控,可以叻解患者当前的体征状况是否遵医嘱按时吃药。

慢病管理类型的医疗大数据企业其数据可能来自于临床医疗机构,也可能来自于患者所使用的智能设备积累而来根据患者的当前体征数据、行为数据,结合慢病大数据为患者提供定制化用药及治疗方案。通过对慢病患鍺的院外管理可以延长他们的生命,减少并发症

微糖是一家提供血糖健康解决方案的慢病管理公司。微糖通过慢病管理软件收集了海量的糖尿病患者的血糖数据,研发完成连接专业医护团队和用户的“天雁”系统微糖天雁系统基于亚洲糖尿病基金会超过十年的大数據积累,通过专利算法提供并发症风险的预测和分析微糖还引进了业界领先的动态血糖技术雅培“瞬感”,基于动态的数据分析和服务產品提供针对糖尿病患者的血糖健康解决方案,帮助患者稳定血糖

保险机构非常依赖于医疗大数据,通过大量的疾病发病率、治疗效果、费用等数据的帮助下才能制定出合适的保险产品,降低保险公司成本特别是最近火热的健康险,更需要依托医疗大数据和智能化嘚管理系统将保险机构、医院、药房的数据进行整合,对目标人群进行精细管理有效控制医保费用。

成都数联易康科技有限公司是一镓专注于利用大数据手段为各地医保、医疗机构和商业保险公司提供智能审核、政策制定辅助决策、医疗行为监管等服务的医疗保险第三方服务提供商拥10余年经验的数据挖掘、医疗行业、医疗保险、信息技术知名专家团队。经过多年数亿条业务数据淬炼自主研发数百種针对医疗保险的大数据算法模型,涉及行为模式识别、医学文本解析、医疗图像处理、信任传播等成功打造了基于大数据的医疗保险審核、监管、决策系列解决方案。数联易康的大数据产品主要有三个分别是易康云数据集成平台、医保业务精细化管理方案和医保大数據监管方案。

云数据集成平台通过整合数据接入清洗、数据存储、分析挖掘、数据可视化展示四大模块提高数据的质量,完成数据清洗医保业务精细化管理方案采用了智能审核引擎,使用医保审核规则和临床医学规则识别医嘱数据中的违规行为同时引入单病种管理,對单病种进行成本核算监控分析最优治疗方案的同时,控制治疗费用成本提高单病种收益。医保大数据监管方案这是针对当前的医保支付方式进行大数据监管,通过数据分析进行事前动态感知事中挖掘分析,时候宏观调控的全方位监管方案

通过医疗、医药大数据,利用人工智能深度学习能力的算法系统对研发药物中各种不同的化合物以及化学物质进行分析,预测药品研发过程中的安全性、有效性、副作用等可以有效的降低药品研发成本,缩短研发周期降低药品价格。常见医药数据库包含临床数据、药物疾病信息、临床医学實验数据、研发情报、医药专利信息、市场销售数据等类别

药渡网是一家专注于医药研发领域的“互联网+”大数据信息平台,整合制药企业研发、结构 化学信息等和药物研发相关数十个学科专业数据和资源信息为全球药物研发人员提供“一站式信息解决方案。药渡依托夶数据分析利用“数据”链接“资源”,围绕医药研发领域不同阶段对数据和资源的需求差异建立起结构化药物研发大数据信息的综匼服务平台。

“医院管理”顾名思义是指以医院为对象的管理科学,它根据医院工作的客观规律运用现代的管理理论和方法,对人、財、物、信息、时间等资源进行计划、组织、协调、控制,充分利用医院的现有资源实现医疗效用的最大化。通过对医院的临床数据、运营数据、物资数据进行挖掘解决医院管理中的各种问题,提高设备的使用效率降低医院运营成本。

医院管理运营中已经较早通過数据分析实现了BI商务智能。医疗信息化系统中BI已经是一个非常重要部分,将医院信息化系统中的多源数据抽取、清洗后关联整合建竝医疗BI策系统。通过数据分析实现人资、成本、绩效、医保、药事、门诊、住院、手术等多项管理,实时监控医院的运营状态并可為医院的发展方向和运营做出决策支持的依据。

医疗大数据在医院管理应用上主要有两个方向分别是优化医疗资源配置和弥补医院管理漏洞。第一种是优化医疗资源配置:人工智能根据医院的情况制定实时的工作安排,其目的在于优化医院的服务流程最大限度利用好現有的医疗资源。第二种是弥补医院管理漏洞通过大数据分析总结医院存在的问题,并给出解决方案降低医院成本,提高医院的营收

北京东软望海科技有限公司是一家全心致力于医院及医疗集团高效运营及医疗生态价值链管理的医疗大数据运营服务商,在HRP、医院成本┅体化、医疗卫生资源监管等领域保持优势地 位目前为止,东软望海积累医疗机构客户数2000多家其中三级医院500家,覆盖医院成本管理绝夶多数市场

东软望海在医院管理方面推出过多款解决方案,包括医院成本监管、预算监管、绩效监管、医疗服务价格调整、供应链监管、固定资源监管、医疗资源监管、财务核算监管等医院管理业务中的方方面面

比如在公立医院成本监管上,东软望海通过对区域内医院各科室的收入与成本、医疗服务项目的收费与成本、病种收费与成本和DRG付费标准与成本的同比、环比、构成和挖掘分析卫生主管部门能夠详细了解区域内各医院的运营状况、医院内部各成本对象的盈亏情况,对区域内各医院医改重点监测指标达成情况进行监测和排名分析为建立现代化医院管理制度、控制医疗费用不合理增长、合理配置医疗资源、降低医院运行成本提供指导,为政府主管部门合理制定医療服务价格、研究财政补偿机制、进行按病种收费和按DRG付费等支付方式改革以及对医 院的绩效考核提供数据依据

之前所描述的医疗大数據应用,大多和疾病相关是对患者的疾病体征、治疗方案等进行搜集的数据。而健康大数据还关注健康人的体检数据、心理数据、运动數据、营养数据以及基因大数据通过数据的分析实现健康人的管理,让人不生病、少生病是医疗大数据应用的终极方向。借助物联网、智能医疗器械、智能穿戴设备实时收集居民的健康大数据,通过对体征数据的监控实现健康管理。

中科恒业成立于1999年是一家健康體检系统平台建设与健康管理服务提供商,专注于软硬件一体化的健康产品和健康+互联网平台的建设和运营在中科健康管理系统中,体檢业务管 理、检验项目管理、医学影像管理、心电检查管理、健康档案动态管理、辅助功能检查管理、 总检报告管理、客户关系管理、智能导检、移动互联网健康管理、检后追踪、随访管理、健康教育咨询等子系统融为一体建立了标准化、规范化、人性化的健检业务流程;为健检机构运营管理提供了360度的系统支撑,建立了一整套完善健全的健康管理体系通过对体检客户数据资料整合分析,对其健康状况進行评估对健康、亚健康人群提供健康咨询,给予健康指导并进行跟踪随访对高端客户根据其需求制定专门的健康管理方案为康复期患者提供科学规范的康复指导。对慢性病患者进行心理、情感、饮食营养、生活行为等各方面的健康指导

碳云智能是一家数字化生命管悝的人工智能公司。碳云智能希望建立一个健康大数据平台运用人工智能技术处理这些数据,帮助人们做健康管理王俊曾介绍,碳云智能的数据来源包括两部分一部分靠自己的技术能力获取,一部分靠合作伙伴获取靠该团队的核心技术获取的有基因数据、微生物数據(肠道、口腔、皮肤等)、蛋白及代谢数据(尿液、汗液、血液等)等,合作伙伴包括研究机构、药厂、体检中心、医院、诊断公司、保险公司、健康管理公司等从合作伙伴处获取的数据有临床及体检数据、环境数据、运动数据、饮食数据等等。2017

5日碳云智能对外发咘觅我数字化健康管理平台,通过健康大数据、基因大数据对用户进

行健康管理应用应用主题涵盖营养、运动、护肤、健康、医疗、慢疒6大场景。

智慧养老和慢病管理领域是有结合的不过智慧养老也关注健康的老年人。养老领域的企业在大数据方面的应用仍比较粗浅夶部分企业都是通过智能穿戴设备或者其他传感器收集老年人的体征数据、状态,然后通过数据评估和监管老年人的身体状况结合父母對亲情、紧急救助、

健康检测服务等多方面的需求,通过后台大数据处理推送相应的资源搭建共同的信息协作平台,为老人和子女家人建立交流的空间其数据价值略低,更多的是通过智能穿戴、物联网设备进行一些简单的数据传输

所依智能居家养老项目由蓝创科技推絀,通过智能养老产品和智能养老服务为老年群体提供信息化养老模式所依智能养老平台将会积累大量的养老行业数据,打造大数据养咾平台所依智能养老平台可无线链接第三方医疗设备如血压计、血糖仪、血氧仪、耳温枪、智能床垫等。老人测量健康数据后设备可洎动将健康数据如血压、血糖、心率等上传所依智能养老平台,形成每个老人的健康档案实现用户标签化管理。通过大数据处理成周期性的健康信息结合数据库中的老人健康信息和区间值从而对老人健康数据进行智能分析,提供全天候监护大数据系统通过对老人健康數据进行分析比对,针对性的对老人提出健康干预方案:健康数据是否出现异常、饮食如何调整、用药是否合理、日常应注意事项运动計划、降血压、降血糖计划等等,保障老人的健康生活

通过对医疗大数据、医药大数据进行深度挖掘,可以从产业纵向及横向整合医院、药品生产、批发、零售全产业链资源为医药行业提供集药品分销、零售品牌连锁、运营指导、医保对接等全方位的数字化市场营销方案。

医药魔方成立于2013年为医药垂直行业的一站式药品数据服务平台,致力于以数据连接行

业提升行业效率,打造连接全产业链的生态系统医药魔方在2014年对分散的海量药品数据进行了规模收集、标准化清洗、结构化转换,并串联整合为数据仓库逐步搭建了从数据监测、数据收集、数据清洗、数据挖掘到数据预测的大数据架构工作体系。通过数据平台为医药企业、上市公司和投资机构提供市场数据分析、产品管线规划、药品筛选、并购咨询和尽职调查等市场服务。

基因测序技术的发展让基因测序成本迅速降低数据也得到大量积累。海量的基因数据让医学界了解了相当多人类的祖源、个体特征、罹患疾病的可能性、基因缺陷、病变基因等知识人类对基因数据的研究雖然还只是沧海一粟,但是也已经在疾病筛查、疾病诊断、精准治疗等方面开始展现出实力在基因检测行业中,上游是测序仪器、耗材嘚研发和生产商被美国Illumina等公司所垄断,中游是提供测序服务和基因分析的公司下游是为用户解读测序数据报告输出的公司。大多数基洇数据被保留在提供测序服务和解读数据服务的公司中基因公司更像是一家数据公司,而不是医疗企业是通过数据的分析和比对提供報告。

基因大数据在应用层面主要分成两个部分一是疾病的早期筛查、预防和诊断、动态监测、用药指导、预后评估及生物信息学大数據分析等领域。这类业务的开展主要是在医院中展开以

肿瘤、NIPT为主。一是健康人群的基因检测对祖源、生理心理特征、遗传病、易感基因、健康管理、个性化用药等方面进行解读,主要是面向个人用户检测环境在院外

北京贝瑞和康生物技术有限公司(以下简称贝瑞基因)成立于20105月是致力于应用高通量基因测序技术,为临床医学疾病筛查和诊断提供“无创式”整体解决方案的研发型生物科技公司是将基因测序技术实现临床转化的行业领导者。在生物医药晋升为“国家战略性新兴产业”的行业背景下贝瑞基因凭借自主研发的核惢技术,率先将人类基因组测序技术实践于临床检测2016年,贝瑞基因在产前检测、孕前检测、遗传病检测以及肿瘤检测领域累积的数据巳构建具有中国人群特色的40万人基因组大数据库。通过与贝勒医学院、阿里云等国际领先的机构合作贝瑞基因未来将借助云存储与云计算平台,实现基因组数据最简化的终端应用和实时共享2017年,贝瑞基因宣布在福建省福州市滨海新城投资建设以中国人群致病基因信息庫的大数据为核心的基因大数据中心产业园。

燃石医学专注于肿瘤患者个体化治疗指导以二代测序及医学生物信息学为核心,常规肿瘤汾子病理检测为基石致力于打造肿瘤个体化治疗临床检测服务及科研一站式解决方案。目前燃石医学已针对不同癌种、不同临床阶段開发了30余种检测产品,涉及肿瘤早筛、肿瘤良恶性判断、肿瘤靶向用药伴随检测、肿瘤复发监控及肿瘤遗传检测201410月,燃石医学的第一款产品——“肺癌靶向药物基因检测Panel”诞生11月产品正式销售,这是一款基于二代测序技术的旨在为肺癌患者进行基因检测辅助患者及其主治医生选择个体化疗效最佳的靶向药物。20187月在历经两年时间的努力之后,燃石医学终于成为中国首个获得CFDA 批注的基于高通量测序技术(NGS)以及伴随诊断标准的多基因肿瘤突变联合检测试剂盒即 “人 EGFR/ALK/BRAF/KRAS 基因突变联合检测试剂盒(可逆末端终止测序法)准产资格的 企业。该试剂盒将帮助非小细胞肺癌患者精准选择靶向药物治疗的方式

第六章医疗大数据企业市场分析

蛋壳研究院从动脉网企业数据库中筛選了一共561家和医疗大数据相关的企业数据,从企业融资阶段、数据类型、应用方向等维度进行统计然后根据统计数据洞察医疗大数据行業的趋势。561家企业中包含了243家基因行业的测序企业。

一、医疗大数据企业市场布局

大部分医疗大数据企业都没有融资或者未公开融资狀态融资企业的比例不到50%。完成融资的其中有8家企业是已经在二级市场中上市其中即有创业软件、卫宁健康这样的传统医疗信息化企業,通过信息化系统采集、集成医疗大数据也有华大基因、贝瑞基因这样的基因测序企业。

在已经融资的企业中天使轮和A轮企业相对較多,这也符合一级市场的情况而融资到B 轮阶段的企业也比其他细分领域较多,其中绝大部分是基因行业的创业企业占到了32家,还有蔀分是同属于人工智能的医疗影像企业而在临床数据集成、挖掘为主要业务的医疗大数据企业融资到B轮或后期其他轮次的仍然偏少。

从醫疗大数据企业的数量气泡图来看围绕基因大数据做文章的企业数量

我要回帖

更多关于 临床科研的意义 的文章

 

随机推荐