如何大数据会挽救你的生命

罗伯特·沃克博士,为美国陆军外科医生一般健康创新的主任,一直比较沮丧的数据录入员在最近几年比医生,成千上万他的同事们共享的无奈。

他使用的电子健康记录(EHR)系统并没有让他有更多的时间与病人见面,而是变成了检查室里的第三个人,把他的注意力从病人身上引开。然而,问题不在于EHR Walker使用了什么;这是一般技术的缺点。

[ALSO:7个步骤,以大数据的成功]

“电子病历已成为阻碍对一些将要简化你的一天,”沃克在最近的一次采访中解释。“这花的焦点远离患者,并把它所有的计算机上。人们点击箱子和把他们背到病人。这是所有关于干扰数据到这件事情。”

电子病历能够为每一个医疗机构以电子方式获取病人的家族史,疾病治疗和目前的生活方式。电子病历的承诺是,他们将美国的卫生保健系统节省高达每年$ 81十亿通过简化工作流程和创建可开采可能提高预防保健和疾病治疗的信息大量的临床数据仓库。

这还没有发生,和医生少用电子病历,结果迷恋。上个月,医生和AmericanEHR合作伙伴的美国大学发布的4279名医生是给他们的完全39%,他们的EHR不会推荐给同事的调查。从谁觉得这种方式在2010年34%的人说他们是“非常不满意”的电子健康档案,以减少工作量的能力,24%的最高。

在《健康信息技术促进经济和临床健康法案》(HITECH Act)的支持下,美国政府要求医疗保健提供者——医院、诊所和私人诊所——实施电子健康档案。供应商还必须通过政府在未来四年中将进行的三个阶段的程序,证明他们对这些系统的有意义的使用。

Despite what has so far been an uneven rollout of EHRs in the U.S., Walker and others are already, in effect, building what a treasure trove of patient information that can be tapped to improve patient care, a repository that will revolutionize medicine for decades to come. That is, if everyone can figure out how to categorize it, sort it and access it easily.

承诺

大数据分析引擎,如Hadoop的有能力通过矿井创建电子病历临床数据仓库,充满了宝贵的非结构化数据仓库,可以用来帮助医生做出有关病人治疗的决定。

今天,医生和制药公司主要靠的还是课本和无穷小的临床研究通常采用健康的患者仅有一种疾病。科目很难模仿最真实世界的患者,其中许多人有一个以上的健康问题,池。

大约25%的医院使用某种形式的数据分析挖掘传统的数据库,以了解更多关于过去治疗的信息,以及如何改进未来的治疗。但是,数据库的列和行所包含的内容只代表了所收集的病人信息中几乎微不足道的一部分;最重要的信息存在于非结构化数据中——医生的记录、放射图像和使用移动设备从病人那里收集的生活方式信息。

沃克说:“这将是医疗保健领域真正的复兴。”“有了大数据,医生办公室里发生的事情将与我们今天看到的大不相同。”在美国,人们最常死的五到十件事是由生活方式引起的。这是荒谬的。也许我只会看你在杂货店买的东西,而不是生命体征。”

今天,大多数医院的数据分析被用来管理成本和提高医疗质量。然而,大数据更有希望的用途是,利用医生和护士的笔记以及基因图谱驱动的数据,发现治疗和结果之间的相关性。

通过结合大数据和遗传学分析,今天的科学家能够确定如何病人会做出反应的药物,并可能有一天甚至能够预测谁可能生病和 - 如果他们这样做 - 什么定制药物能够最好地治疗疾病。

医疗信息和管理系统协会(HIMSS)的临床和商业智能高级主任James Gaston说:“当我看到历史增长率时,(大数据)肯定是市场上的热门应用。”

个性化医疗

目前,大数据分析的一个更有前景的领域是通过基因组学研究设计的药物疗法,也被称为个性化药物。

遗传疾病是类似于在软件缺陷代码;的关键是找到一种疾病的原因是发现该错误代码,按照亚历克西斯Borisy,基金会医学,癌症诊断公司的联合创始人。

“癌症,例如,在这里出了一些错误的编程代码基因组的疾病和发生了突变。有在代码中的错误实际,这是一个核心的原因,癌症的发展,” Borisy说。

虽然测序第一个人类基因组历时8年,耗资约十亿$,基因测序成本在过去十年中急剧下降。现在从$ 5,000到$ 10,000人类基因组的成本,公司正在努力削减成本是$ 1,000,在未来的几年。测序的DNA链变得如此便宜,医院将很快能够做到这一点对大多数病人和数据添加到电子病历,根据根据Nigam的沙阿医学院斯坦福大学医学院助理教授。

沙阿工作在生物医学信息,这意味着他对工作做出的临床数据仓库中的信息意识。

人类基因组的测序产生的数据的巨量和存储一个人的遗传密码最多可能需要的数据存储容量1TB,Shah表示。

人类基因组包含32亿行代码,这意味着要找到代码中的缺陷,需要复杂的计算机算法和庞大的集群服务器群。沙阿说,更复杂的是,疾病往往是多重突变的结果。

亨廷顿舞蹈病或阿尔茨海默病等疾病是由常见的基因突变引起的,而且更容易被发现,但大多数疾病是由罕见的突变引起的。例如,糖尿病被认为是由一些基因突变引起的,这些基因突变本身会带来少量的风险,但结合起来可能会更严重。

沙阿说:“如果你对某个人进行基因组分类,在50个(与糖尿病相关的突变)中,你有10个,很难说你会发生什么。”“部分问题是我们只需要做更多的研究和收集更多的数据,其中一些我们只是需要更好的方法。”

但巨大的进步已经取得进展。迄今为止,科学家现在知道的约5000罕见疾病的遗传原因。

一个遗传研究的最有前途的领域是药物基因组学,它使用一个人的基因组成,以确定他们会如何反应的药物,剪裁处理,以特定的突变 - 在癌症肿瘤中发现,甚至突变。

例如,药物Zelboraf由纽约大学癌症研究所在几年前通过基因测试来表达称为BRAF V600E基因突变的目标黑色素瘤皮肤癌肿瘤的发展。研究人员发现,患者服用Zelboraf分别为64%不太可能从皮肤癌的高级形式,以死谁比只接受标准化疗的患者。

“观察你的基因组确实有助于说,‘对你来说,我们应该给你这种药物的一半剂量,但对另一个人,我们会给你两倍剂量的那种药物,’”沙阿说。

将EHRs与基因组连接起来

目前,有几个项目正在进行中,以连接电子健康档案和人类基因组数据。其中最有希望的是电子医疗记录和基因组网络。

由美国国家人类基因组研究所的资助下,出现网络连接九个医疗研究机构和医院的研究人员具有广泛的基因组学,统计学,伦理学,信息学和临床医学专业知识。多达10000名患者将测序他们参考83个特定基因进行,与其他50,000-80,000患者越来越普遍的基因型。

华盛顿大学(University of Washington)医学遗传学系主任盖尔·贾维克(Gail Jarvik)博士表示,由此获得的数据将改善遗传风险评估、疾病预防、诊断和治疗,并可用于开发基于基因组的药物。

在出现网络包括华盛顿大学,梅奥诊所,波士顿儿童医院和格伊辛格卫生系统。网络开始了寻找基因比较常见的疾病,使用计算机算法与电子病历找到与特定基因型相关的疾病。

“今年,网络搬进药理学,并且在相关的治疗反应或对药物不良反应的基因测序很感兴趣,”亚尔维克说。

Jarvik是该网络的主要研究者之一,他说该网络已经成功地发现了疾病基因、免疫基因以及眼和心脏疾病。

在emerge项目开发了一个计算机算法,从各机构的许多不同的电子健康档案的提取物的疾病类型。研究人员然后输入数据,寻找遗传标记点负责疾病的基因突变。

“当你移动到药理学,还有你可以有毒品问题,”亚尔维克说。“一种药物可能是无效的,否则你可能会有效地使用这种药物,但你可能需要不同的剂量不是别人,或者你可能有一个坏的反应。我们要对所有这些问题的工作。”

Shah和其他研究人员告诫说,许多因素都会影响人的健康,和基因组学不会是万能的。但使用大的分析可以帮助改善患者的预后。

笔记、图像和生物识别

基因组学的无数努力改善医疗保健只有“一个小部分”,沙阿说。“对于普通人谁都有高血压,糖尿病[和]高胆固醇,基因组学是完全无用的。”

一个在诊断和跟踪还是患者最有价值的工具包括医疗记录,以及新的自然语言处理软件允许这些医生的笔记被编入数据库字段,大部分医疗卫生专业人员没有时间填写自己。

“纹理笔记医生如何与这是怎么回事就与病人的其他医疗服务提供者沟通,有什么治疗计划,什么是关注,”艾萨克博士小号小羽,哈佛医学院小儿科和健康科学技术教授说,与儿童医院。

小羽是沮丧,它更容易找到更多关于购物者的经验用数码相机购买比来确定哪些不良事件患者与特定的药物。因此,与几个同事一起,小羽开发了一个名为i2b2信息学可以从病人的床边同时收集医师笔记和其他非结构化数据以及编纂医疗数据免费的开源软件。

信息学平台是由世界各地100多个学术医疗中心使用。它已被用于精确定位的疾病遗传预测如类风湿性关节炎和识别有害的药物。

例如,信息学引擎透露,有来自药物文迪雅比同一类等药物心脏发作的风险较高。

当i2b2软件在医院急诊室部署,它能够预测,平均而言,提前两年典型的医疗系统患者是否是从家庭虐待通过检测物理性状痛苦,小羽说。

“同时,这几乎就像一个后门,这些数据被卸载和分析[事后]。什么跨医疗保健系统的实时照顾病人?”他说。

在长期护理,最重要的是,一个医生能够访问包含上千种类似患者临床信息数据仓库。

“重要的是说你有这四种疾病和你正在做这四种药物的能力,为医生,这里是治疗这些其他类似患者的结果,”沙阿说。“目前还没有临床试验已经每望着这四种疾病和这四个药物的效果。”

当来自电子健康档案的数据可以无缝交换时,医生就可以查询成千上万的其他医生在同样的情况下做了什么。

“那我要问自己,“我是什么担心这个人:?我担心血块或心脏攻击”沙阿说。“然后我就可以查询了什么事谁遭受了血块,并确定1000其他人......在那些人的结果非常相似,你的。”

“这有点像在硅谷做临床试验,”沙阿继续说。“我把这整个过程称为基于实践的医学。”

历史上,医学一直依赖于已发表的治疗指南或药物处方的临床试验结果,这些指南总是只关注一种疾病,通常只使用年轻、健康的病人作为测试对象。

数据鸽笼

12 第1页
页面1的2
IT薪资调查:结果是