历史上的今天
返回首页

历史上的今天

今天是:2025年03月06日(星期四)

正在发生

2018年03月06日 | 谷歌开源FHIR标准协议缓冲工具,利用机器学习预测医疗事件

2018-03-06 来源:雷锋网

在1月26日,谷歌在arXiv上发表的一篇论文《Scalable and accurate deep learning for electronic health records》( Alvin Rajkomar et al.)。文中他们提出基于快速医疗保健互操作性资源(FHIR)格式的患者EHR原始记录表示,利用深度学习的方法,准确预测了多起医疗事件的发生。

论文摘要如下:


使用电子健康记录(EHR)数据的预测建模预计将推动个人化医疗并提高医疗质量。构建预测性统计模型通常需要从规范化的EHR数据中提取策略预测变量,这是一种劳动密集型过程,且放弃了患者记录中绝大多数信息。我们提出基于快速医疗保健互操作性资源(FHIR)格式的患者全部EHR原始记录的表示。我们证明使用这种表示方法的深度学习方法能够准确预测来自多个中心的多个医疗事件,而无需特定地点的数据协调。我们使用来自两个美国学术医疗中心的去识别的EHR数据验证了我们的方法,其中216,221位成年患者住院至少24小时。在我们提出的序列格式中,这一块EHR数据总计包含了46,864,534,945个数据点,包括临床说明。深度学习模型对预测院内死亡率(AUROC跨站点0.93-0.94),30天无计划再入院率(AUROC 0.75-0.76),延长住院时间(AUROC 0.85-0.86)以及所有患者的最终诊断(频率加权AUROC 0.90)等取得了极高的准确度。在所有情况下,这些模型的表现都优于传统的预测模型。我们还介绍了一个神经网络归因系统的案例研究,该系统说明临床医生如何获得预测的一些透明度。我们相信,这种方法可以为各种临床环境创建准确的、可扩展的预测,且附有在患者图标中直接高亮证据的解释。


在这项研究过程中,他们认为若想大规模的实现机器学习,则还需要对FHIR标准增加一个协议缓冲区工具,以便将大量数据序列化到磁盘以及允许分析大型数据集的表示形式。


昨天,谷歌发布消息称已经开源该协议缓冲区工具。下面为谷歌博文内容,雷锋网(公众号:雷锋网)编译如下:


过去十年来,医疗保健的数据在很大程度上已经从纸质文件中转变为数字化为电子健康记录。但是要想理解这些数据可能还存在一些关键性挑战。


首先,在不同的供应商之间没有共同的数据表示,每个供应商都在使用不同的方式来构建他们的数据;


其次,即使使用同一个供应商网站上的数据,可能也会有很大的不同,例如他们通常对相同的药物使用多种代码来表示;


第三,数据可能分布在许多不同表格中,这些表格有些存在交集,有些包含着实验数据,还有些包含着一些生命体征。


采用至少一个基本电子病历系统并拥有经过认证的电子病历系统的非联邦急性护理医院的百分比。Basic的电子健康记录( Electronic Health Record ,EHR)满足EHR系统的基本功能,Certified EHR表示医院已经与EHR有法律协议,但不等同于采用了EHR系统。


快速医疗保健互操作性资源(Fast Healthcare Interoperability Resources,FHIR)作为一项标准草案,描述的是用于交换电子病历数据格式和数据元以及应用程序界面,该标准由医疗服务标准组织Health Level Seven International制定。这项标准已经解决了这些挑战中的大多数:它具有坚实的、可扩展的数据模型,建立在既定的Web标准之上,并且正在迅速成为个人记录和批量数据访问中事实上的标准。但若想实现大规模机器学习,我们还需要对它做一些补充:使用多种编程语言的工具,作为将大量数据序列化到磁盘的有效方法以及允许分析大型数据集的表示形式。


今天,我们很高兴开源了FHIR标准的协议缓冲区工具,该工具能够解决以上这些问题。当前的版本支持Java语言,随后很快也将支持C++ 、Go和Python等语言。另外,对于配置文件的支持以及帮助将遗留数据转换为FHIR的工具也将很快推出。


开源地址:https://github.com/google/fhir


协议缓冲区工具:https://developers.google.com/protocol-buffers/


FHIR作为核心数据模型


在过去几年中,我们一直在与学术医疗中心进行合作,利用机器学习的方法“去识别”(de-identified)医疗记录(即剥离任何个人身份信息,以预测未来可能的情况,可以在症候出现前预知患者的需求。),很明显我们需要正视医疗保健数据中的复杂性。事实上,机器学习对于医疗数据来说非常有效,因此我们希望能够更加全面地了解每位患者随着时间的推移发生了什么。作为红利,我们希望拥有一个能够直接应用于临床环境的数据表示。


尽管FHIR标准能够满足我们的大多数的需求,但是使用医疗数据将比“传统”的数据结构更容易管理,并且实现了对立于供应商的大规模机器学习。我们相信缓冲区的引入可以帮助应用程序开发人员(机器学习相关)和研究人员使用FHIR。


协议缓冲区的当前版本


我们已经努力使我们的协议缓冲区表示能够通过编程式访问以及数据库查询。提供的一个示例显示了如何将FHIR数据上传到Google Cloud的BigQuery(注:BigQuery 是 Google 专门面向数据分析需求设计的一种全面托管的 PB 级低成本企业数据仓库。)并将其提供给外部查询。我们也正在添加其他直接从批量数据导出并上传的示例。我们的协议缓冲区遵循FHIR标准(它们实际上是由FHIR标准自动生成的),但也可以采用更优雅的查询方式。


目前的版本还没有包括对训练TensorFlow模型提供支持,但未来将更新。我们的目标是尽可能地开源我们最近的工作,以帮我们的研究,使其更具可重复性并能够适用于现实世界的场景当中。此外,我们正与Google Cloud中的同事进行密切合作,研究更多用于管理医疗保健数据的工具。


推荐阅读

史海拾趣

ADI Electronics Inc公司的发展小趣事

随着全球化进程的加速,ADI也逐渐将业务拓展至全球范围。公司不仅在全球各地设立了研发中心和销售网络,还与众多国际知名企业建立了战略合作关系。这些合作不仅为ADI带来了更多的商业机会,也使其能够更好地了解全球市场的需求和趋势,为公司的长远发展奠定了坚实基础。

这五个故事展示了ADI Electronics Inc公司从创业初始到发展成为电子行业领军企业的过程。通过不断创新、并购重组和全球化拓展,ADI成功地在激烈的市场竞争中脱颖而出,成为一家备受尊敬的企业。

请注意,由于无法实时获取ADI的最新发展动态,上述故事中的部分细节可能已随时间发生变化。如需获取更详细和准确的信息,建议查阅ADI的官方网站或相关新闻报道。

Hamamatsu公司的发展小趣事

ADI的创业故事始于1965年,创始人Ray Stata与Matthew Lorber在美国马萨诸塞州剑桥市的一座公寓地下室开始了他们的创业之路。最初,ADI并没有直接涉足芯片制造,而是专注于开发运算放大器等分立器件,以提供精确放大的改良型电信号。这一决策是基于当时新兴市场的需求,展现了两位创始人的市场敏锐度和创新精神。

Glorious Sources Co Ltd公司的发展小趣事
确认声音输出装置(如扬声器)是否完好且连接正确。
Acme Electric Corporation公司的发展小趣事
选用灵敏度更高、噪声更低的光电传感器和声音输出装置等元件。
绿宝石(BERYL)公司的发展小趣事

随着国内市场的饱和,绿宝石公司开始积极拓展国际市场。公司加强了与国际知名企业的合作,共同开发新产品、新技术。同时,绿宝石公司还在海外设立了研发中心和生产基地,以便更好地服务全球客户。通过一系列的市场拓展和国际化战略,绿宝石公司的国际影响力不断提升。

ECM [ECM Electronics Limited.]公司的发展小趣事

ECM Electronics Limited.自创立之初,就注重技术创新。公司投入大量研发资金,专注于开发高效、节能的电子产品。通过不断的技术迭代和产品创新,ECM成功推出了一系列具有竞争力的产品,逐渐在市场上建立了良好的口碑。同时,公司还积极与高校和科研机构合作,引进先进技术,为公司的持续发展提供了强大的技术支撑。

问答坊 | AI 解惑

求合作微波射频工程师

我们有个机顶盒样的东西,现在需要抄板子,把PCB电路图,电子元器件详细清单还有工艺书弄出来,有那位感兴趣可以联系03162324011,陈先生…

查看全部问答>

模具控制器(模具监视器)在注塑生产中对模具的保护应用

注塑机运行时,每个周期内昂贵的模具都可能因为残留或滑块错位而有损坏的危险,上海协之塑机电有限公司(http://www.pt88.cn)主导的模具保护器(模具监视器)可以防止这些情况发生! 时下最先进的机器视觉技术用来进行检查,自动防止闭模并报警, ...…

查看全部问答>

合成的电流矢量怎么回事

三个电流的和不是等于零的吗  ,怎么还有个合成的电流矢量啊,不是等于零吗…

查看全部问答>

PSpice_-_Model_Editor_系列介紹_(III)

PSpice_-_Model_Editor_系列介紹_(III)…

查看全部问答>

请教关于RTX Serial API的一点问题

我在网上下了这个串口的程序,就是如果直接运行进不了中断处理函数,如果我打开串口调试工具的话程序一过 thisUcb->isrHandle = RtAttachInterruptVector                     ...…

查看全部问答>

如何实现printf????

各位大侠:    我想在单片机下实现串口打印功能的一个函数PrintfEx 但是要可以想printf一样格式化变量 如: int a = 100; PrintfEx(\"a is %d\\r\\n\",a); 请问如何实现这一功能呢?谢谢!…

查看全部问答>

HD Audio 音频驱动调试问题

wince下HD Audio 音频驱动开发时,在调试时发现有调试信息时,播放声音文件可以听到断续的声音,但去掉调试信息后无法听到任何声音,不知是什么原因,请指教! 不慎感激!! …

查看全部问答>

如何从winow mobile5.0 切换到wince5.0中

我的程序是在VS2005上开发,用的是windows mobile 5.0 PocketPC(compact Framework1.0)版本 现在想切换到wince5.0平台上。 使用project->change target platform ,发现无法 切换到wince5.0,主要原因是wince5.0的project需要的是compact Framew ...…

查看全部问答>

ARM9 触摸屏显示不正常

最近小弟碰到一个很郁闷的问题 就是用2440写一个触摸屏的程序, 在调试的时候 ,发现只显示X轴或Y轴的时候 是正常的 但是两个轴一起显示,数据就不正常了! 不知道有没有谁碰到过这种问题, 请多多指教!…

查看全部问答>