一、行业背景
自从Holter(24小时连续动态心电记录)发明以来半个多世纪,随着半导体技术的不断发展,心电记录存储时长已从最初24小时做到14天,设备也从收音机体积降到贴附可穿戴式。大量心电数据的便宜获取使得心电自动分析算法逐渐成为Ambulatory ECG的核心技术门槛。自上世纪80年代开始,美国麻省理工学院和哈佛医学院,政府机构及多家心电企业专家们探索动态心电诊断算法行业标准,直到90年代末形成AAMI 标准被美国FDA和CE采纳为动态心电产品认证要求,极大推动了以欧美为主导的Holter标准化和市场化。
长期以来,我国Holter以进口Holter产品和技术为主,直到2014年10月国家药监局正式颁布了与全球统一的行业YY标准,提供了国产产品与进口产品一致性评价的客观路径,将对国产心电诊断技术产品的创新和发展产生深远影响。
越光医疗自2016年获得新标准下药监局批准的长时程可穿戴式动态心电记录仪,陆续推出了个人心律监测和社区心律患教机等专利创新产品。利用医疗心电传感技术和独有超低功耗技术实现了无需充电的连续不断(最长30天)或高频次(2万次)心电采集,性能和功能达到或超越美国行业同类产品。极大降低医生操作门槛,提升患者依从性,并且在全国范围内200多家医疗机构得到广泛和稳定的临床使用。但与此同时,也带来海量心电原始数据,医疗机构对心电智能处理的时效性和准确性的要求与日俱增。
二、挑战与机遇并存
虽然传统心电图机发明已超过100年历史,但临床心律失常的诊断仍依赖动态心电或Holter。中国有近3亿心血管疾病人群。60岁以上超过2亿。常见心律失常如房颤带来5倍以上脑卒中风险,也是造成20%以上脑梗的主要原因。除脑梗、猝死等风险,心律失常也将严重降低患者生活质量,治疗或长期管理不善甚至导致结构型心脏病或心衰等不可逆慢病。
据统计,我国每年进行2.5亿次10秒常规心电图和3500万份动态心电图检查,而心电图医师约有3万名。临床出具1份动态心电报告需要基于15-30分钟的数据清理。如果每位医生每日处理超过10份动态心电报告和100份常规心电图则会带来巨大工作负担。因此无论临床诊断,或健康预防,心电检查服务都需要供给侧改变,这正是我们对人工智能的应用期望之一。
美国过去10年间,由于其医疗保险特有制度,形成了第三方独立诊断服务中心,为全国范围内临床医生提供心电处理服务。也由此成就了不少成功企业,例如iRhythm和CardioNet,日均服务上万人次,市值共计40亿美元(约人民币280亿)。
因此,对于如中国、印度等人口众多,医疗资源地域差异大、相对缺乏的国家或地区来说,需求大,挑战大,但创新和市场的想象空间更大。
三、AI在心电诊断中的应用
吴恩达领导的斯坦福大学团队在今年的Nature Medicine发表了深度神经网络学习(DNN算法)在心律失常自动诊断的应用结果:通过91232份单导联心电记录(平均10.6天)对比算法和普通医生,发现前者(ROC达0.97)的平均阳性预测率和平均敏感度均超过后者。
越光认为AI在医疗领域的应用有三种方向:
(1)比医生做得更好的AI,因为医生肉眼有限;
(2)比医生做得更快、可以辅助医生提高工作效率的AI;
(3)可以通过大量学习资深医生或专家经验,帮助普通医生或基层医生达到工作要求的AI。
吴恩达团队该项研究也验证了AI在(2)和(3)方面的可行性和共性,即监督化学习和海量临床数据。
四、越光医疗在心电智能大赛中的突破
京东云与AI和清华数据院提供了本次大赛计算基础设施和计算能力,清华大学医学院和清华长庚医院等组织设计了比赛所用常规心电图数据库,共计20000多条,包括正常心电图,八种异常心电图(心房颤动、一度房室传导阻滞、右束支阻滞、左前分支阻滞、室性早搏、房性早搏、早复极图形改变和T波改变),以及“其他心电图”。“其他心电图”较广泛地覆盖了以上9类无法准确描述的心电图数据。
越光医疗参赛算法基于ResNet并进行了如下创新:
(1)结合深度学习与传统心电处理及特征工程的特点实现有效平衡,比如通过希尔伯特变换增加心电信息,对信号降采样以提高效率并避免过拟合,提取QRS位置,RR,RR变化率,QRS宽度,ST段高度,电轴方向等诸多传统特征,对传统特征进行直方图,求最高、最低、平均、方差等方式进行变换,并进行Z Normalization(归一化),对于频繁出现的异常采用Global Pooling,对于偶然出现的异常采用Max Pooling。
(2)使用单一模型预测互斥与共存进行分类
定义损失函数的两部分及其主要任务,并根据训练集数据标签进行频率加权:
- Multi-class softmax cross entropy 区分:正常,待确认异常,和未知异常
- Multi-label binary cross entropy 识别:8种待确认异常
(3)根据心电数据特点进行预处理和扩张
在每个Batch中,通过数据随机截取至最短长度作为一种数据平移的数据增强,并根据预处理结果保留有效信息的片段。
(4)实现更强的可解释性
考虑到实际临床工作中医生可能对“黑箱”式诊断算法存在顾虑,越光医疗引入Class Activation Mapping技术可视化神经网络学习的关键过程,做到既能打破“黑箱”又能获取医生反馈从而进一步学习,该策略获得总决赛评委的一致认可和好评。
(5)结合多种防止过拟合的方法避免过度拟合
通过多任务学习共享权重,如各类异常共享ResNet提取的特征,Global Pooling,对模型采用L2正规化项,提前终止,使用滤波降低噪音,不影响诊断的前提下,降低采样率,及Bagging等技术。
(6)保证算法的可拓展性
实现通过对单一模型的简单修改即可完成对更多互斥或共存的异常分类。
越光参赛算法一路过关斩将,得到了F1=0.879的总决赛高分以及最高答辩评分,获得本次大赛的一等奖的同时,也被2019年国际医学图像计算和计算机辅助领域的顶级综合性学术会议(MICCAI)论文收录。越光通过实践验证了以上创新点的正确性。
尽管如此,大赛与越光实际临床业务还存在不少方面的差异。比如:
(1)心电数据类型与采集时间。大赛提供数据为10秒的12导联心电图片段。越光业务数据为连续动态心电图(最长30天)的单导联心电图,或30秒的单导联心电图片段。虽然10秒12导联常规心电图机在临床和体检已广泛应用,但对心律失常的诊断仍是以最少24小时的动态心电为主,而且记录时间越长、患者佩戴依从性越好,捕捉心律失常的能力就越高,已经形成全球临床专家共识和指南。
(2)数据规模。大赛共20000多条数据,每条数据几百KB量级,总量几百M。而越光业务数据每条数倍于常规心电图,多数单条数据超过100M,数据总量达TB级别,累计几十万人次且保持每月不断持续高速增长。
(3)比赛与临床诊断要求。 大赛仅要求结论性判断,使用的F1评分兼顾准确性和敏感度的平衡。而实际临床诊断不仅要求敏感度和准确度高,对于假阳性或假阴性的容忍度也较低。除了结论性判断,更要求对于心拍检出和心率检出,甚至各类心律失常事件负荷度的统计,才能支持临床诊断服务的要求。
(4)响应时效要求。大赛是针对离线数据进行调优,而实际临床诊断需要实时或较短(24小时内)的准确结果才能保证患者就诊流畅。
五、越光医疗在现有产品中的应用实施案例
国外临床文献早在2009年就进行过大规模和多中心的单导联与12导联的单盲诊断对比,发现针对房颤和正常心律检测的准确性可以高达96%-99%以上。
越光现有产品通过传统心电分析和心律失常诊断算法,虽然在国家药监局和FDA及CE行业标准要求的数据库(MIT、AHA等DB)评测达到30秒及以上房颤检出率100%,但在真实临床使用中,仍存在需要临床医生审核干预去除假阳性检查的工作环节。因此不断提升算法,降低真实世界的假阳性检出率来不断减少一线医生工作是AI在心电医疗应用的真实需求之一。
为此,越光将此次大赛算法应用到通过越光产品产生的46万人次30秒单导联心电数据库中,与心电医师确认结果进行单盲比对,发现4.5%的噪声或伪差之外,房颤检查的准确性可以达到94.7%。越光与中国和美国心律临床专家一道将研究结果提交2020年度的国际心律学会(Heart Rhythm)会议论文。
六、可持续性创新合作
本次大赛给予了像越光医疗这样的医疗器械企业与京东云与AI和清华数据院的可持续性创新合作机会。除了与临床机构或客户端的落地应用,越光认为企业可以在以下方面借力IT基础设施提供方(如京东云与AI):
(1)提供流畅和安全的数据服务:中国有3万家医疗机构和90多万家基层卫生服务中心,遍布全国各地。网络条件地区性差异与海量数据上行下传将是首要需要解决的问题,需要尽可能靠近用户并且覆盖多运营商的节点提供数据接收服务。此外,数据安全性要求和级别也将随着规模的迅速扩大而提上日程。比如,可以选择京东云与AI OSS用户所在地域节点实现接收并存储数据,以达到需求。
(2)提供高速经济的规模化模型训练:实际临床数据总量量级,如果在自有服务器训练需要经由京东云与AI OSS相关数据服务,有耗时长且自有服务器能力不足等缺陷。比如,可直接在京东云上使用GPU云主机进行数据训练,并通过内网快速拉取OSS数据供单机使用的测量,以达到需求。
(3)模型部署与弹性伸缩:临床实际使用中,算法只需对每条数据一次性处理,并且每日使用频次波峰波谷将明显突出,与实验或回测工作形成鲜明不同。因此,可采取直接使用CPU进行处理,并封装至docker镜像内的策略。并通过京东kubernetes集群配合弹性伸缩对用户数据完成及时相应,以达到需求。
在解决了以上问题的基础上,可以和有心律失常社区化管理需求的地区性中心医院建立心律失常分级诊疗医联体模式的多方运营合作,形成样版工程。
七、结束语
首届“中国心电智能大赛”虽然顺利落下帷幕,但大赛在推动中国心电人工智能在临床实践方面提供了可借鉴、能实践的案例,属于推动健康医疗和大数据发展的一次里程碑。
在建立不断壮大的临床数据库持续推动临床和科研创新的过程中,完善可复制性产品和服务方案,既满足医院和患者的实际需求,又实现国家对健康中国的战略性要求。
再次感谢本次大赛的举办单位,清华大学临床医学院、数据科学研究院,北京清华长庚医院,青岛大学附属医院,天津市武清区人民医院,中关村医院,福建省立医院,京津高村科技创新园,京津高村科技创新园,京东云与AI云桌面云平台技术支持。
这是笔者第一次参加基于深度学习应用开发的比赛,为了让更多像笔者一样才入门的朋友能尽快上手,所以记录下来了笔者整个初赛解题思路与实践过程。最后很感谢举办方组织的这个比赛,让参赛选手收获很多实战经验与应用技巧。
点击【阅读】可查看更多大赛赛程及成果