日前,第六届中国健康信息处理大会(CHIP 2020)举办的中文医学信息处理评测竞赛圆满结赛,腾讯天衍实验室依托其在医学领域的长期技术积累和创新探索,一举获得“中文医学文本命名实体识别”赛道冠军、“中文医学文本实体关系抽取”赛道亚军。

信息抽取(IE)技术方案突破升级

“英国‘脱欧’给了苏格兰再提独立的理由。相较2014年公投,当前的情形已经发生了变化。”复旦大学欧洲问题研究中心主任丁纯在接受本报采访时分析,苏格兰长期谋求“脱英”,背后有复杂的经济利益纠葛,北海油田的开采权与油气产业收入分配等问题曾长期影响双方关系。

这一简洁而神秘的声明自然会让人们去想象这个问题没有其他的意思。Apple刚刚宣布了一项新的IMG A系列GPU技术产生,该技术声称是迄今为止市场上最快的技术,很可能会在下一代iPhone中使用。然而,该措辞确实暗示苹果可能正在做一些不仅仅需要智能手机GPU的事情,还可能为其AR眼镜甚至基于ARM的MacBook提供动力。

在两大评测任务中,腾讯天衍实验室从数据和模型层面做出了针对性设计。在命名实体识别任务中,天衍实验室使用的数据集由北京大学等院校及科研单位智慧医疗课题组联合构建。基于医疗领域对专业性、准确性的高标准要求,及目前命名实体识别任务存在的实体频次稀疏和实体长度偏长问题,天衍实验室采用指针解码的特殊方式,对单个实体的头尾位置进行解码,经过试验证明,该方法在较长实体中的表现确有明显提升。同时,天衍实验室基于自身在医疗领域的经验,尝试结合大量医疗文本训练领域自适应的新预训练模型,进一步提升了模型表现。最终在评比测试集上,结合多种不同策略,天衍实验室以F1值68.35获得第一名。

腾讯天衍实验室专注于医疗健康领域AI算法研究及落地,旨在依托NLP、知识图谱、大数据、医疗影像等技术系统,将算法能力输出到腾讯健康小程序、QQ浏览器、微信搜一搜等终端应用。与此同时,腾讯天衍实验室还与钟南山院士以及复旦肿瘤医院等头部医院建立联合实验室,与牛津大学、佐治亚大学、天津大学、微众银行AI部门等单位建立长期科研合作关系,目前已发表包括NIPS、KDD等多篇顶级学术论文,通过联合社会各界进行技术深入研究,腾讯天衍实验室将进一步加速科研应用落地,以服务于临床应用。

具体来说,医生在疾病诊断的过程中,不仅要知道患者的症状,而且要了解患者不同症状所对应的具体属性,例如症状发生的时间、部位、变化情况。天衍实验室AI导诊和疾病预测功能,正是采用了上述信息抽取技术,可模拟医生诊断过程,并提供循证路径和一定的可解释性。

主流经济类日报《回声报》在报道中表示,根据中国海关数据,中国出口已经连续6个月实现增长,11月的出口增速几乎是10月出口增速的两倍,达到自2018年2月以来最高水平。与此同时,中国的进口也连续三个月实现正增长。报道表示,由于其他国家再次出现疫情,使得中国医疗设备和物资、用于远程办公的电子产品出口都大幅增加。此外,年底节庆产品、大众电子产品以及高科技产品出口也大幅增加。报道同时指出,由于出口强劲,使得中国当月录得40年来最大贸易顺差。(总台记者 贾延宁)

据英国广播公司报道,今年10月的民调结果显示,58%的苏格兰人会在公投中投票支持独立,这一数字刷新了“脱英”的支持率纪录;此前连续8次民调结果也显示,大多数苏格兰选民赞同独立。

“苏格兰总体倾向于‘留欧’,但由于英欧谈判久拖不决,英国存在比较高的‘硬脱欧’风险,苏格兰更愿意通过独立来赢得主动权,与欧盟保持原先的密切关系。”丁纯说。

对于医学领域的自然语言文献,例如医学教材、医学百科、临床病例、医学期刊、入院记录、检验报告等,这些文本中蕴含大量医学专业知识和医学术语。将实体识别技术与医学专业领域结合,利用机器读取医学文本,可以显著提高临床科研的效率和质量,并且可服务于下游子任务。但要想让机器“读懂”医学数据,核心在于让计算机在大量医学文本中准确的提取出关键信息,这就涉及到了命名实体识别、关系抽取等自然语言处理技术。

按照英国法律,苏格兰举行独立公投必须得到英国政府和议会的批准。今年1月,英国首相鲍里斯·约翰逊明确拒绝苏格兰举行第二次独立公投的要求,称第二次公投会让苏格兰再度陷入政治僵局。

腾讯天衍实验室致力于长期在自然语言基础、语言理解、信息抽取、知识图谱构建等进行研究创新,并将成果运用到落地的医疗自然语言等场景,目前已构建医疗行业大规模知识图谱,支持了数百家医院的辅诊、导诊、疾病辅助诊断、智能用药等产品,助力医保、医院、疾控中心和其他医疗机构的智能化知识挖掘和管理难题,实现知识化转型。

2014年9月,苏格兰曾就是否脱离英国举行公投,最终以55%反对、45%支持的结果留在英国。当时,反对独立的部分声音认为,如果离开英国,苏格兰将失去欧盟成员身份。2016年,多数苏格兰选民在英国“脱欧”公投中投票支持“留欧”。

技术创新助力AI更“懂医”

盘面上,特高压和量子通信、光刻机、国产软件、半导体等科技股强势反弹,口罩、黄金、酿酒概念等跌幅居前。

丁纯指出:“欧盟不希望看到一个分裂的英国,所以在对待苏格兰独立的问题上,欧盟会保持谨慎。”

命名实体识别(Named Entity Recognition, NER)和关系抽取(Relation Extraction, RE)是信息抽取(Information Extraction,IE)的两大核心任务。命名实体识别旨在抽取所需实体,以医疗领域为例,需要从非结构化医学文本中找出医学实体,如疾病、症状的过程;实体关系抽取则需要同时提取出医学实体及实体间的关系信息,即实体关系三元组 [头实体 (subject),关系(predicate),尾实体(object)]。

再提“脱英入欧”计划

实体关系抽取评测任务的数据来源于中文医学信息抽取数据集CMeIE,也是目前最大的中文医学关系数据集。因该数据中存在大量实体重叠和关系重叠的现象,天衍实验室则采用了层叠指针网络的基础架构。首先通过两个二值分类器提取头实体的首尾位置,继而采用Conditional layer normalization的方式融入头实体信息,再针对每种关系,分别预测对应的尾实体。此外,为了更好地利用医疗词汇的语义信息,天衍实验室在输入层融入领域词向量,有效提升了实体边界预测的准确率。最终在测试集上取得单模型第一(F1 61.70),融合模型(F1 63.87)第二的成绩。

“苏格兰独立不会那么简单。”丁纯指出,在“脱欧”背景下,如果英国再陷入四分五裂,对政治、经济、军事而言都是难以承受之重,因此英国不会轻易允许苏格兰“脱英”。“苏格兰谋求独立,也一定程度上增加了英欧双方达成‘脱欧’协议的压力。”

法国第一大报《费加罗报》的报道表示,中国11月出口增速同比达到21.1%,是两年多来的最高水平,这确认了中国经济的复苏。

妮古拉·斯特金日前在接受美国有线电视新闻网采访时表示,英国“脱欧”违背苏格兰人的意愿,苏格兰独立应再次被提上议程。“我们被拖上了这条错误的路,”她表示,“现在是时候让苏格兰人绘制自己的路。”

在医疗领域,电子病历、生物医疗文献中存在大量的非结构化文本,采用信息抽取技术对医疗文本进行结构化,提取其中的疾病,症状,部位等实体,并对实体之间的关系进行判断,进而利用这些信息构建医疗知识图谱,不仅有利于人工智能更好地学到领域内的专业知识,更进一步提升导诊、辅诊、疾病预测等下游医疗任务的性能。

渔业权益也是苏格兰争取的领域之一。据路透社报道,约翰逊曾在“脱欧”前就渔业权益作出承诺,称将收回水域控制权,并依然留住欧盟市场,但目前英欧围绕渔业问题僵持不下。报道指出,如英国拒绝遵守欧盟规定,苏格兰渔民将会承担高额的欧盟市场准入成本。

据美国有线电视新闻网报道,如果英国“无协议脱欧”,英欧间经贸、教育、法律、气候变化等多方面合作将难以推进,后果是“灾难性”的,并且对苏格兰而言打击尤甚。

如在AI导诊场景中,当用户输入主诉,AI导诊小程序可以返回推荐科室。用户主诉中可能包含多个症状,不同症状的时间、部位、严重程度、病因诱因可能对应不同的疾病,通过关系抽取技术,可以捕捉到不同症状的具体属性,从而有助于更精准的疾病预测和科室推荐。对于下图中的患者主诉,首先采用ner技术提取症状、检查等实体,继而采用关系抽取技术对不同症状的具体属性进行判断,例如症状“腹胀不适”,对应的部位为“上腹”,时间为“3月余”,变化条件为“进食后明显”,理解了症状的一系列细粒度属性,才能进一步判断可能的疾病和对应科室。

腾讯天衍实验室基于自身NLP能力和相关科研成果,不断通过一系列信息抽取相关竞赛测试、突破,不仅累积了丰富场景应用经验与方法,也将更好的辅助医疗行业技术升级和科研进步。

英国《金融时报》称,英政府近期推动的《内部市场法案》也为苏格兰的分离倾向“火上浇油”。该法旨在确保英国“脱欧”后,国内各地区无摩擦贸易,但把制定产品标准的权力集中于英政府,影响了苏格兰等地的内部事务自主权。

Apple开始为移动设备制造自己的芯片这一举动意味着苹果将放弃与Imagination合作。Imagination甚至指责苹果收入急剧下降并就突然终止交易提出了投诉。更糟糕的是,据报道,苹果已经雇用了Imagination员工来开发自己的移动图形芯片。

“脱英”可能造成的经济损失是苏格兰当前面临的另一大障碍。根据苏格兰政府公布的财政数据,苏格兰财政赤字在2019—2020财年增至150亿英镑,相当于其GDP的9.4%。《卫报》指出,这一比例高出英国整体赤字水平7%,而欧盟要求其成员国的赤字必须低于3%。

目前,即使在事情变得更糟糕之前两者显然已经解决了分歧。 Imagination宣布,他们与Apple的协议已从“多年多次使用许可”更改为“多年使用许可”。此外,该协议使Apple获得了“ Imagination的更大范围的知识产权”。

《时代周刊》报道称,如果苏格兰“脱英入欧”,将成为与英国这一非欧盟国家接壤的国家,边境管理等问题会使英国“脱欧”谈判复杂化。