知识图谱研究综述及其在医疗领域的应用

分类:论文范文 发表时间:2021-04-13 09:23

  摘要随着医疗大数据时代的到来,知识互联受到了广泛的关注.如何从海量的数据中提取有用的医学知识,是医疗大数据分析的关键.知识图谱技术提供了一种从海量文本和图像中抽取结构化知识的手段,知识图谱与大数据技术、深度学习技术相结合,正在成为推动人工智能发展的核心驱动力.知识图谱技术在医疗领域拥有广阔的应用前景,该技术在医疗领域的应用研究将会在解决优质医疗资源供给不足和医疗服务需求持续增加的矛盾中产生重要的作用.目前,针对医学知识图谱的研究还处于探索阶段,现有知识图谱技术在医疗领域普遍存在效率低、限制多、拓展性差等问题.首先针对医疗领域大数据专业性强、结构复杂等特点,对医学知识图谱架构和构建技术进行了全面剖析;其次,分别针对医学知识图谱中知识表示、知识抽取、知识融合和知识推理这4个模块的关键技术和研究进展进行综述,并对这些技术进行实验分析与比较.此外,介绍了医学知识图谱在临床决策支持、医疗智能语义检索、医疗问答等医疗服务中的应用现状.最后对当前研究存在的问题与挑战进行了讨论和分析,并对其发展前景进行了展望.

  关键词知识图谱;智慧医疗;大数据;知识融合;自然语言处理

知识图谱研究综述及其在医疗领域的应用

  随着信息技术和互联网技术的持续发展和不断变革,人类先后经历了以文档互联为主要特征的“Web1.0”时代与数据互联为特征的“Web2.0”时代,正在迈向基于知识互联的崭新“Web3.0”时代[1].知识互联的目的是构建一个人与机器都能够理解的万维网,使网络更加智能化.然而,由于万维网上的内容多源异质、组织结构松散,给大数据环境下的知识互联带来了极大的挑战[2].因此,人们需要依据大数据环境下的组织知识原则,探索既符合网络信息资源不断变化规律又能切合适应用户认知需求的知识互联方法[3],使其更加深刻地展示整体而相互关联的人类认知世界[4].知识图谱(knowledgegraph)就是在这样的大背景下产生的一种知识表示和管理的方式,它是实现智能化语义检索的基础和桥梁,为万维网上知识互联奠定坚实的基础[5].

  更新了一篇医学相关的论文,如全科医师发表论文方法,您可以点击并前往查看。

  1知识图谱的定义与架构

  1.1基本定义

  知识图谱是语义网(semanticWeb)技术之一,是一种基于图的数据结构,由节点(实体)和标注的边(实体间的关系)组成[11],它本质上是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述[12].和传统的Web页面网络相比,知识图谱中的节点由网页形式变成了不同类型的实体,而图中的边也由连接网页的超链接(hyperlink)变成了实体间丰富的各种语义关系.

  .2体系架构构建医学知识

  图谱的主要目的是抽取大量的、让计算机可读的医学知识[15].在医疗信息技术飞速发展的今天,医学知识大量存在于非结构化的文本数据、半结构化的表格、网页以及部分医疗信息系统的结构化数据中,因此现有的医学知识图谱模型均为判别模型.通过训练使该模型能够区分不同关系的实体对,或者从随机抽样的无关负实体中识别有意义的实体对.为了阐述如何构建知识图谱,本文给出了医学知识图谱的体系架构,即其构建模式结构,如图2所示.

  2医学知识图谱的关键技术

  理解、推理和归纳能力是人类智力的核心[16].然而对于机器而言,想要理解和推理出2个实体之间的关系具有很大的挑战.具体来说,现实世界中的医疗关系实体具有非常复杂的属性:首先,医学实体通常使用不同的语言表达.例如noseplugged,blockednose和sinuscongestion都代表着鼻塞,却有不同的表达方式;其次,实体之间的关联关系可能拥有不同粒度和强度.例如Disease→CauseSympton这一关系会包含例如?鼻炎,导致,鼻塞?的粗粒度实9852侯梦薇等:知识图谱研究综述及其在医疗领域的应用体对,也会包含例如?急性鼻炎,导致,鼻塞?,?慢性鼻炎,导致,鼻塞?的细粒度实体对.对于关系的强弱程度,?感冒,导致,疲劳?的关系比?感冒,导致,耳部感染?的关系要强,因为感冒很少会引起严重的耳部感染.这些知识对于人类来说非常简单,但是对于机器来说,要深刻理解实体之间关系的共性仍然是一个挑战.

  3医学知识图谱应用知识

  图谱为医疗信息系统中海量、异构、动态的医疗大数据的表达、组织、管理及利用提供了一种更为有效的方式,使系统的智能化水平更高,更加接近于人类的认知思维.目前医学知识图谱技术主要用于临床决策支持系统、医疗智能语义搜索引擎、医疗问答系统、慢病管理系统等.

  4讨论

  知识图谱技术是对语义网技术的一次改造和升华.自Google提出知识图谱这一概念至今,其热度仍然只增不减.通过对知识图谱构建技术体系进行深入观察和分析,可以看出它是建立在多学科领域研究成果的基础之上的一门实用技术,是人工智能、信息检索、自然语言处理、万维网等交叉领域的理论研究热点和应用技术的集合.就医学领域而言,由于医学知识和规则的专业性、规范性、术语有限性等特点,可以从标准化医学词典、医学数据库等来源中获取高质量数据并构建医学知识图谱.虽然目前有很多项目进行医学知识图谱技术的研究,但医学知识图谱构建的关键环节还面临着一些巨大的困难和挑战.

  参考文献

  [1]YuanKaiqi,DengYang,ChenDaoyuan,etal.Constructiontechniquesandresearchdevelopmentofmedicalknowledgegraph[J].ApplicationResearchofComputers,2018,8(7):1929-1936(inChinese)(袁凯琦,邓扬,陈道源,等.医学知识图谱构建技术与研究进展[J].计算机应用研究,2018,8(7):1929-1936)

  [2]RuanTong,SunChenglin,WangHaofen,etal.Construc-tionoftraditionalChinesemedicineknowledgegraphanditsapplication[J].JournalofMedicalInformatics,2016,37(4):8-13(inChinese)(阮彤,孙程琳,王昊奋,等.中医药知识图谱构建与应用[J].医学信息学杂志,2016,37(4):8-13)

  [3]MurdochTB,DetskyAS.Theinevitableapplicationofbigdatatohealthcare[J].TheJournaloftheAmericanMedicalAssociation,2013,309(13):1351-135

  侯梦薇卫荣陆亮兰欣蔡宏伟

上一篇:数字全息技术在生物医学成像和分析中的应用 下一篇:医学人文教育的危机与重塑