新闻资讯
新闻资讯
【柯林说数】专栏之技术大脑——从构建到应用,探讨医学知识图谱的现状与未来
浏览量:

引言:根据几期专栏介绍,我们了解了人工智能技术中两个重要的方向:自然语言处理(NLP)和知识图谱。本期,柯林布瑞大数据治理及产品研发团队将延续上期“技术大脑”主题,继续围绕知识图谱技术展开交流与探讨,并分享对医学知识图谱的见解和经验,希望能够带来更多有关这一领域的专业知识和洞见。

Q:在知识图谱构建中,自顶向下和自底向上两种思路有何不同?如何选择适当的方法?

A:知识图谱技术作为构建智能化知识世界的工具,可以采用自顶向下和自底向上两种方式进行构建。


自顶向下的方式是从总体抽象的概念开始,逐步细化和扩展,形成一个完整的知识图谱。这种方式适用于领域知识比较完备和稳定的情况,特别是在学术范围内使用较多。在构建过程中,为了确保知识图谱的一致性和准确性,通常倾向于使用规范的术语和定义,因此,相对较少考虑同义词或词汇的多样性。


而自底向上的方式更多地是由业务需求驱动的,它通过分析和处理大量的结构化和非结构化数据,逐步归纳和抽象,构建出一个知识图谱。这种方式适用于数据量较大、领域知识较为复杂和变化频繁的情况。相较于自顶向下的方式,其可以更加灵活地适应不同的业务需求。


在医学知识图谱的构建中,考虑到业务需求及使用场景,我们更倾向于采用自底向上的方式。通过运用机器学习、自然语言处理和数据挖掘等技术,能够处理大规模的业务数据,并从中发现隐藏的知识和关联,进一步充实和扩展知识图谱的内容,更能贴近实际应用的需求。


因此,在选择构建方式时,可以综合考虑具体的应用场景、领域需求以及可用的资源和技术,或者结合两种方式以达到更好的效果。无论选择哪种方式,关键是确保构建的知识图谱能够满足实际需求,并能够持续更新和扩展,为应用提供准确、实用的支持和指导。

Q:在构建医学知识图谱时,有哪些关键要点?

A:在构建医学知识图谱时,有几个关键要点需要考虑,以确保知识图谱的质量和实用性。


一是专业领域知识。在构建知识图谱之前,对医学领域必须有深入的了解。这包括熟悉医学概念、关系、实体和属性等。只有准确地确定这些要素,才能构建出准确完整和高质量的医学知识图谱。


二是技术选择。医学知识图谱的构建涉及到实体识别、实体关系抽取、实体对齐、实体链接等基础技术。此外,还需考虑选择何种数据库类型、存储方式和数据存储维度等因素。例如,选择合适的数据库来存储和管理知识图谱数据,并考虑使用哪种数据库存储概念实体信息,以及描述性段落信息等。因此在选择技术和方法时,要根据具体情况进行综合考虑,以确保技术和方法的适用性和有效性。


三是数据源。准确的数据是知识图谱的基础,能为用户而提供可靠和准确的医学信息支持,帮助他们获得准确的信息和进行有效的推理分析。在医疗领域知识图谱的构建过程中,指南、教科书以及官方网站和政府发布的信息等都是重要的数据源,具有较高的可信度和权威性。例如构建中医知识图谱时,通常从国家官方网站提取论证和认证等信息,确保所使用的知识来源准确可靠。

Q:为什么需要医学知识图谱?构建医学知识图谱有哪些意义和价值?

A:医学知识图谱的真正意义和价值在于,它能够从顶层延伸到某一个细粒度层面上。也就是说,在医疗行业中,我们可以构建整个医疗领域的知识图谱,以全面了解医学知识和关系。同时,也可以构建个性化图谱,满足特定患者或医生的个体化医疗需求。这样的个体化图谱能够为患者和医生提供精准、定制的医学信息和决策支持。


在医生层面上,例如,患者360系统可以展示患者的各个维度信息,然而,由于信息可能过于繁杂,医生可能需要花费大量时间来筛选和分析。通过知识图谱的方式可以快速提取出关键的信息点,然后根据这些关键信息找到与患者相似的其他患者,了解他们的治疗方式和经验来作为参考和借鉴,帮助医生提高诊疗准确性和治疗效果。


不仅如此,知识图谱还能在一些推理方面发挥作用,可以根据患者360系统展示的信息推断出适合患者的手术和药物,同时确定患者的主要疾病,帮助选择合适的医生和手术方式,从而提高手术成功率,提升医院整体服务质量和水平。


在患者层面上,例如,临床决策支持系统(CDSS)可以利用患者各个维度的信息来预测他们的临床诊断。通过分析患者的症状、疾病史、实验室结果等多维数据,CDSS可以提供个性化的诊断建议和治疗方案。这种个性化的决策支持系统有助于为患者提供更加精确和针对性的治疗,从而改善患者的治疗效果。

Q:柯林布瑞目前在医学知识图谱方面有哪些探索和实践?在具体医疗场景中,这些实践带来了哪些应用创新和价值?

A:我们目前主要从两个方面进行工作。一方面是科研搜索应用,我们将科研搜索融入到大模型中,帮助用户更高效地获取所需的科研信息。


举个例子,假设一位医生想要查询2020年到2022年的糖尿病患者,我们可以帮助他快速搜索出该时间范围内所有糖尿病患者的档案。以往医生需要先选择病案首页中主要诊断为糖尿病的患者,然后再进行时间范围的筛选。现在我们可以通过将医生的需求转化为图谱中的概念实体,并将这些实体与表模型中的字段进行关联。这样一来,医生只需在搜索中指定时间范围和糖尿病的诊断,即可快速找到符合条件的患者档案。


另一方面是科研结构化方面的工作,主要是对文本进行结构化处理。这包括满足国家对于互联互通测评、电子病历评级等要求,这些都属于科研结构化的范畴。


在应用创新上,目前主要关注临床诊断领域,例如VTE智能防治管理和罕见病诊疗等等。其中,罕见病早期诊断困难,极易因为漏诊或误诊而延迟干预。柯林布瑞罕见病临床决策支持系统利用海量的医学知识和AI分析引擎,可以快速综合、归档、识别和辨别罕见病所需信息,对照已有的7000多种罕见病进行评估打分,为临床医师提供辅助诊断,提高诊断的准确性和效率,大大减少了患者被漏诊和误诊的风险。

Q:最近大模型受到广泛关注,有些人认为大模型会取代知识图谱,而有些人认为它们可以相互补充和协同。你们对此有何看法?未来,知识图谱会更侧重朝着哪个方向发展?

A:首先,我们认为,知识图谱在构建完善的知识体系方面是不可或缺的。它通过提供一个结构化、可链接的知识网络,使得人们可以更好地理解和利用知识。无论在学术研究、医学诊断还是其他智能领域,知识图谱都扮演着重要的角色。


其次,知识图谱与大模型之间是相互补充和协同的关系。尽管AI大模型具有强大的学习和处理能力,但与此同时大模型也容易受到数据偏差和误导等问题的影响。而知识图谱则可以作为一个可靠的知识源,帮助大模型纠正错误的认知,确保其不偏离真实情况。


从长远来看,随着技术的进步和数据的积累,知识图谱的发展将朝着更加求真和推理的方向发展。医疗行业必须依靠可靠的知识来做出决策和诊断,因此,知识图谱可以结合大数据、人工智能等技术,实现更精确和智能的推理和预测,以应对日益复杂的医学问题和场景。

 

结语:总而言之,医学知识图谱已经在医疗领域展现出巨大的潜力和应用前景。当前,AI大模型的热潮正在涌现,我们期待医学知识图谱能够与大型模型实现更深层次的融合,通过医学知识图谱的丰富知识和大型模型的强大计算能力,共同推动医疗领域的创新与发展,为人类的健康事业带来持续的进步和改善。