元素检测研究综述(2)

来源：中国循证医学杂志 【在线投稿】栏目：期刊导读时间：2021-06-19

作者:网站采编
关键词:
摘要：以上所有的模型都严重依赖于人工设计的特征，包括词汇特征，如词袋（BOW）、提示词、提示动词；语义特征，如词性（POS）、命名实体（NE）；结构特征

以上所有的模型都严重依赖于人工设计的特征，包括词汇特征，如词袋（BOW）、提示词、提示动词；语义特征，如词性（POS）、命名实体（NE）；结构特征，如句子的相对位置或绝对位置；以及序列特征，如每个类别的相对位置。

2.3 基于神经网络的方法

基于规则和机器学习的方法都只是在句子的词汇特征或者浅层的语义特征进行分析和提取，没有捕获到句子深层的语义信息，导致PICO 元素检测任务的效果不是很理想。神经网络模型由于其自动学习特征、擅于捕捉深层语义信息的优势，越来越多的研究人员使用神经网络模型来解决PICO 元素检测问题。

Dernoncourt 等人[10]在2016 年提出了基于深度人工神经网络架构的模型，实验证明利用长短期记忆神经网络（LSTM）可以进一步提高性能，并消除人工筛选特征的需求。随后，Di Jin 等人[11]在2018 年首次利用深度神经网络的方法（双向长短期记忆神经网络，BiLSTM）解决PICO 元素检测问题，该模型首先使用BiLSTM 获取句子中每个词的隐藏表达，然后利用注意力机制计算每个词的权重，加权求和获取到每个句子的表示向量，然后整个摘要中的所有句子的表示向量输入到序列优化层（即条件随机场，CRF）中，对整个摘要进行序列标注，优化整个标签序列。该模型称为“BiLSTM+CRF”架构，取得了很大的进展。2019 年，Di Jin 等人[12]在2018 年的模型上进行了两点改进。首先，他们认为应该把PICO 元素检测看成一个连续的句子分类问题，可以利用周围句子的上下文信息来推断当前句子的标签。因此，基于先前的“BiLSTM+CRF”架构，他们将另一层bi-LSTM 叠加在句子表示向量上，以聚合周围句子的特征，使得输出的句子的隐藏状态向量不仅携带当前句子的信息，还包含相邻句子的信息。其次，他们认为深度学习模型在较小规模的数据集上容易出现过度拟合的情况，导致训练数据较小时，与浅层机器学习模型相比，深度学习模型对PICO 元素检测的性能不理想。为了解决这个问题，他们采用了两种策略来增强模型的泛化能力。一种是使用对抗和虚拟对抗训练对模型进行正则化稳定分类器的性能，从而提高模型的泛化能力；另一种是先使用大规模生物医学文献语料库对语言模型进行预训练，然后在目标数据集进行微调，即利用迁移学习方法提高模型的泛化能力。实验证明两种策略都能进一步提高PICO元素检测性能。

3 结语

本文对PICO 元素检测的研究进展进行了介绍，简单介绍了PICO 元素检测任务的具体内容，重点介绍了解决PICO 元素检测问题的三大主要方法，分析了这几类方法的改进思想。PICO 元素检测可以运用到许多下游的医学任务中去，如：医疗方案制定、系统性分析、医学文献的信息检索等，具有极高的研究价值和应用价值。PICO 元素检测是循证医学领域一个重要的研究方向，随着深度学习的发展，近年来越来越多的研究者尝试将深度学习的各种模型和方法应用到PICO 元素检测任务中，并取得了较好的成效。但目前对于PICO 元素检测的效果仍然有一定的提升空间，还需要更进一步的研究和改进。

[1]RICHARDSON W S，WILSON M C，NISHIKAWA J，et al.The well-built clinical question：a key to evidence-based decisions[J].ACP Journal Club，1995，123（3）：A12-3.

[2]HUANG X，LIN J，DEMNER-FUSHMAN D. Evaluation of PICO as a knowledge representation for clinical questions[C]//American Medical Informatics Association，2006.

[3]SCHARDT C，ADAMS M B，OWENS T，et of the PICO framework to improve searching PubMed for clinical questions[J].BMC Medical Informatics&Decision Making，2007.

[4]BOUDIN F，SHI L，NIE J Y. Improving medical information retrieval with PICO element detection[J]. European Conference on Information Retrieval，2010：50-61.

[5]DEMNER-FUSHMAN D，LI clinical questions with knowledge-based and statistical techniques[J].Computational Lingus，2007.

[6]DEMNER-FUSHMAN D，LIN J J.Answer extraction，semantic clustering，and extractive summarization for clinical question answering[C]//21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics，Proceedings of the Conference，2006.

[7]BOUDIN F，NIE J Y，BARTLETT J C，et al. Combining classifiers for robust PICO element detection[J]. BMC Medical Informatics and Decision Making，2010（10）.

[8]KIM S N，MARTINEZ D，CAVEDON L，et classification of sentences to support Evidence Based Medicine[J].Bmc Bioinformatics，2011：S5.

[9]HUANG K C，CHIANG I J，XIAO F，et al. PICO element detection in medical text without metadata：are first sentences enough?[J].Journal of Biomedical Informatics，2013，46（5）：940-946.

文章来源：《中国循证医学杂志》网址: http://www.zgxzyxzz.cn/qikandaodu/2021/0619/622.html

上一篇：如何教授留学生撰写循证病例报告
下一篇：教学法应用于神经生物教学的可行性分析