СРАВНИТЕЛЬНЫЙ АНАЛИЗ АРХИТЕКТУР ДИАЛОГОВЫХ СИСТЕМ ДЛЯ МЕДИЦИНСКОЙ ПРЕДМЕТНОЙ ОБЛАСТИ
DOI:
https://doi.org/10.5281/zenodo.17697167Keywords:
диалоговые системы, медицинская NLP, rule-based, retrieval-based, классификация вопросов, MedQuad.Abstract
В статье проводится сравнительный анализ двух архитектур диалоговых систем: rule-based и retrievalbased,
на основе датасета MedQuad, содержащего 16 407 медицинских вопросов и ответов. Эксперименты были
проведены по 16 категориям медицинских вопросов. Результаты показывают, что подход retrieval-based значительно
превосходит rule-based по точности (98.6% против 40.9%) и F1-score (98.7% против 38.9%), демонстрируя высокую
эффективность в обработке медицинских диалогов. Rule-based система, несмотря на высокую скорость работы,
показала ограниченную применимость из-за низкой точности распознавания специализированных медицинских
категорий.
References
Comprehensive Medical Q&A Dataset — Kaggle. URL: https://www.kaggle.com/datasets/thedevastator/
comprehensive-medical-q-a-dataset
Russell, S., Norvig, P. Artificial Intelligence: A Modern Approach. 4th Edition. Pearson, 2020.
Jurafsky, D., Martin, J. H. Speech and Language Processing. 3rd Edition Draft. Prentice Hall, 2023.
Manning, C. D., Raghavan, P., Schütze, H. Introduction to Information Retrieval. Cambridge University Press, 2008.
Aggarwal, C. C., Zhai, C. Mining Text Data. Springer, 2012.
Cambria, E., White, B. Jumping NLP Curves: A Review of Natural Language Processing Research. IEEE Computational
Intelligence Magazine, 9(2), 2014.
Liddy, E. D. Natural Language Processing. Encyclopedia of Library and Information Science, 2001.
Hirschberg, J., Manning, C. D. Advances in Natural Language Processing. Science, 349(6245), 2015.
Gupta, V., Lehal, G. A Survey of Text Mining Techniques and Applications. Journal of Emerging Technologies in Web
Intelligence, 1(1), 2009.
Zhang, Y., Wallace, B. A Sensitivity Analysis of (and Practitioners’ Guide to) Convolutional Neural Networks for
Sentence Classification. Proceedings of the EACL, 2017.