Технические решения для создания картографических баз данных на основе неструктурированного текста с использованием микросервисной архитектуры и систем обработки естественного языка

Колесников А. А.

  Технические решения для создания картографических баз данных на основе неструктурированного текста с использованием микросервисной архитектуры и систем обработки естественного языка(568,44 KB)

Abstract

В статье описаны архитектура и особенности реализации модуля геоинформационной системы с использованием принципов построения микросервисных архитектур, технологий обработки естественного языка, позволяющего автоматизировать создание слоев карты в геоинформационной системе на основе неструктурированных текстовых материалов. Приводится схема взаимодействия элементов разработанного программного обеспечения.

Keywords:

автоматизация – automation; распознавание именованных сущностей – named entity recognition; микросервисная архитектура – microservice architecture; обработка текста – text processing; картографирование – mapping; технологии искусстве

References

1. Как индустрия искусственного интеллекта будет влиять на экономическое развитие России в XXI веке / В.И. Комашинский, О.А. Михалев, Саид Моджиб Абдулхаким Сеиф, В.И. Татаринов // Информация и Космос. – 2022. – № 1. – С. 30–34.

2. Cистемы обработки естественного языка для извлечения данных и картографирования на основе неструктурированных блоков текста / А.А. Колесников, П.М. Кикин, Дж. Нико, Е.В. Комиссарова // ИнтерКарто. ИнтерГИС. – 2020. – Т. 26, № 1. – С. 375–384.

3. Исаченко, В. В. Обзор систем обработки текстов на естественном языке с использованием методов выделения именованных сущностей / В.В. Исаченко // Наука и мир. – 2019. – № 7-1 (71). – С. 33–35.

4. Кукарцев, В. В. Системный анализ возможностей по извлечению именованных сущностей с применением технологии text mining / В.В. Кукарцев, З.А. Колмакова, О.Л. Мельникова // Перспективы науки. – 2019. – № 9 (120). – С. 18–20.

5. Semantic parsing on freebase from question-answer pairs / J. Berant, A. Chou, R. Frostig, P. Liang // Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing (EMNLP). – 2013. – P. 1533–1544.

6. FrNewsLink: a corpus linking TV Broadcast News Segments and Press Articles / N. Camelin, G. Damnati, A. Bouchekif [et al.] // Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). – 2018. – P. 2087–2092.

7. Tüselmann, O. Named entity linking on handwritten document images / O. Tüselmann, G.A. Fink // Lecture Notes in Computer Science. – 2022. – Vol. 13237. – P. 199–213.

8. Nguyen, H.-V. DOZEN: cross-domain zero shot named entity recognition with knowledge graph / H.-V. Nguyen, F. Gelli, S. Poria / SIGIR 2021 - Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. –2021. – P. 1642–1646.

9. Колесников, А. А. Автоматизация подготовки картографических данных с помощью систем обработки естественного языка / А.А. Колесников, Е.А. Плитченко, М.К. Кропачева // ИнтерКарто. ИнтерГИС. – 2022. – Т. 28, Ч. 1. – С. 659–669.

10. Семенов, Г. Е. Разработка микросервисных архитектур для высоконагруженных систем информационного сопровождения подготовки производства / Г.Е. Семенов // Информационные технологии в проектировании и производстве. – 2022. – № 2 (186). – С. 2–11.

11. De Lauretis, L. From monolithic architecture to microservices architecture / L. De Lauretis // 2019 IEEE 30th International Symposium on Software Reliability Engineering Workshops, ISSREW 2019. – 2019. – P. 93–96.

12. From a monolithic big data system to a microservices event-driven architecture / R. Laigner, Y. Zhou, M. Kalinowski [et al.] // Proceedings 46th Euromicro Conference on Software Engineering and Advanced Applications, SEAA 2020. – 2020. – P. 213–220.

13. Милихин, М. М. Программный интерфейс взаимодействия геоинформационной системы ведения ЭГП со сторонними программными системами / М.М. Милихин, М.М. Рычагов // Перспективы развития информационных технологий. – 2013. – № 11. – С. 37–42.

14. Deeppavlov: open-source library for dialogue systems / M. Burtsev, A. Seliverstov, R. Airapetyan [et al.] // ACL 2018 - 56th Annual Meeting of the Association for Computational Linguistics, Proceedings of System Demonstrations. – 2015. – P. 122–127.

15. Constructing of semantically dependent patterns based on Spacy and Stanfordnlp libraries / V.P. Okhapkin, E.P. Okhapkina, A.O. Iskhakova, A.Y. Iskhakov // Communications in Computer and Information Science. – 2021. – Vol. 1395. – P. 500–512.

16. Saxena, D. Analysis of Docker performance in cloud environment / D. Saxena, N. Sharma // Lecture Notes in Networks and Systems. – 2021. – Vol. 135. – P. 9–18.