Метод иерархической кластеризации массива текстовых материалов
Abstract
Предложен метод иерархической структуризации неупорядоченного массива текстовых материалов, основанный на определении степени тематической близости текстовых сообщений, составляющих данный массив. Применение метода в перспективных комплексах обработки информации позволит снизить размерность задачи поиска текстовых сообщений за счет ее ограничения отдельными ветвями сформированной иерархии тематических кластеров. Кроме того, данный метод может быть использован в задачах формализации предметной области в целях подготовки данных при формировании онтологии.
Keywords:
кластеризация текстов – cluster- ing of texts; функционально-ролевая интерпретация – functional and role interpretation; нейросетевая классификация – neural network classification
References
1. Столяров, М. Г. Способ определения информационной ценности текстового документа при полнотекстовом поиске, учитывающий отношения между понятиями предметной области / М.Г. Столяров, А.Ю. Новиков // Наукоёмкие технологии. – 2012. – № 8. – С. 87–90.
2. Павленко, А. В. Подход к нейросетевой классификации текстовых документов с использованием семантических признаков / А.В. Павленко, А.Ю. Новиков // Наукоёмкие технологии. – 2015. – № 12. – С. 67–70.