Метод иерархической кластеризации массива текстовых материалов

Павленко А. В., Гатилов И. Л.

Читать статью полностью

  Метод иерархической кластеризации массива текстовых материалов(476,21 KB)

Аннотация

Предложен метод иерархической структуризации неупорядоченного массива текстовых материалов, основанный на определении степени тематической близости текстовых сообщений, составляющих данный массив. Применение метода в перспективных комплексах обработки информации позволит снизить размерность задачи поиска текстовых сообщений за счет ее ограничения отдельными ветвями сформированной иерархии тематических кластеров. Кроме того, данный метод может быть использован в задачах формализации предметной области в целях подготовки данных при формировании онтологии. 

Ключевые слова:

кластеризация текстов – cluster- ing of texts; функционально-ролевая интерпретация – functional and role interpretation; нейросетевая классификация – neural network classification

Список литературы

1. Столяров, М. Г. Способ определения информационной ценности текстового документа при полнотекстовом поиске, учитывающий отношения между понятиями предметной области / М.Г. Столяров, А.Ю. Новиков // Наукоёмкие технологии. – 2012. – № 8. – С. 87–90.

2. Павленко, А. В. Подход к нейросетевой классификации текстовых документов с использованием семантических признаков / А.В. Павленко, А.Ю. Новиков // Наукоёмкие технологии. – 2015. – № 12. – С. 67–70.