:: ::

Магистерские диссертации


 
Загидулин Иван, Методы и средства автоматической текстовой категоризации // Магистерская диссертация, Математико-механический факультет УрГУ, 2008.

Рассматриваются алгоритмы индуктивного построения текстовых классификато-ров, способы индексации документов, а также применение данных методик к определе-
нию значений многозначных слов на основе контекста. В качестве нового подхода к реше-
нию данной проблемы предлагается использование различных глобальных характеристик
контекста, т.е. классификация документа одновременно по нескольким независимым кате-
гориям. В эксперименте по разрешению многозначности используются такие свойства
контекста, как тема текста и его функциональный стиль. Определяются оптимальные зна-
чения параметров алгоритма обучения, а также производится отбор признаков для темати-
ческой и стилистической категоризации.



Ключевые слова: ТЕКСТОВАЯ КАТЕГОРИЗАЦИЯ, МАШИННОЕ ОБУЧЕНИЕ, ИНДЕКСИРОВАНИЕ ДОКУМЕНТОВ, РАЗРЕШЕНИЕ МНОГОЗНАЧНОСТИ, ОБУЧАЮ- ЩЕЕ МНОЖЕСТВО, КЛАССИФИКАТОР.


Количество просмотров: Счетчик посещений Counter.CO.KZ - бесплатный счетчик на любой вкус!

Есть вопрос или комментарий?..


Ваше имя Электронная почта
Получать почтовые уведомления об ответах:

| Примечание. Сообщение появится на сайте после проверки модератором.


Вернуться в раздел Магистерские диссертации

Соседние подразделы:
Бакалавры
Контакты

+7 (343) 362-81-45
averbukh@imm.uran.ru

г. Екатеринбург, ул. Софьи Ковалевской 16, каб. 306
Открыть контакты

Translate
Посетители сайта