Семантика – основа сочетаемости слов

5 июля 2013 года

Два физика из Бразилии разработали метод автоматического распознавания нужного значения многозначных слов. Он никак не связан с семантикой, а основан исключительно на схемах сочетаемости таких слов с соседними.

В своей статье, опубликованной в европейском физическом журнале «B» (The European Physical Journal B), Тьяго Силва и Диего Аманчо из университета г.Сан-Паулу рассказывают о том, как они превращали классические литературные тексты в сложные структуры, чтобы прояснить их смысл. Такое моделирование играет важную роль в разных областях прикладной лингвистики – в машинном переводе, поиске информации, контент-анализе и обработке текста.

В своем исследовании авторы рассмотрели схемы сочетаемости 10 многозначных слов («лук», «пробка», «кнопка» и т.п.), встречающихся в текстах классических литературных произведений. Таким образом они создали модель, которая состоит из набора «узловых точек» — слов, связанных друг с другом своими «концами».

Затем ученые сопоставили результаты их работы по устранению многозначности с результатами, полученными при использовании классического семантического подхода. Как оказалось, максимальная степень точности в определении подходящего значения достигается при одновременном использовании обоих методов.

Этот подход Т. Силва и Д. Аманчо использовали и в другом своем исследовании, которое показало, что традиционные методики построения сложных систем определяются в первую очередь синтаксисом.

Ученые планируют изобрести и другие способы определения точных значений слов на основе их семантики.

Услуги для Вас

Узнать больше