МОДЕЛИРОВАНИЕ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ ТЕРМИНОВ: ВЕКТОРНЫЕ ПРОСТРАНСТВА И МОДЕЛИ ЯЗЫКА

Авторы: Рябченко И., Анаятова Р., Тулекова Г., Кошеков А., Куанов Е.
МРНТИ 16.31.61

Аннотация. Предлагаемая статья рассматривает методы моделирования семантических отношений авиационных терминов с использованием языковых моделей BERT и RoBERTa. Актуальность исследования заключается в применении заранее подготовленного и аннотированного корпуса авиационных терминов, который соответствует международной практике и сформирован на основе документов международных регулирующих организаций. Разработанный языковой корпус обеспечивает необходимую основу для оценки семантики авиационной терминологии в контексте реальной эксплуатации воздушных судов. Методология исследования включает дообучение (fine-tuning) языковых моделей на корпусе авиационных терминов с использованием косинусного сходства, ранговой корреляции и кластерных метрик. Эксперименты продемонстрировали основные различия между двумя моделями в отслеживании синонимов, вариативности и семантических сдвигов в авиационном дискурсе. Результаты исследования показали, что дообучение моделей повышает их способность кластеризовать связанные термины, различать близкие, но отличающиеся понятия, а также согласовывать результаты с экспертными оценками. Полученные данные обеспечивают методологическую основу для разработки ресурсов авиационной терминологии, что позволяет применять трансформерные модели в лексикографии и построении онтологий.

Ключевые слова: семантическая близость, авиационная терминология, языковые модели, корпусная лингвистика, трансформеры, эмбеддинг, обработка естественного языка.