АВТОМАТИЗИРОВАННАЯ ГЕНЕРАЦИЯ СПЕЦИАЛИЗИРОВАННЫХ УЧЕБНЫХ ЗАДАНИЙ С ИСПОЛЬЗОВАНИЕМ ГЕНЕРАТИВНЫХ ЯЗЫКОВЫХ МОДЕЛЕЙ ДЛЯ ОБУЧЕНИЯ ГРАЖДАНСКОЙ АВИАЦИИ

Авторы: Тугамбаева А., Сахипов А.А.
МРНТИ 50.05, 50.41

Аннотация. В данном исследовании представлена интеллектуальная система для автоматизированной генерации специализированных учебных заданий в сфере гражданской авиации на основе дообученных трансформерных моделей T5-small. Традиционное составление заданий требует значительных временных затрат со стороны инструкторов, а также глубоких знаний авиационных нормативов, технических характеристик и процедур безопасности. Мы предлагаем решение на основе трансформера, реализующее пятиэтапный конвейер: предварительная обработка корпуса, параметр-эффективное дообучение с использованием адаптации LoRA, генерация заданий с помощью beam search, фильтрация по качеству и педагогическая валидация. Система была обучена на 920 авиационно-специализированных парах «контекст–вопрос», охватывающих более 50 тем, включая полётные операции, авиационные приборы, навигацию и аварийные процедуры. Эксперименты на GPU Tesla T4 показали время обучения 35 минут за 7 эпох, при финальных значениях функции потерь: 1.3506 на обучении и 1.221 на валидации. Оценка качества генерации на тестовом наборе (116 примеров) дала следующие результаты: Corpus BLEU — 24.27, ROUGE-L F1 — 0.5087, BERTScore F1 — 0.6017. Анализ терминологического покрытия показал, что 38.8% сгенерированных вопросов включают минимум один авиационный термин, а среднее количество уникальных авиационных терминов составляет 9.4% на вопрос. Дополнительные метрики включают коэффициент уникальных биграмм 0.321, что указывает на высокое лексическое разнообразие без избыточных повторений. Ручная экспертиза 100 случайных вопросов продемонстрировала 95% грамматической корректности и 90% контекстной уместности. Качественный анализ показывает, что генерируемые задания грамматически правильные и контекстно релевантные, несмотря на умеренные значения BLEU, которые отражают альтернативные корректные формулировки, а не недостатки качества. Примеры генерации демонстрируют профессиональный уровень, например: «Что измеряет высотомер?» и «Что происходит при сваливании?» Система снижает нагрузку на инструкторов при создании заданий, сохраняя техническую точность и отраслевую релевантность, и служит основой для внедрения AI-поддерживаемой генерации учебного контента в специализированных технических областях.

Ключевые слова: автоматизированная генерация заданий, трансформерные нейронные сети, архитектура T5, предметно-ориентированная обработка естественного языка, технологии авиационного образования, параметрически эффективная дообучение, генерация учебных задач, декодирование методом поиска по лучу.