АЗАМАТТЫҚ АВИАЦИЯ ОҚЫТУЫНА АРНАЛҒАН ГЕНЕРАТИВТІ ТІЛДІК МОДЕЛЬДЕРДІ ҚОЛДАНУ АРҚЫЛЫ МАМАНДАНДЫРЫЛҒАН ОҚУ ТАПСЫРМАЛАРЫН АВТОМАТТЫ ТҮРДЕ ҚҰРУ

Авторлар: Tugambayeva A.A., Sakhipov A.A.
ҒТАХА 50.05, 50.41

Аңдатпа. Бұл зерттеуде азаматтық авиация саласына арналған мамандандырылған оқу тапсырмаларын автоматты түрде генерациялауға мүмкіндік беретін интеллектуалды жүйе ұсынылады. Жүйе fine-tune жасалған T5-small трансформер моделіне негізделген. Дәстүрлі тапсырма құрастыру көп уақытты қажет етеді және нұсқаушылардан авиациялық нормалар, техникалық сипаттамалар және қауіпсіздік рәсімдері бойынша терең құзыреттілікті талап етеді. Біз трансформер архитектурасына негізделген бес кезеңнен тұратын шешімді ұсынамыз: корпусты алдын ала өңдеу, LoRA арқылы параметр-тиімді fine-tuning, beam search көмегімен тапсырма генерациясы, сапалық сүзгілеу және педагогикалық валидация.
Жүйе 50-ден астам тақырыпты қамтитын 920 авиациялық «контекст–сұрақ» жұбы негізінде оқытылды. Тақырыптар құрамына ұшу операциялары, авиациялық аспаптар, навигация және төтенше жағдай рәсімдері кіреді. Tesla T4 GPU құрылғысында жүргізілген эксперименттер 7 эпоха бойынша 35 минуттық оқу уақытын көрсетті. Соңғы шығын мәндері: training loss — 1.3506 және validation loss — 1.221. Тесттік жиын (116 мысал) бойынша генерация сапасының нәтижелері: Corpus BLEU — 24.27, ROUGE-L F1 — 0.5087, BERTScore F1 — 0.6017. Терминологиялық қамту талдауы сгенерацияланған сұрақтардың 38.8%-ында кемінде бір авиациялық термин бар екенін көрсетті, ал бір сұрақтағы орташа бірегей авиациялық терминдер саны — 9.4%. Қосымша метрика ретінде 0.321 бірегей биграмма коэффициенті алынды, бұл мәтіндегі лексикалық әртүрліліктің жоғары екенін және қайталанудың төмен екенін көрсетеді. 100 кездейсоқ сұраққа жасалған сараптамалық бағалау 95% грамматикалық дұрыстықты және 90% контекстік сәйкестікті көрсетті. Сапалық талдау Corpus BLEU көрсеткіші орташа болғанына қарамастан, генерацияланған тапсырмалардың грамматикалық тұрғыдан дұрыс және мазмұнға сай екенін анықтады. Corpus BLEU-дің төмендеуінің себебі – синонимдік және баламалы дұрыс тұжырымдардың болуы, бұл білім беру контентін құруда қалыпты жағдай. Мысалы, «Алтиметр нені өлшейді?» немесе «Сваливание кезінде не болады?» сияқты кәсіби деңгейдегі сұрақтар генерацияланады. Ұсынылған жүйе нұсқаушылардың жұмыс жүктемесін азайтады, техникалық дәлдікті қамтамасыз етеді және арнайы техникалық бағыттарда AI-негізделген оқу контентін құруға негіз болады.

Түйін сөздер: тапсырмаларды автоматты түрде құру, трансформерлік нейрондық желілер, T5 архитектурасы, пәнге бағытталған табиғи тілді өңдеу, авиациялық білім беру технологиялары, параметрлік тиімді қосымша оқыту, оқу тапсырмаларын құру, сәуле бойынша іздеу декодтауы.