АГРЕССИВТІ МАЗМҰНДЫ ЖІКТЕУ МІНДЕТТЕРІ ҮШІН ФЕДЕРАТИВТІ ОҚЫТУ: ТРАНСФОРМЕР МОДЕЛЬДЕРІ НЕГІЗІНДЕГІ ӘДІС

Авторлар: Омар А.Б., Мусиралиева Ш.Ж.

Рубрикалар: Компьютерлік ғылымдар, аспап жасау және автоматтандыру

ҒТАХА 28.23.25

Аңдатпа. Цифрлық коммуникацияның қарқынды дамуы интернетте агрессивті мазмұндағы жазбалардың көбеюіне себеп болды. Мұндай мазмұнды жазбаларды автоматты түрде анықтау қазіргі заманның өзекті мәселелерінің бірі болып отыр. Алайда деректерді орталық серверге жинауға негізделген дәстүрлі тәсілдер жеке ақпараттың құпиялығын бұзуы мүмкін. Осы мәселені шешудің бір жолы – федеративті оқыту әдісін қолдану. Бұл әдісте деректерді орталық серверге жібермей-ақ, әрбір пайдаланушы құрылғысында жеке формада модельді оқыту қарастырылады. Зерттеу жұмысын жүргізу барысында ғылыми еңбектерге әдеби шолу жасалып, федеративті оқыту әдісін қолдану тәжірибесі талданды. Деректер жиынтығы ретінде 73 572 жазбадан тұратын агрессивті және агрессивті емес мәтіндерден құралған арнайы корпус пайдаланылды. Модельді оқыту үшін DistilBERT моделі пайдаланылды және деректер жиынтығы үш клиент арасында бөлініп, әрқайсысы тек өз жазбаларын жеке оқытты. Ал сервер әр раундтың соңында FedAvg алгоритмі арқылы барлық клиенттер ұсынған модель параметрлері серверде біріктіріліп, ортақ глобалды модель құрылды. Алынған нәтижелер негізінде федеративті оқыту әдісі екі маңызды артықшылығын анықтады: ол ең алдымен, жоғары дәлдікпен жұмыс жасайды, екіншіден, ақпаратқа қатысты сенімділік пен құпиялылықты қамтамасыз етеді.

Түйін сөздер: федеративті оқыту, NLP, DistilBERT, FedAvg, құпиялылықты сақтау, агрессивті мазмұн, классификациялау.

Скачать PDF статьи

Нөмір мұрағаты:
№-4 (39) 2025

АГРЕССИВТІ МАЗМҰНДЫ ЖІКТЕУ МІНДЕТТЕРІ ҮШІН ФЕДЕРАТИВТІ ОҚЫТУ: ТРАНСФОРМЕР МОДЕЛЬДЕРІ НЕГІЗІНДЕГІ ӘДІС

Айдарлар

Журналдар