Аңдатпа. Цифрлық коммуникацияның қарқынды дамуы интернетте агрессивті мазмұндағы жазбалардың көбеюіне себеп болды. Мұндай мазмұнды жазбаларды автоматты түрде анықтау қазіргі заманның өзекті мәселелерінің бірі болып отыр. Алайда деректерді орталық серверге жинауға негізделген дәстүрлі тәсілдер жеке ақпараттың құпиялығын бұзуы мүмкін. Осы мәселені шешудің бір жолы – федеративті оқыту әдісін қолдану. Бұл әдісте деректерді орталық серверге жібермей-ақ, әрбір пайдаланушы құрылғысында жеке формада модельді оқыту қарастырылады. Зерттеу жұмысын жүргізу барысында ғылыми еңбектерге әдеби шолу жасалып, федеративті оқыту әдісін қолдану тәжірибесі талданды. Деректер жиынтығы ретінде 73 572 жазбадан тұратын агрессивті және агрессивті емес мәтіндерден құралған арнайы корпус пайдаланылды. Модельді оқыту үшін DistilBERT моделі пайдаланылды және деректер жиынтығы үш клиент арасында бөлініп, әрқайсысы тек өз жазбаларын жеке оқытты. Ал сервер әр раундтың соңында FedAvg алгоритмі арқылы барлық клиенттер ұсынған модель параметрлері серверде біріктіріліп, ортақ глобалды модель құрылды. Алынған нәтижелер негізінде федеративті оқыту әдісі екі маңызды артықшылығын анықтады: ол ең алдымен, жоғары дәлдікпен жұмыс жасайды, екіншіден, ақпаратқа қатысты сенімділік пен құпиялылықты қамтамасыз етеді.
Түйін сөздер: федеративті оқыту, NLP, DistilBERT, FedAvg, құпиялылықты сақтау, агрессивті мазмұн, классификациялау.