Аннотация. Қазақ тіліне морфологиялық зерттеу және сөз жасауды іске асыру үшін ережеге негізделген тәсіл ұсынылады. Қазақ тілі — морфологиясы күрделі және жоғары деңгейде агглютинативті тіл болғандықтан, оның морфологиясын есептік моделдеу нақтылық пен жүйелікті талап етеді. Бұған себеп — аффиксацияның кең қолданылуы және дауысты үндестігі мен дауыссыздардың алмасуы сияқты фонологиялық өзгерістер. Негізгі технология ретінде шектеулі-жағдайлы трансдукторлар (ШЖТ) пайдаланылады. Олар сөз түзілуінің заңды үлгілерін дәл әрі тиімді модельдеуге мүмкіндік береді.
Жүйе екі негізгі компоненттен тұрады: абстрактілі морфологиялық көрсетілімдерден дұрыс сөз түрлерін жасайтын морфологиялық генератор және сөздің үстірт пішіндерін түбір мен аффикстерге және оларға қатысты грамматикалық белгілерге бөлу үшін морфологиялық талдаушы. Зат есім мен етістік парадигмалары үшін (шақ, рай, қимылдың өту сипаты, адам, сан, септік сияқты) ШЖТ архитектурасы морфотактикалық ережелерді, фонологиялық шектеулерді және аффикстердің ретін кодтайды.
Трансдукторға негізделген талдауды қолдау үшін қазақ тілінің лексемаларының толық сөздігі жасалып, сөз табы бойынша құрылымдалған. Бұл сөздік илік және туынды морфологияны қамтиды. Қолмен жасалған морфологиялық ережелер тілдің морфологиялық құрылымын көрсетеді. Қазіргі қазақ мәтіндерінен қолмен таңбаланған корпус негізінде жүргізілген бағалау нәтижесінде талдау және генерация тапсырмаларында жоғары дәлдікке қол жеткізілді. Нәтижесінде алынған құрал сөз таптарын таңбалау, синтаксистік талдау және машиналық аударма сияқты табиғи тілдерді өңдеудің көптеген төменгі деңгейлі тапсырмалары үшін негізгі құрамдас бөлік болып табылады. Ашық кодты модуль ретінде жарияланып, қазақ тілін есептеу лингвистикасында кеңінен пайдалануға және әрі қарай зерттеуге жол ашады. Бұл жүйе ресурсы аз тілдерге арналған тілдік технологияларды дамытуға үлес қосады.
Түйін сөздер: Қазақ тілі, морфологиялық талдау, морфологиялық генерация, шектеулі-жағдайлы трансдукторлар, агглютинативті тілдер, табиғи тілді өңдеу, ережеге негізделген жүйелер.