Қазақ тілінің машиналық қоры

Уикипедия — ашық энциклопедиясынан алынған мәлімет
Навигацияға өту Іздеуге өту

Қазақ тілінің машиналық қоры - тіл саласының автоматтандырылған жүйесі. Бұл жүйе ақпаратты (информациялық) барлау міндеттерін де, тіл біліміндегі, тіпті жалпы филологиялық бағыттағы зерттеушілік қызметті де атқарады. Тіл жөніндегі деректердің қандайы болмасын ол лексикографиялық тұлғада ұсынылады. Лексикографиялық жағынан жүйеленген тілдік мәліметтердің барлығы да машинаға (компьютерге) лайықталып, лагоритмдер тіліне аударылады. Машиналық қордағы ақпараттарды шоғырландыратын бірегей түйін немесе түп қазық жеке сөз болып саналады. Себебі сөз — тілдің ең табиғи бөлшегі болып табылады. Машиналық қор - тілді зерттеп, тексеретін автоматтандырылған комплексті жүйе. Оған әр түрлі текстерімен, картотекаларымен, сөздіктермен деректендірілген ақпараттар, тілдік мәліметтер жинақталады. Тілдің машиналық қоры мынадай құрамнан тұрады: 1) машина қорының негізгі сөзтізбегі; 2) иллюстрациялық текстер қоры; 3) терминология қоры; 4) академиялық сөздік - грамматика қоры; 5) тіл процессорларының қоры; 6) лингво-статистикалық база; 7) лексографиялық база; 8) лингвистикалық алгоритмдер мен бағдармалар (программалар) қоры және т. б. бөліктер. Машиналық қор тек қана тіл туралы мәліметтердің архиві ғана емес, ол тіл жөніндегі жаңа білімдер қосатын, жаңа мәліметтер тауып беретін зерттеу лабораториясы. Машиналық қор жеке ғалымның өз зерттеу объектісіне жаңа тұрғыдан көз салуына, тіл құрылысының сырын тереңірек ашуға, адамның білім ерісіндегі олқылықтарының орнын толтыруға мүмкіндік береді. Қазіргі кезде Қазақстанның ұлттық ҒА-сының А. Байтұрсынұлы атындағы Тіл білімі институтында қазақ тілінің Машиналық қорының жобасы белгіленіп, құрамдық бөлшектерінің кейбіреулері дербес түрде жұмыс істеуде. (Бұл жұмыстар филология ғылымының кандидаты, қолданбалы лингвистика бөлімінің меңгерушісі А. Қ. Жұбановтың жетекшілігімен жүргізіледі.). Көрнекті жазушы-драматург М. О. Әуезовтің 20 томдық толық жинағының текстері компьютердің жадына енгізіліп қажетті сөздіктер алынды. Жеке жазушының тілін зерттеуге бағытталған машиналық қор іске қосылмақ. Тіл білмі институтының ұзақ жылдар бойы жинап-терген 5 млн-ға жуық картотекалық қоры сұрыпталып - "Қазақ тілінің автоматтандырылған "Қазына" картотекалық қоры" деген атпен компьютер жадына енгізілуде. Қазақ тілінің машиналық картотекалық қоры тіл зерттеушілерінің көптеген жұмысын жеңілдету барысында болшағы зор болмақ.[1]

Дереккөздер[өңдеу | қайнарын өңдеу]

  1. Қазақ тілі. Энциклопедия. Алматы: Қазақстан Республикасы Білім, мәдениет және денсаулық сақтау министрлігі, Қазақстан даму институты, 1998 жыл, 509 бет. ISBN 5-7667-2616-3