Лингвистикалық статистика
Лингвистикалық статистика — 1) кең мағынада тіл ғылымының статистикалық әдістерді қолданатын саласы; 2) тар мағынада тілге байланысты математиканың кейбір мәселелерін, атап айтқанда, мәтіндегі тілдік бірліктердің статистикалық жіктелуін зерттейді. Лингвистикалық статистиканың алғашқы материалы — мәтін және оның грамматикалық бірліктері (әріп, дыбыс, жалғау, жұрнак, сөз, сөзтұлға, сөз тіркестері, сөйлем). Лингвистикалық статистикада олардың тілдік тұлғасына сандық сипаттамалар жасалады, яғни мәтіндегі қолданысы, кездесу жиілігі, үлестірімдік зандылықтары, жалпы табиғи сипаты зерттеледі Лингвистикалық статистикада ең көп тараған әдіс Ципф заңына (АҚШ) негізделген талдау әдісі болып табылады. Ол бойынша F x i-const теңдестігі анықталады, мысалы, Ғ — жиілік сөздігіндегі сөздің жиілігін, i - сөздің раңгісін, яғни жиілігі төмендеуіне қарай реттелетін тізімдегі нөмірін білдіреді.[1]
Дереккөздер[өңдеу | қайнарын өңдеу]
- ↑ Тіл білімі терминдерінің түсіндірме сөздігі — Алматы. «Сөздік-Словарь», 2005 жыл. ISBN 9965-409-88-9
Бұл мақаланы Уикипедия сапа талаптарына лайықты болуы үшін уикилендіру қажет. |
Бұл мақалада еш сурет жоқ.
Мақаланы жетілдіру үшін қажетті суретті енгізіп көмек беріңіз. Суретті қосқаннан кейін бұл үлгіні мақаладан аластаңыз.
|
Бұл — мақаланың бастамасы. Бұл мақаланы толықтырып, дамыту арқылы, Уикипедияға көмектесе аласыз. Бұл ескертуді дәлдеп ауыстыру қажет. |