Search for a command to run...
Мақалада қазақ тілінің грамматикалық аспектілерін зерттеу үшін корпус материалының мүмкіндіктерін қаншалықты қажетімізге жарата аламыз деген мәселе аясында етістіктердің грамматикалық формалары жиілігі қарастырылады. Қазақ тілінің сөз жиілігі мәселесі ғылыми объекті ретінде зерттеліп, сөздіктер құрастырылғанымен, осы мәселеде қазақ тілінің корпус базасы мүмкіндіктері толыққанды зерттеулер жүргізу үшін пайдаланылмай келе жатыр, өйткені қазақ тілінің ұлттық корпусын жасау мәселесі кеш қолға алынды. Корпус базасындағы мәтіндерді тілдік зерттеулер үшін пайдалану өте маңызды. Корпус мәтіндерін зерттеу тілдің жүйесіндегі лексикалық қабаттың, синтаксистік конструкциялардың, грамматикалық формалардың өзгерісін, дамуын анықтауға жол ашады. Кез келген тілдің сөздік қоры құбылмалы, өзгермелі болатындықтан, әрбір жылда тіл қандай сөздермен, сөзформаларымен толығады, өзге тілдерден енген сөздерге деген тілдің иммунитетіқандай, жаңа сөзформаларын қандай күйде қабылдады деген мәселеде корпус базасы жыл сайын толықтырылып, жетілдіріліп отырғаны абзал. Бұндай зерттеу жүргізілмесе, тіліміздің даму бағыты бұлыңғырланады. Ал шетел тәжірибесінде лингвистикалық зерттеулер үшін корпус базасы ертеден қолға алынып, түрлі математикалық әдістің көмегімен сөз және форма жиілігінің статистикасы анықталады. Шетелдік тәжірибеге негізделіп жасалған «Қазақ тілінің ұлттық корпусыныңподкорпустары» (qazcorpora.kz) базасындағы корпустың іздеу механизмі сөзформа жиілігін зерттеуге аса қолайлы. Qazcorpora.kz сайтының алғашқы бетіндегі «Статистика» айдарында сөзформа жиілігін зерттеу үшін Сілтеме ұсынылған. Оның көмегімен қажетті статистикалық ақпаратты автоматты түрде көшіріп алуға болады. Мақалада «Қазақ тілінің ұлттық корпусының подкорпустары» (qazcorpora.kz) базасындағы жиілік статистика бойынша публицистикалық және ауызекі мәтіндеріндегі қазақ тілі етістіктерінің грамматикалық форма жиілігі талданады. Корпус базасындағы мәтіндерде ең жиіқолданылатын есімшелі, көсемшелі және қалып етістіктердің грамматикалық формалары, атап айтқанда, деп, деген, емес, еді, болып, екен, болды, болған, алып, болады, келген, болса, жатқан, отыр, дейді, келеді, деді, болатын, жатыр, алған, келіп, жүрген, отырып, тұр, отырған, тұрған, жүріп, алды, тұратын, жүр, алатын, тұрып етістіктерінің жиілігі өзара салыстырылады. Бұл етістіктердің мәтіндерде жиі қолданылу себептеріне семантикалық және контекстік талдау жасалады. Де, е, бол, ал, кел, отыр, тұр, жүр, жат көмекші етістіктерінің қазақ тіліндегі көпмағыналығы мен көпқызметтілігі талданады. Публицистикалық және ауызекі мәтіндерінде деп, емес, болып, алып, келген, жатқан, отыр, тұр, жүрген етістіктерінің тіркесімділік қабілетінің жоғары болатыны, олардың алуан түрлі синтаксистік қатынаста жұмсалып (анықтауыштық, пысықтауыштық, предикаттық), еркін, түйдекті тіркес және күрделі формалар (аналитикалық етістіктер) жасауға негіз болатын қабілеті жүйеленеді. Етістіктердің жиілік көрсеткіші кемімелі прогрессия және қарапайым есептеу жолымен шығарылды. Осы етістіктердің функционалдық қолданыс жиілігіне қатысты тұжырым мен қорытынды шығарылды.
Published in: Bulletin of the Karaganda University Philology series
Volume 31, Issue 1(121), pp. 48-58