17038

Қазақша сөйле!

Какие слова в казахском языке наиболее употребимы? Сколько слов нужно знать, чтобы понимать и говорить на нем? Ответы на эти вопросы нашли в Институте языкознания имени Ахмета Байтурсынова: отечественные филологи разработали общеобразовательный частотный словарь казахского языка - наиболее употребляемой лексики. Если вы знаете хотя бы первые 20 слов из него, то уже сумеете понять смысл 12,9 процента казахского текста!

- В казахском языке самое употребляемое слово - это глагол бол (будь), - рассказывает заместитель директора Института языкознания имени Ахмета Байтурсынова Анар ФАЗЫЛЖАНОВА. - Он употребляется не только в своем прямом значении, но и как вспомогательный глагол в коммуникативных клише: сау болыңыз (будьте здоровы/до свидания) и қђтты болсын (поздравляю). Если вы знаете глагол бол, его значение и варианты употребления в этих коммуникативных вариантах, то сможете понять казахский текст на 1,8 процента! Это называется процент покрываемости слов текста.
- Чья речь стала основой для составления словаря? Ведь бабушка из аула, часто произносящая ұят (стыд), наверняка редко произносит слово “деңгей” (уровень), которое вошло в словарь…
- Мы собирали текстовую базу, представляя себе русскоязычного школьника, который учится в казахстанской школе и живет в нашей среде, каждый день сталкиваясь с ней: слышит казахскую речь по телевидению и радио, читает СМИ на казахском языке - хотя бы потому, что это школьное задание. На базе всех этих текстов и был составлен общеобразовательный частотный словарь казахского языка. А это около семи миллионов словоупотреблений: 2,5 миллиона слов в научном стиле (учебники), 746 тысяч художественного стиля (детская литература и художественные произведения), 465 000 в разговорном стиле (устное бытовое общение), 69 000 словоупотреблений в официально-деловом стиле (несложные официальные документы и основные законы Конституции), 669 000 словоупотреблений в публицистическом стиле (тексты детских журналов, газет, телепередач), 2 658 000 словоупотреблений в смешанном стиле.


Почему возникла необходимость создания именно такого пособия? И в советское время, и в годы независимости словари казахского языка составлялись интуитивно, каждый автор использовал свой опыт и багаж знаний. Следовательно, они были неполными и отражали какой-то определенный период времени, когда жил сам составитель. Частотный же словарь строился с использованием математического метода, разработанного Институтом информатики. Этот процесс проходил по определенному алгоритму: с помощью программы-анализатора лингвисты вручную отделяли окончание от самого слова, выделяя его начальное значение. Анализатор при этом обращается к другому программному обеспечению, которое содержит 15-томный словарь. Его задача - определить, к какой части речи это слово относится.


- А нельзя было всю работу поручить компьютерам, сделать весь процесс автоматическим?
- Компьютер, собирая отдельные слова, не выделяет их корень. Вот если вы сейчас дадите задание компьютеру собрать отдельные слова в ряд и вывести частотность, он соберет абсолютно все словоформы. Он не видит различий между балға (топор) и балға (к мёду). А нам нужно взять только корень слова и обозначить часть речи.
Но это еще не все. Частотный словарь - только часть большого и, если повезет, непрерывного проекта по формированию национального корпуса языка. Что это, собственно, такое? Это информационно-справочная система, основанная на собрании текстов во всем многообразии жанров, стилей, социальных вариантов. Говоря проще, оцифрованная база основного массива языка. Сегодня многие крупные и малые языки имеют национальные корпусы, которые по значению для развития языка сопоставляются с изобретением микроскопа, телескопа, рент-геновского аппарата или томографа. Общепризнанным образцом считается Британский национальный корпус (BNC), состоящий из 100 миллионов слов. А национальный корпус русского языка получал финансовую поддержку сразу в четырех научных центрах Российской Федерации - сейчас в их базе более 600 миллионов слов. В Казахстане эта идея стала возможной год назад благодаря поддержке министра образования и науки Казахстана Ерлана САГАДИЕВА. Институт языкознания уже обработал 30 миллионов словоупотреблений, но на сам сайт, который еще на стадии доработки, пока загрузили только семь. В режиме онлайн выбираешь нужное слово, сразу выходит значение слова, его происхождение, где и как оно употребляется, тут же приводятся синонимы и примеры из авторитетных источников. Уже выпустили частотный словарь в бумажном варианте и распространили 20 тысяч экземпляров по учебным заведениям. Общеобразовательный частотный словарь казахского языка состоит более чем из 36 000 слов с указанием их частотности и покрываемости. Эту работу 70 сотрудникам Института языкознания удалось проделать всего за год, но это еще не предел: ведь язык неотрывен от стремительно развивающихся технологий, постоянно обрастает неологизмами, а они требуют толкования и классификации сфер употребления.


Министр, поняв значимость новейшего частотного словаря, поручил нам его разработать. А мы предложили разработать словарь в рамках проекта национального корпуса, о котором говорили всегда. Мы и раньше создавали частотные словари, но не такие объемные. И вот что интересно: оказалось, что и тогда, и сейчас три слова были одинаково популярными и употребляемыми: жер, ел, тiл. То есть земля, народ и язык - это вечные понятия, основные ценности казахов. Язык ведь всегда отражает мировоззрение народа. А вот с обретением независимости стали широко употребляемыми слова мемлекет (государство) и республикалық (республиканский).
По прогнозам экспертов, национальный корпус казахского языка позволит решить ряд проблем: кардинально изменить подход в обучении казахскому языку при создании учебников, учебных пособий, тренажеров разных типов, создать мощную электронную библиотеку. Кстати, на его базе уже есть онлайн-приложение - изучение казахского языка для Android и обучающая программа для малышей.
- Что именно поменяется в методике обучения казахскому языку? Ведь изучая его 11 лет, дети в русских школах так и не начинают активно употреблять его...
- Методика преподавания языка в школах должна постоянно модернизироваться в силу изменений в самом языке. Активная лексика имеет свойство меняться, а это необходимо отражать в учебниках. Кроме того, не было четкой системы анализа, которая помогала бы определить, насколько правильно составлены лексические минимумы. В 2017 году министерство начало серьезную работу в новом направлении: теперь в школах с русским языком обучения будет действовать новая методика обучения казахскому языку. Суть ее заключается в том, чтобы предложить школьникам прежде всего изучать слова, которые чаще всего употребляются в казахском языке, постепенно увеличивая их словарный запас. Таким образом, процесс изучения будет сначала затрагивать наиболее часто используемые слова, а затем те, что употребляются реже.
- Но, зная одни только слова, не заговоришь по-казахски: надо же уметь их связать между собой…
- На базе частотного словаря создан лексико-грамматический минимум - документ, который объясняет составителям учебников и преподавателям, как правильно и в какой последовательности изучать те или иные слова, как и когда их использовать. В него вошло 2884 слова, охватывающие словарный запас учеников с 1-го по 11-й класс. Таким образом, теперь авторы будут составлять учебники с использованием лексико-грамматического минимума.

20 самых употребляемых существительных общеобразовательного частотного словаря:
жыл (год), сөз (слово), адам (человек), қазақ (казах), білім (знание), ел (народ), жер (земля), тіл (язык), бала (мальчик), күн (день), халық (народ), жұмыс (работа), өлең (песня), еңбек (труд), көз (глаз), әйел (женщина), кез (любой), үй (дом), жол (дорога), қызмет (служба).

20 самых употребляемых существительных в 20-томном собрании сочинений Мухтара АУЭЗОВА:
сөз (слово), ел (народ), жер (земля), күн (день), үй (дом), бас (голова), адам (человек), қазақ (казах), жол (дорога), бала (мальчик), қол (рука), көз (глаз), өлең (песня), жан (душа), ой (мысль), кісі (человек), ауыл (аул), ақын (поэт), кез (любой), қыз (девушка).

Екатерина ТИХОНОВА, фото с интернет-ресурсов, Алматы

Поделиться
Класснуть