THE STATE LANGUAGE DEVELOPMENT INSTITUTE
МЕМЛЕКЕТТІК ТІЛДІ ДАМЫТУ ИНСТИТУТЫ
ИНСТИТУТ РАЗВИТИЯ ГОСУДАРСТВЕННОГО ЯЗЫКА
Соңғы мақалалар:

404 - Ештеңе табылмады.
Кешіріңіз, сіз іздеген ақпарат бұл жерде жоқ.
Bilim
Innovations Group ұжымы Қазақстан Республикасы Ғылым және жоғары білім
министрлігі Ғылым комитетінің «Қазақ сөздеріндегі дыбыс тіркесімінің бұзылуын
автоматты түрде анықтайтын IT бағдарлама» атты жобасы аясында Мемлекеттік тілді
дамыту институтының лингвистикалық қолдауымен Qazemle бағдарламасын құрастырды.
Qazemle –
қазақ дыбыстарының (дауысты, дауыссыз) қалыптасқан бұлжымас тіркесу
заңдылықтарын анықтайтын, орыс графикасымен хатқа түскен мәтіндердегң
(сөздердегі) үндестік заңының бұзылуын көрсететін, мәтіндегі қате дыбыс
тіркесімдерін автоматты түрде түзеп отыратын IT бағдарлама.
Жобаны
жүзеге асыру үш кезеңнен тұрады:
І. Қазақ
сөздеріндегі кездесетін и, у, ю, я таңбаларын қазақ тіліндегі дыбыс
тіркесімдеріндегі заңдылықтарына сай жазу (жүзеге асырылды).
ІІ. Барлық
қазақ сөздерін тек қазақ тілі дыбыстардың тіркесім, үндесім заңдылықтарына
бағындырып жазу (орындалу үстінде).
ІІІ.
Шеттен жат емлемен кірген сөздерді (термин сөздерді) қазақ тілінің емле
ережелеріне бағындыру (орындалуы жылдың аяғы).
Иә,
жоғарыда көрсетілгендей, қазір бірінші кезеңнің жұмыстары аяқталды, екінші
кезең қыркүйек айында, үшінші кезең желтоқсан айында аяқталмақ. Бірінші
кезеңнің нәтижесін, яғни тіліміздегі қате енген и, у, ю, я әріптері бар
сөздердің дұрыс жазылуын қазір https://qazemle.com/text-transformer сілтемесіне
өтіп, сынап көре аласыз. Мысалы: ки (қазіргі емле) – кій (Qazemle), аю
(қазіргі емле) – айұу (Qazemle) түрінде жазылады. Бұл сөздердің неге осылай
жазылуы керектігін де бағдарлама түсіндіріп береді.
Бағдарламаны
құрастыруда ЖИ пайдаланылған, күннен күнге жетіліп жатқан ЖИ арқылы бірінші
кезеңде 50 000+ сөз талданып, статистикалық заңдылықтар анықталған, жобаның
келесі кезеңдерінде де ЖИ-дың көмегі кеңінен пайдаланылмақ. Бағдарлама арқылы
латын графикасының МТДИ ұсынған ұлттық нұсқасының жобасы да сынақтан өткізіліп
жатыр.
Qazemle
бағдарламасына алдағы уақытта қағазға жазылған мәтіндерді, құжаттарды сканер
арқылы өткізіп, редактор бағдарламасына салу арқылы қате жазылған дыбыс
тіркесін таба алуы, әр түрлі қаріптерді, түрлі тілдердің алфавиттерін,
сондай-ақ графикалық символдарды тани алу, пунктуациялық қателерді анықтау,
стильдік қателерді табу секілді қосымша функциялар қосылады деп жоспарлануда.
*Алдағы
уақытта кеңейтілген латын пернетақтасында болуы үшін ғ, ұ, ң, ш, ы дыбыстарының
таңбаларын Unicodе-қа енгізу жұмыстары жүргізілмек.