Жаңалықтар

«QAZAQ AI» атты қазақ тіліндегі алғашқы ЖИ компаниясы қалай құрылған

«QAZAQ AI» атты қазақ тіліндегі алғашқы ЖИ компаниясы қалай құрылған
Фото: qazaq.ai 14.07.2024 00:33 608

Әлеуметтік желіде қазақша ән шырқайтын жасанды интеллект әншілері трендке айналып, тыңдарманның көңілінен шығып жүр. Соның ішінде SARAUEN мен MIRASAI атты әншілерді көпшілік жылы қабылдады. Бұл жобаның авторы қазір АҚШ-та тұрады. Моңғолияда туып, шетелдерде білімін жетілдіріп, Бостондағы университетте қазақ тіліндегі QAZAQ AI атты компанияның негізін қалаған. Алтынбек Мұрат технология саласында еңбек етіп, қазақша сайратып жүрген азаматтың бірегейі. Оның арманы да, мақсаты мен мұраты да қазақ тілін технология тіліне айналдырсам деген ниетімен тікелей байланысты. Осылайша кейіпкеріміз мақсатына жету жолында бірқатар жетістікке жетіп үлгерген.

El.kz: Алтынбек мырза, қайырлы күн! Ең алдымен өзіңіз туралы толығырақ айтып берсеңіз.

Алтынбек Мұрат: Өзім Моңғолияда туып өскенмін. Қазір АҚШ азаматымын. 2002 жылы Моңғолиядан кеттім. 2007 жылдан бері АҚШ-та тұрып жатырмын. Біріккен Араб Әмірліктерінде бакалавриат, АҚШ-та Миссури университетінде Инженерияны басқару магистратурасын аяқтадым. Сауд Арабиясында төрт жылдай постдокторлықта жұмыс істеген. Қазір Бостон университетінде суперкомпьютерлермен қуат құралдарына арналған жаңа нано-материалдарды модельдеумен айналысамын. Көбіне супер компьютер қолданып, материалдық ғылымдарды және нанотехнологияның күрделі зерттеулерін жасаймыз. Үнемі жасанды интеллекттің айналасында жүрміз деп айтуға болады.

El.kz: Qazaq AI коммерциялық емес кәсіби ұйымын құрудағы мақсатыңыз қандай болды?

Алтынбек Мұрат: Жасанды интеллект шыққалы біраз уақыт өтті. Біз ғылыми зерттеулерімізде машиналық оқыту (machine learning), терең оқыту (deep learning), нейрондық желілерді (neural networks) 4-5 жыл бұрын қолдана бастадық. Тек ChatGPT шыққаннан кейін ғана адамдар ЖИ туралы біліп, оны көбірек қолдана бастады. Бірақ, біз осы саланың ішінде жүргендіктен, қазақ тілі бұл салада дамымағанын жақсы білеміз. ChatGPT-де қазақ тілінде ешнәрсе сұрай алмайсыз. Қазір америкалықтар ChatGPT-ді күнделікті өмірде барлық салада қолдана бастады. Бұл барлық салаға енетін технология.

Жасанды интеллектінінің мүмкіндіктерін толық пайдалану үшін қазақ тілінде емес, басқа тілде жүгінуге тура келеді. Бұл өте өкінішті жағдай. Біз тілімізден бір рет айырылып қала жаздадық, ал енді ЖИ қазақша дұрыс түсінбесе, жаңа технологияларды басқа тілде үйренуге мәжбүр боламыз. Қазақстанда, әсіресе қазақ ұлтының ЖИ қолдануын жеңілдету және одан әрі дамыту мақсатында Qazaq AI платформасын құрдық. Платформа сонымен қатар, тілдік мұрамызды сақтау мен өркендетуде үлесін қосады.

ЖИ қазақ тілінде болмағандықтан, жастарымыз оны басқа тілде қолданады. Менің ойымша, қазақ балалары қазақ тілінде сөйлегені үшін жаңа технологияны қолданудан қалыс қалмауы тиіс. Мысалы, ауыл аймақтарда тұратын қара домалақ бауырымыз бен қарындасымыз орыс тілі мен ағылшын тілін жетік білмейді, алайда, қазақ тілінде судай сөйлейді. Бірақ қазіргі технология қазақ тіліне бейімделмеген болса, ол баланың келешегі қандай болмақ? Өзімен қатарлас орыс бала немесе орыс тілін білетін бала әлдеқайда дамып, жарқын болашаққа жолы ашылып, жасанды интеллект өмірін жеңілдетеді. Сәйкесінше жоғары жетістіктерге тез жететіні анық.

Осы игі ниетпен ана тілінде сөйлейтін қазақстандықтардың жасанды интеллектті еркін қолдануы үшін жобамызды жүзеге асырдық. Тағы бір маңызды ақпарат: Qazaq AI ресми түрде Бостондағы Массачусетс технологиялық институты (MIT) базасында бірге құрылып, жүзеге асып жатыр. MIT әлемдегі ең үздік үш университеттің бірі. Qazaq AI осы институттың ресми акселераторынан өтті. Біз бірге өзекті мәселелерді талқылаймыз.

El.kz: Қазақ тілін жасанды интеллектпен интеграциялау тәжірибесімен бөліссеңіз. Модельдеу барысында қандай қиындықтар туындады және оларды қалай шештіңіз?

Алтынбек Мұрат: Бұл үлкен мәселе және әлі де шешілмеген тұстары бар. Қазір қазақ тілінде AI моделі жоқ. Бүгінде америкалық алпауыт компаниялардың ұсынған модельдерін қолданып отырмыз. Бұл салада біраз кеш қалғанымызды мойындау керек. Сондықтан OpenAI сияқты компаниялардың модельдерін шама-шарқымыз жеткенінше пайдаланып отырмыз. Ал басқа түрлерінде қазақ тілінде жасалған модель жоқ. Үкімет жасанды интеллектке қаржы бөліп жатқаны туралы естідім, бірақ қазақша AI моделін жасап бітіргенше, OpenAI ChatGPT қазақ тілді нұсқасын әлдеқайда жақсартып үлгереді. Біз оларға ілесіп үлгермейміз деген ойдамын.

Жақында ChatGPT 5 шығады, және сол нұсқасы қазақ тілін әлдеқайда жақсартады. Біз сол нұсқасын көбірек қолдана бастайтын шығармыз. Қазақстаннан бұрын әлемдік алпауыт компаниялар қазақ тілін өз AI модульдеріне қосады. Олар мұны өздерінің пайдасы үшін жасайды. Біз бар нәрсені өзімізге қажетті етіп жақсартып, олар бізге 80 пайыз дайын модель берсе, соның 20 пайызын өзіміз дамытсақ, соның өзі керемет болары анық. Бірақ оған дейін біраз уақыт бар, және өзіндік қиындықтары жетерлік.

El.kz: Qazaq AI ұйымы аясында жасалған жобалардың ерекшеліктері мен ұсынатын мүмкіндіктері туралы айтып берсеңіз. Қазақ тілінде ән шырқайтын SARAUEN-нің басты идеясы неде? Jasandy.com ChatGPT-дің қазақша баламасына айнала ала ма? Бұдан басқа тағы қандай бағыттар бойынша ЖИ бағдарламаларын жасадыңыздар?

Алтынбек Мұрат: Qazaq AI-дың бір ерекшелігі – біз әлемге танымал технологияның, білім мен ғылымның ордасы Бостондағы MIT-пен бірге жұмыс істеп жатқандықтан, басты мақсатымыз – осындағы сала мамандары мен сарапшылардың жасанды интеллектке қатысты білімін Қазақстанға, қазақ тілінде жеткізу. Әр салаға көмектесіп, септігімізді тигізу. Мысалы, Qazaq AI веб-сайтына кірсеңіз, онда әртүрлі сервистер бар. AI ACADEMY бар, ол арқылы қазақ тілінде жасанды интеллекттің мүмкіндіктерін ұсынады және MIT-тың менторларымен жұмыс істеуге мүмкіндік береді. Біз көптеген университеттерге, білім орталықтарына, медицина мекемелеріне ой-пікірімізді, кеңесімізді бере аламыз. Жасанды интеллекттің негізгі нүктесінде жүрген адамдардың тәжірибесімен бөлісе отырып, «осылай жасап жатыр, сіздер де осылай істеп көріңіздер» деп нұсқай аламыз.

Өзіміз жасанды интеллектті жасай алмағандықтан, инновация ретінде дайын дүниені тиімді пайдалануымыз керек. Сондықтан, AI саласында алдыңғы қатарда жүрген мамандардың білімін, мүмкіндіктерін тікелей ұсынуға тырысамыз. Басты артықшылығы – осы.

Жасанды интеллект идеясы өте қызық. Қазір адамдар ChatGPT-ды қолданады. Бірақ ChatGPT-ге тіркеліп, кірген кезде интерфейс ағылшынша немесе орысша болады. Қандай жасанды интеллект болмасын, интерфейсі ағылшын немесе орыс тілінде. Білім саласында ешкімді қалыс қалдырмауымыз керек. Мысалы, ауылдағы туыстарымыз ChatGPT-ге тіркелгісі келеді, бірақ тек ана тілінде ғана түсінетін адамға бұл қолжетімсіз болады. Бұл жасанды интеллекттің түпкі мақсаты – ChatGPT-дің қазақша баламасын ұсыну. Бұл жасанды интеллект өзі жеке бөлек модуль емес. Бұл ChatGPT-ді жасап шығарған OpenAI-ға байланып тұр. Бұған өзіміз ақша төлеп отырмыз. Тек тіркелу мәселесін немесе күрделі тақырыптарда жауап алу үшін OpenAI-ға ақша төлеу керек қой. Біз оны жойып, халыққа тегін ұсынуды жөн көрдік. Халық жасанды интеллектті түсінсін, Жасанды-ға кіріп, «AI деген не? Бізге не бере алады?» дегеннің шет жағасын болсын білсін деп, оны тегін қолдану мүмкіндігін беріп отырмыз. Бұл негізі ChatGPT-дің қазақша нұсқасы. Маңыздысы – ешқандай тіркелусіз, ақша төлемей-ақ жасанды интеллекттің мүмкіндіктерін қазақстандықтар қолдансын деген ой.

Ән шырқайтын жасанды интеллект шыққалы біраз уақыт болды. Бірақ күннен күнге жақсартып, дамытып келеді. Қазір бірнеше модельдері бар. Адамдар қолданып жүрген бірнеше компанияның модельдерінен бөлек жабық түрлері де бар. Біз секілді ұйымдар ала алатын модельдердің мүмкіндігімен жасадық. Әкем де, мен де әдебиетке құштар жандармыз. Әкем өмір бойы өлең жазып, іштегі жырларын қағаз бетіне түсіріп жүргенін білемін. Сол әкемнің жырларын, ағаларымыздың жақсы өлеңдерін әуен ретінде ұсынғым келді. Қаншама қазақтың ақындары бар. Тіліміздің байлығын мұра етіп сақтап отырған әдебиеттегі ақын-жазушыларымыздың жырларын әлемге әуен ретінде ұсынатын мүмкіндікті пайдаланып, осы жобаны жасадық. SARAUEN деген әнші қызымыз, енді бізде МIRAS AI деген әнші жігітіміз бар. Қазір оның әуендері жасалып жатыр. Болашақта екеуі бірге дуэт жазады. Осы екі әншіміз болады.

Жасанды интеллект саласында бірнеше жобалар дайындап жатырмыз. Оның бірегейі – телефон мен айпад қолданатын балалардың киберқауіпсіздігін қамтамасыз етуге бағытталған. Көпшілік балаларының ТикТок-та отырып, немен айналысып жатқанынан хабарсыз жүреді. Соған қарсы негізделген, америкалық нарыққа арналған, одан бөлек әлемнің түрлі елдерінде қолдануға болатын бағдарлама жасаймыз. Аталған жобаны жасанды интеллектті қолданып, өте ерекше нұсқада жасап жатырмыз. Бұл MIT-тың акселераторынан өтіп жатқан жоба.

Тағы бір жоба медицина саласын қамтиды. Бостонның медицина саласы, ғылыми орталықтары өте ілгері екені белгілі. Бұл жақтың ауруханаларында жасанды интеллектті қарқынды түрде қолданады. Біздің жобамыз арқылы науқастарға тікелей консультация беруге болады. Бір жеріңіз ауырып тұрғанда ауруханаға бармай-ақ, ең алдымен телефонға жазасыз. Ол сізге сұрақ қояды, сіз нақты жауап бере алмасаңыз, дәрігерге тікелей шыға аласыз. Ауылда, таудың басында жатқанда дәрігерге баруға 4 сағат кетуі мүмкін. Осы сәтте жасанды интеллект арқылы дәрігердің тікелей кеңесін ала аласыз.

Тағы бір саласы – мамандық. Біздегі ұстаным қандай? Жасанды интеллект адамдарды алмастыра алмайды. Бірақ жасанды интеллекттің құлағында ойнайтын адамдар оны білмейтін адамдарды алмастырады. Мәселе осында. Upskilling жасайтын компаниямыз құрылып жатыр. Алда көптеген жоспарларымыз бар. Қолымыздан келеді, мақсатымыз көп, дегенмен уақыт тығыз. Бәріміз бірге Qazaq AI-дың платформасындағы жобаларды дамытсақ деймін. Әсіресе, жастарды икемдеп, MIT-тың стартаптарына қосқымыз келеді.

El.kz: Қазақ тілі мен мәдениетін ілгерілетуде жасанды интеллектті пайдаланудың негізгі артықшылықтары қандай және жасанды интеллект дәстүрлі өнерді алмастыра ала ма (мысалы, ЖИ шығарған күйлер, жазған өлеңдер мен орындаған әндер және тағы басқа).

Алтынбек Мұрат: Жасанды интеллект адамды толықтай алмастыра алмайды. Тек қана жасанды интеллектті қолданатын адам оны білмейтін маманды алмастырады. Әрине, көптеген жұмыстар автоматтандырылады. Ұсақ-түйек жұмыстарды жасанды интеллект өзі-ақ істей береді, ал біз маңызды ресурстарымызды күрделі мәселелерге жұмсаймыз. 10 күнде жасауға тиісті дүниені 8 күнде жасап алып, уақыт ұтамыз. Жасанды интеллекттің артықшылығын SARAUEN-не тікелей көруге болады. Шығармашылық иелеріне ешқандай кедергі туындамайды. Олар өз туындыларын жасанды интеллект арқылы әнге айналдырады. Әншілер SARAUEN секілді ЖИ-ден кейін ән айтпай қалады деген түсінік жоқ. Керісінше, әншілер осы жасанды интеллектіні қолданып, бұдан да жақсырақ айтуға болатынын түсінеді.

Мысалы, бір ай бойы бір әншінің соңынан жүгіріп, оның әнін жазып, әуені шыққанын күтуге кеткен уақытты жасанды интеллектті қолданып, 1 апта ішінде бір ән жарыққа шығара аламыз. Осы сәтте тіл саласының мәселелерінің шешімі шығады. Біреу қазақ тілінде кітап жазып, балаларға ертегілер жазып, иллюстрация жасатып, таныстырғысы келсе, жасауға еш кедергі жоқ. Тіл мен мәдениетті осылай дамыта аламыз. Салт-дәстүр өте маңызды нәрсе, жасанды интеллект осындай мәселелерге көмектесе алады.

Ағылшынша "human in the loop" деген сөз бар. Әрқашан бір адам болады. Жасанды интеллект тек біздің істеуге тиісті емес жүгімізді жеңілдетеді. Әдебиет пен мәдениет тікелей тілге байланысты. Егер қазақтың жасанды интеллектісі жақсы болмай, әдебиеті дамудан қалыс қалса, мысалы, балалардың кітаптары да солай болады. Біз жасанды интеллектті қолданып, графикалық қызықты кітаптарды дамытып, тұлғаларымыз туралы платформалардан таныта аламыз.

Менің мақсатым – қазақ тілін үйрену тәсілдерін жүйелеу. Ағылшын тілін білетін балалар жасанды интеллектті қолданып, тезірек, оңай әрі қызықты түрде қазақ тілін үйренетін платформа жасауды жоспарлап отырмын. Мамандармен осы идея туралы талқыладық. Интернетте қазақ тілін үйренуге қатысты көптеген материалдар бар, грамматикалық кітаптар жетерлік. Бірақ балаларға қиын жолмен үйрете алмаймыз. Оңай әрі қызықты түрде үйрететін дүние жасағымыз келеді.

«QAZAQ AI» атты қазақ тіліндегі алғашқы ЖИ компаниясы қалай құрылған

Фото: Жеке мұрағат 

El.kz: Бүгінде қазақстандықтардың басым көпшілігі ChatGPT-ді қолданады. Алайда бұл жасанды интеллект қазақ тіліндегі сұранысқа ағылшын немесе орыс тіліндегі сұраныстар сияқты кең көлемді, түсінікті жауап бермейді. Осы мәселені шешудің қандай жолдары бар? Жасанды интеллект әлемінде қазақ тілінің қолданысын қалай кеңейтуге болады? Жасанды интеллект технологияларының қарқынды дамып келе жатқан контекстінде қазақ тілінің болашағын қалай көресіз?

Алтынбек Мұрат: Ерте ме, кеш пе қазақ тілі жасанды интеллектте дами түседі және оның мүмкіндіктері кеңейеді. Бұл бағытта OpenAI, Microsoft, Meta сияқты үлкен компаниялар жұмыс істеп, өз пайдасы үшін дамытатыны анық. Біраз уақыт жоғалтуымыз мүмкін, бірақ сол компанияларға ақысын төлеп, олардың өнімдерін қолданатындай жағдайға жетеміз. Бұл да бір бизнестің моделі. Мүмкін тегін модульдерді өзіміз жақсартып, қолданатын шығармыз. Ағылшындар «дөңгелекті басынан бастап жасамай-ақ қой, инновация жаса» деп айтқандай, біз де дайын тұрған модульді алып, соның өзімізге жарамды нұсқасын жасай аламыз.

Мәселені шешудің жолдары – Үкіметтен болсын немесе Qazaq AI ретінде біз де OpenAI сияқты компанияларға тікелей ұсынысымызды беріп, солармен бірлесіп осы модельді жақсарту. ChatGPT-дің қазақ тілінде жақсы сөйлемеуінің себебі – оларда қазақша деректер аз және оған тәжірибе жасамаған. Енді-енді ғана «Қай тіл қалып қалды?» деп жан-жағын реттеп, тілдерді қосып жатыр. Мен қазақ тілі инновациялық салада дами түсетініне сенімдімін. Технологияның барлық саласында ана тілімізді қолданамыз деген үміт бар. Ән айтудан кино түсіруге дейін, медицина саласында дәрі-дәрмектер болсын, білім саласында жұмысымызды жеңілдетеді. Жасанды интеллект біздің көмекшімізге айналады.

El.kz: ЖИ технологияларын әзірлеу кезінде, әсіресе құпиялылық пен мәдени нормаларды сақтау мәселелерін ескере отырып, қандай этикалық принциптерді ұстанасыз?

Алтынбек Мұрат: Бұл мәселені көпшілік мән бермегенімен, өте күрделі сұрақ. Америкада көптеген адамдар, әншілер, суретшілер немесе кітап авторлары компанияларды сотқа беріп жатыр. Менің көзқарасым, егер ашық қолданыста жатқан материалдар болса, әрине, олар ЖИ модуліне еніп кетуі мүмкін. Мысалы, біз Сарәуенді жасаған кезде біреудің өлеңін рұқсатсыз алған жоқпыз. Онда әкеміздің өлеңдерін қолдандық. Америка құпиялылық пен мәдени нормаларға өте көп назар аударып жатыр. Әрбір жақсылықтың кемшін тұсы да бар, және әлі де көптеген мәселелер туындайды. Бұл технологияны жаман ниетпен қолданатындар өте көп. Мысалы, сайлау кезінде біреудің дауысы мен түрін қолданып, көп нәрсеге әсер етуге болады.

Осы орайда өз басым стандарт принциптерді ұстанамын. Қазақша айтқанда, ешкімнің ала жібін аттамай, сақтанып, байқап қараймын. Қазақ тілін дамытамыз деп барлық құжаттарды ашық қолданысқа бере салуға болмайды. Қолдағы барлық құжатты енгізуге болмайды. Microsoft Американың Қорғаныс министрлігіне жалпы интернетті қамтымайтын, өзіндік жеке модулін жасап берген.

Сол сияқты, біз де өзіміздің құпиялылық пен мәдени нормаларымызды сақтай отырып, қазақ тілінде жасанды интеллектті дамытуға тиіспіз. Жақсы ниетпен жасалған әрбір ісімізде мұқият болуымыз керек. Жасанды интеллекттің артықшылығын дұрыс пайдаланып, оның зиянды тұстарынан сақтануымыз қажет.

El.kz: Алдағы уақытта қазақ тіліндегі ЖИ дамыту бойынша қандай жоспарларыңыз бар?

Алтынбек Мұрат: Көптеген жоспарларымыз бар. Ең маңыздысы – қазақ тілінде ғана сөйлейтін қазақстандықтар жасанды интеллектті қолданудан қалыс қалмауы үшін әр саланы қамту. Білім, медицина, және кез келген басқа салаларда ЖИ-ді қазақ тілінде дамыту. Біз қадам-қадаммен Qazaq AI платформасын дамыта береміз. Бізбен бірге жұмыс істеуге ниетті жандар үшін әрдайым ашықпыз.

Мені бір қынжылтатын мәселе – жасанды интеллект саласында Қазақстан көптеген жоба жасағысы келеді, бірақ қазақ тіліне бірінші кезекте басымдық берілуі тиіс. Әрбір жоба қазақ тілінде қолжетімді болуы керек. Біз қазақ тілін қолдап, дамытуды мақсат етеміз. Жасанды интеллект арқылы өз мәдениетіміз бен тілімізді сақтап, өркендетеміз деп сенеміз.

El.kz: Сұхбатыңызға рахмет!

Бөлісу:
Telegram Қысқа да нұсқа. Жазылыңыз telegram - ға