Жаңалықтар

ЖИ жарысы қыза түсті: Qwen3 OpenAI-ді басып озды ма?

ЖИ жарысы қыза түсті: Qwen3 OpenAI-ді басып озды ма?
Фото: ЖИ 30.04.2025 18:04 124

Қытайлық технология алпауыты Alibaba компаниясы жасанды интеллект саласындағы кезекті маңызды жетістігін таныстырды. Qwen3 деп аталатын бұл жаңа модельдер қатары — компанияның OpenAI мен Google сияқты әлемдік көшбасшылармен тікелей бәсекеге түсе алатын деңгейге жеткенінің айғағы.

Qwen3 дегеніміз не?

Qwen3 — гибридті (аралас) архитектураға ие бірнеше жасанды интеллект моделінің жиынтығы. Бұл модельдер күрделі тапсырмаларды терең «ойлану» арқылы орындай алады немесе қарапайым сұраныстарға жылдам жауап береді. «Ойлану» режимі арқылы модель өз жауабын логикалық тұрғыдан тексеріп отырады, бұл OpenAI-дің o3 моделімен салыстыруға мүмкіндік береді. Дегенмен, бұл жоғары дәлдіктің есебінен жылдамдықтың төмендеуіне алып келуі мүмкін.

Qwen3 модельдерінің көлемі

Alibaba ұсынған Qwen3 модельдері 0,6 миллиардтан 235 миллиард параметрге дейін созылады. Параметр саны неғұрлым көп болса — модель соғұрлым күрделі тапсырмаларды шеше алады. Ең үлкен модель — Qwen-3-235B-A22B, қазіргі таңда OpenAI-дің o3-mini және Google-дың Gemini 2.5 Pro моделдерін бірнеше бенчмарк бойынша басып озған.

Алайда бұл ең үлкен модель әзірге жалпы көпшілікке қолжетімді емес. Қазіргі таңда ашық қолжетімді нұсқалардың ішіндегі ең қуаттысы — Qwen3-32B, ол да жоғары өнімділік көрсетуде.

Ашық код және қолжетімділік

Alibaba компаниясы Qwen3 модельдерінің көп бөлігін ашық лицензиямен GitHub пен Hugging Face платформаларында жариялады. Бұл — жабық кодты жүйелермен салыстырғанда жаһандық қауымдастыққа әлдеқайда кең мүмкіндік береді.

Технологиялық жаңалықтар

  • MoE архитектурасы (Mixture of Experts): Кейбір Qwen3 модельдері тапсырмаларды шағын мамандандырылған ішкі модельдерге (эксперттерге) бөліп орындайды. Бұл әдіс есептеу ресурстарын үнемдеуге септігін тигізеді.
  • 119 тіл қолдауы: Модельдер 36 триллион токеннен тұратын ауқымды мәліметтер жиынтығында оқытылған. Токен — ЖИ өңдейтін мәліметтің ең кіші бірлігі (мысалы, 1 миллион токен ≈ 750 000 сөз).
  • Код жазу мен математикада жоғары нәтиже: Qwen3 модельдері LiveCodeBench, AIME, және BFCL сынды тесттерде жоғары нәтижелер көрсетті.
  • Нұсқауды орындау, форматпен жұмыс істеу, құралдарды шақыру секілді функцияларда мықты.

Бұл нені білдіреді?

Жасанды интеллект нарығындағы мұндай даму Қытай мен АҚШ арасындағы технологиялық бәсекені одан әрі ушықтыруы мүмкін. АҚШ үкіметі Қытай компанияларының GPU (мысалы, Nvidia) чиптеріне қол жеткізуін шектеуге тырысуда. Алайда Qwen3 сияқты ашық жүйелердің табысы — бұл шектеулерге қарамастан Қытайдың өз даму бағытын таба алатынын көрсетеді.

Baseten компаниясының негізін қалаушы Тухин Сривастава:

“Qwen3 сияқты ашық модельдер жабық кодты жүйелермен терезесі тең бәсекелесе алатынын дәлелдеп отыр. Бұл бизнеске жаңа таңдау еркіндігін береді,” — дейді.

Қазақстан үшін не маңызды?

  • Qwen3 моделі ашық кодта болғандықтан, отандық университеттер мен IT-мамандар оны өз жобаларына енгізе алады;
  • Қазақ тілін үйрету үшін арнайы деректер жиынтығын қосу арқылы ұлттық ЖИ моделін дамытуға жол ашылады;
  • Білім беру, бизнес, мемлекеттік қызмет салаларында арзан әрі тиімді ЖИ шешімдер пайда болады.

Alibaba-ның Qwen3 жобасы — тек технологиялық жетістік емес, жасанды интеллектінің жаһандық экожүйесінде күштер балансын өзгертуге қабілетті фактор. Ашық модельдердің дамуы, әсіресе дамушы елдерге, өз ЖИ шешімдерін құруға жаңа мүмкіндіктер береді. Бұл болашақта қазақ тілі мен мәдениетіне бейімделген жасанды интеллектілердің пайда болуына да ықпал етуі мүмкін.

Бөлісу:
Telegram Қысқа да нұсқа. Жазылыңыз telegram - ға