Лента новостей

Представлена «Модель обучения казахскому языку «Tilqazyna» на основе ИИ

Представлена «Модель обучения казахскому языку «Tilqazyna» на основе ИИ
Фото: © El.kz/Марина РУЗМАТОВА/ChatGPT 17.01.2025 17:27 140

Национальный центр «Тіл-Қазына» представил первые результаты модели обучения казахскому языку с использованием искусственного интеллекта, сообщает ИА El.kz со ссылкой на пресс-службу Миннауки и высшего образования РК.

Национальный научно-практический центр «Тіл-Қазына» при Комитете языковой политики Министерства науки и высшего образования представил первые результаты работы своей новой разработки — модели обучения казахскому языку «Tilqazyna», основанной на искусственном интеллекте.

Модель способна выполнять широкий спектр задач в области казахского языка, включая:

  • генерацию текста;
  • создание перифраз;
  • работу с контекстом;
  • сокращение текстов;
  • исправление грамматических и пунктуационных ошибок;
  • объяснение значений фразеологизмов;
  • перевод терминов.

Разработка уже размещена на платформе Hugging Face и доступна всем пользователям.

«Tilqazyna» стала шагом к реализации инициатив Президента Касым-Жомарта Токаева, направленных на активное внедрение искусственного интеллекта и развитие цифровых технологий в Казахстане. Использование данной модели открывает перспективы для разработки множества IT-продуктов на казахском языке.

Для создания модели специалисты центра «Тіл-Қазына» проанализировали массивы данных:

  • 684 876 лексических единиц — для проверки слов;
  • 20 212 правильных и ошибочных вариантов словосочетаний — для улучшения системы анализа;
  • 5 558 текстов — для исправления пунктуации;
  • 3 000 текстов — для корректировки структуры;
  • 6 000 предложений — для создания функции сокращения;
  • 14 790 синонимических рядов — для функции перифраза.

Общий объем обработанного корпуса казахского языка составил 35 ГБ.

В 2025 году будет добавлена функция голосового общения и разработан удобный пользовательский интерфейс. Модель начнет обучать казахскому языку на уровнях A1, A2 и B1, а к 2026 году — на уровнях B2 и C1. Конечный продукт — голосовой помощник, способный разрабатывать индивидуальные программы обучения.

Приложение будет доступно для пользователей IOS и Android.

Читайте также:

Поделитесь:
Telegram
Подпишитесь на наш Telegram-канал и узнавайте новости первыми!