Разработка модели ИИ для распознавания тюркских языков в Казахстане: новый шаг к цифровым услугам на родных языках
Казахстанский стартап Cybernet AI сделал значительный шаг в области искусственного интеллекта, разработав крупнейшую модель автоматического распознавания речи (ASR) для тюркских языков. Эта инициатива является первой в Центральной Азии и представляет собой уникальный пример создания ИИ-модели, специально адаптированной к особенностям тюркской языковой группы, что отличает её от существующих англоязычных решений. Разработка осуществлена при поддержке Astana Hub и Министерства искусственного интеллекта и цифрового развития РК, с использованием GPU-инфраструктуры Microsoft.
Преимущества новой модели для бизнеса и государства
Создание модели открывает новые горизонты для стран тюркской языковой группы, позволяя им развивать цифровые сервисы и клиентское обслуживание на родных языках без ухудшения качества и при доступных затратах. Как отметил Танат Ускембаев, управляющий директор Astana Hub, это событие знаменует переход Казахстана от роли потребителя международных ИИ-решений к разработчику собственных технологий, которые могут быть конкурентоспособными на международной арене.
Модель Cybernet AI охватывает казахский, турецкий, узбекский, кыргызский, азербайджанский и татарский языки, а также эффективно распознаёт смешанную тюркско-русскую речь. Это особенно важно, поскольку в Казахстане и других странах Центральной Азии ранее использовались международные ASR-модели, которые не учитывали фонетические особенности тюркских языков, что ограничивало качество голосовых AI-сервисов.
Разработчики Cybernet AI сознательно отказались от адаптации существующих англоязычных моделей, создав ASR-модель, изначально понимающую живые, смешанные формы разговорного языка. Это новшество не только улучшает качество взаимодействия с клиентами, но и способствует формированию локальной экосистемы искусственного интеллекта, что имеет важное значение для технологического суверенитета Казахстана.
Новая ASR-модель ориентирована на бизнес-сектор, включая банки, телеком-операторов, контакт-центры и государственные структуры, что позволит значительно снизить расходы на поддержку клиентов и обеспечить круглосуточный доступ к сервисам. Модель устойчива к шумам и акцентам, демонстрируя высокую точность в различных сферах, от финтеха до государственных услуг. Cybernet AI активно развивает свои решения не только в Казахстане, но и в других странах, включая Узбекистан, Кыргызстан, США и страны Европы.