Amazon жаңа дыбыстық жасанды интеллект моделін таныстырды: Nova Sonic

Amazon компаниясы жасанды интеллект саласындағы тағы бір жаңа шешімін жариялады. Бұл жолы дыбыстық технологиялар бағытына ерекше назар аударылып отыр. Компания Nova Sonic деп аталатын жаңа дыбыстық ЖИ моделін таныстырды.
Бұл модель — адамның даусын барынша табиғи түрде имитациялайтын, эмоция мен интонацияны жеткізе алатын интеллектуалды жүйе.
Nova Sonic жүйесінің ерекшеліктері
Nova Sonic — мәтінді шынайы дауысқа айналдыратын жасанды интеллект платформасы. Оның басты артықшылықтары:
1. Табиғи дауыс:
Дауыстың ритмі, екпіні, эмоциясы — бәрі тірі адам секілді естіледі. Кәдімгі синтезделген робот дауысына мүлдем ұқсамайды.
2. Көп тілді қолдау:
Nova Sonic бірнеше тілді еркін меңгеріп, әр тілдің ерекшелігін ескеріп оқи алады.
3. Дауыс көшірмелеу:
Пайдаланушы өз дауысын жазып, сол дауыс үлгісінде мәтінді оқыттыра алады. Бұл подкастинг, дубляж, контент жасаушылар үшін өте пайдалы.
4. Интонация мен эмоция беру:
Қуану, таңдану, ренжу, сұрақ қою, жарнама стилінде сөйлеу — барлығы модельдің басқаруында.
Amazon-ның стратегиялық жоспары
Nova Sonic моделі алдымен AWS (Amazon Web Services) платформасы арқылы бизнеске ұсынылмақ. Яғни компаниялар өз өнімдерінің жарнамасын, аудиокітап, подкаст, дыбыстық көмекші контенттерін осы жүйе арқылы жасай алады.
Сонымен қатар жеке қолданушылар үшін де арнайы сервистер әзірленуі мүмкін. Мысалы, Alexa дауыс көмекшісінің мүмкіндіктері айтарлықтай артады.
ЖИ дыбыстық технологиядағы бәсекелестік
Дыбыстық жасанды интеллект саласында қазір бірнеше ірі компания жұмыс істеп жатыр:
- ElevenLabs — дауысты клондау және аудио генерация саласында танымал стартап.
- Google — Text-to-Speech және Project Euphonia жобалары арқылы дамып келеді.
- Microsoft — Azure AI арқылы аудиожасау сервистерін ұсынып отыр.
Amazon-ның Nova Sonic моделі — осы бәсекелестікке қосылған маңызды ойыншы.
Nova Sonic — Amazon компаниясының дыбыстық жасанды интеллект бағытындағы келесі үлкен қадамы. Табиғи дауыс, эмоция және көптілді қолдау — болашақтағы контент жасаушылар мен бизнес үшін таптырмас құрал болмақ. Енді тек мәтінмен ғана емес, дауыс арқылы да сапалы контент жасау жеңіл әрі қолжетімді бола түспек.
Аршат Ораз
