Нов изкуствен интелект на Microsoft преобразува текст в жива реч за 3 секунди

Технологии

Обновена 09:00ч., 17.01.2023

Снимка: Shutterstock

Технолозите на Microsoft разкриха една от най-новите си разработки. Това е модел с изкуствен интелект (AI), наречен VALL-E, който е предназначен да преобразува текст в жива реч. Това не е първият модел от този вид, но ако алгоритъмът Lyrebird 2017, разработен в университета в Монреал, се нуждаеше от цяла минута запис за анализ, то моделът VALL-E се нуждае само от три секунди. След това започва да имитира речта на конкретен човек, включително акустична окраска и емоционалност на тона.

VALL-E е програмиран на 60 000 часа записи на реч на английски, предимно аудиокниги, четени от различни хора. Това даде своя резултат, моделът възпроизвежда изречения, които звучат напълно естествено.

Единственият недостатък на модела е, че прекъсва звука, когато в изреченията се появят неясни места от гледна точка на синтаксиса или пунктуацията. Моделът VALL-E също е много добър в пресъздаването на аудиосредата на оригиналния образец. Ако този образец, например, е записана от телефон, тогава цялата следваща синтезирана реч ще бъде "като от телефон". Също така моделът е в състояние да възпроизвежда тънкостите на речта, подобни образци, записани от американец или британец, дават напълно различни резултати.

Също така, моделът VALL-E е в състояние да придаде на речта емоционален характер. Може да предостави няколко примера на реч, отбелязани като ядосана, сънлива, изненадана, отвратена и т.н. Колкото повече такива образци се предоставят, толкова по-емоционална и естествена става синтезираната реч.

Последствията от подобни технологии са доста ясни. Положителната страна е, че можете да получите списък за пазаруване, озвучен от известен актьор, докато сте в супермаркета, или телефонът ви ще рецитира аудиокнига с глас, който отговаря на нейното съдържание, или дори с няколко гласа.

Но от лошата страна нещата изглеждат по-зле. Представете си измамник, който получава мостра от вашия глас и след това се обажда на близките ви роднини. Освен това с помощта на тази технология е възможно да се заобиколят системите за гласова идентификация, а фалшифициран запис на речта на всеки известен политик може да причини съкрушителен крах на кариерата му. И в заключение, трябва да се отбележи, че всички ние наскоро видяхме, че системите за изкуствен интелект като DALL-E, ChatGPT и други deepfake- технологии започват да се преместват от лабораториите в реалния свят. И тези промени, както обикновено, носят в същото време много нови рискове.

Коментари

Няма въведени кометари.

Мениджър 05/2026

Нов изкуствен интелект на Microsoft преобразува текст в жива реч за 3 секунди

Свързани статии

Microsoft води преговори за инвестиция от 10 млрд. долара в компания за изкуствен интелект

Китай въвежда първите по рода си регулации на дийпфейк технологии

Свързани статии

Ключови думи

Коментари

ОЩЕ ОТ КАТЕГОРИЯТА

Масайоши Сон: AI революцията 50 пъти по-голяма от бума на дотком компаниите

Technovators leaguе: Национален конкурс за технологично лидерство на списание „Мениджър“

Meta върви към сблъсък с ЕС заради инструмент, който ще проследява кликванията с мишка от служителите

Регистрация и ред: Хуманоидните роботи в Китай ще получават „цифрови лични карти“

Ракетата New Glenn на Blue Origin експлодира на стартовата площадка

Пентагонът сключи сделка с Microsoft за 9,7 млрд. долара в опит да намали ИТ разходите

Digital age: Техно пробиви и открития

Nvidia ще инвестира 150 милиарда долара годишно в „епицентъра на AI революцията“

Лъже ли ви вашият колега?

Цитат на деня

На днешната дата, 2 юни. Ден на Христо Ботев и на загиналите за свободата и независимостта на България

Макрон: Франция задържа руски танкер със съдействието на Великобритания

Премиерът изиска бърза реакция при бедствия от областните управители

Всички микрорайони на „Люлин“ ще бъдат без топла вода за една седмица

Лъже ли ви вашият колега?

На днешната дата, 2 юни. Ден на Христо Ботев и на загиналите за свободата и независимостта на България

Цитат на деня

10 психологически трика, които ще подобрят живота ви

Премиерът: 20 години са съсипвали пристанищата ни

7 страхотни трика за мотивация

Внимание! Бум на фалшиви обяви за продажби на автомобили

ADVERTORIAL

Рефинансиране: Как да намалим месечната си вноска стъпка по стъпка

д-р Росица Кръстева: Международният обмен и мултидисциплинарният подход променят съвременната онкология

AI и софтуерни решения за FMCG сектора бяха във фокуса на годишния семинар на Баркод Системи България

3-ти годишен форум за транспорт, логистика и спедиция

Национален конкурс Technovators League

Игри за деца от цял свят

Въпреки гените: Защо децата не приличат на родителите

Виц: Двама старци обсъждат старостта

2 юни - Ден на Христо Ботев и на загиналите за свободата и независимостта на България

5-а годишна конференция за строителство и инвестиции

Modernity Yellow Party: Sunset & Chill

Игри за деца от цял свят

Въпреки гените: Защо децата не приличат на родителите

Виц: Двама старци обсъждат старостта

2 юни - Ден на Христо Ботев и на загиналите за свободата и независимостта на България