Нов изкуствен интелект на Microsoft преобразува текст в жива реч за 3 секунди

Технологии

Обновена 09:00ч., 17.01.2023

Снимка: Shutterstock

Технолозите на Microsoft разкриха една от най-новите си разработки. Това е модел с изкуствен интелект (AI), наречен VALL-E, който е предназначен да преобразува текст в жива реч. Това не е първият модел от този вид, но ако алгоритъмът Lyrebird 2017, разработен в университета в Монреал, се нуждаеше от цяла минута запис за анализ, то моделът VALL-E се нуждае само от три секунди. След това започва да имитира речта на конкретен човек, включително акустична окраска и емоционалност на тона.

VALL-E е програмиран на 60 000 часа записи на реч на английски, предимно аудиокниги, четени от различни хора. Това даде своя резултат, моделът възпроизвежда изречения, които звучат напълно естествено.

Единственият недостатък на модела е, че прекъсва звука, когато в изреченията се появят неясни места от гледна точка на синтаксиса или пунктуацията. Моделът VALL-E също е много добър в пресъздаването на аудиосредата на оригиналния образец. Ако този образец, например, е записана от телефон, тогава цялата следваща синтезирана реч ще бъде "като от телефон". Също така моделът е в състояние да възпроизвежда тънкостите на речта, подобни образци, записани от американец или британец, дават напълно различни резултати.

Също така, моделът VALL-E е в състояние да придаде на речта емоционален характер. Може да предостави няколко примера на реч, отбелязани като ядосана, сънлива, изненадана, отвратена и т.н. Колкото повече такива образци се предоставят, толкова по-емоционална и естествена става синтезираната реч.

Последствията от подобни технологии са доста ясни. Положителната страна е, че можете да получите списък за пазаруване, озвучен от известен актьор, докато сте в супермаркета, или телефонът ви ще рецитира аудиокнига с глас, който отговаря на нейното съдържание, или дори с няколко гласа.

Но от лошата страна нещата изглеждат по-зле. Представете си измамник, който получава мостра от вашия глас и след това се обажда на близките ви роднини. Освен това с помощта на тази технология е възможно да се заобиколят системите за гласова идентификация, а фалшифициран запис на речта на всеки известен политик може да причини съкрушителен крах на кариерата му. И в заключение, трябва да се отбележи, че всички ние наскоро видяхме, че системите за изкуствен интелект като DALL-E, ChatGPT и други deepfake- технологии започват да се преместват от лабораториите в реалния свят. И тези промени, както обикновено, носят в същото време много нови рискове.

Коментари

Няма въведени кометари.

Мениджър 06/2026

Нов изкуствен интелект на Microsoft преобразува текст в жива реч за 3 секунди

Свързани статии

Microsoft води преговори за инвестиция от 10 млрд. долара в компания за изкуствен интелект

Китай въвежда първите по рода си регулации на дийпфейк технологии

Свързани статии

Ключови думи

Коментари

НОВ КОМЕНТАР

ОЩЕ ОТ КАТЕГОРИЯТА

САЩ и Китай застанаха зад общо изявление за развитието на изкуствения интелект

ЕС глобява Google с 890 млн. евро

Digital age: Невидими дронове, управление на роботи със силата на мисълта и потапящи се къщи

Технополис стартира предварителните поръчки на новите сгъваеми смартфони Samsung Galaxy Z и смарт часовници Galaxy Watch

От кариерни контакти до първа среща: LinkedIn се превръща в неочаквана платформа за запознанства

Китай изстрелва снаряд за унищожение на астероиди, които заплашват Земята

А1 предлага ново решение за наблюдение и сигурност на дома

Джейми Даймън: Дебатът за достъпа до AI модела Mythos предупредителен знак за бъдещето на изкуствения интелект

Зеленски одобри план за удари на далечно разстояние в Русия

Звездите за бизнеса от 27 юли до 2 август: Ускорение в професионалния ритъм

Липсващият фактор на въздействащия маркетинг

Цитат на деня

На днешната дата, 27 юли. Имен ден празнуват Добрин, Добри и Панталей

30 евро струва пренасянето на багаж с кон в последната 10-километрова отсечка до Седемте рилски езера

Прогноза: При лош сценарий на конфликта в Персийския залив бензинът у нас може да надхвърли 2 евро за литър

Ридли Скот екранизира легендарния роман „Островът на съкровищата“ с Хю Джакман в ролята на пирата Джон Силвър

Връх Олимп и плажовете от десанта в Нормандия влязоха в Списъка на световното наследство на ЮНЕСКО

Българските газови резерви: Между мита и реалността

Над 1500 са глобите за тротинетки и АТВ в Бургас до момента

Москва пое управлението на руските активи на енергийните гиганти Uniper и Fortum

21-годишен ислямист е заподозрян за снощния атентат в Берлин, станал под носа на над 2000 полицаи

LinkedIn и краят на илюзията за “професионална” социална мрежа

Филмът „Подслон” на Драгомир Шолев с престижна награда от фестивала в Одеса (трейлър)

Глад за готови апартаменти в Пловдив на фона на прогнози за нов скок на имотните цени под тепетата

Българските газови резерви: Между мита и реалността

ADVERTORIAL

Две престижни международни отличия за успешния преход на България към плащания в евро

Технополис стартира предварителните поръчки на новите сгъваеми смартфони Samsung Galaxy Z и смарт часовници Galaxy Watch

Постигаме повече заедно: cargo-partner и Nippon Express напредват с интеграцията в Словакия, Полша и Австрия

3-ти годишен форум за транспорт, логистика и спедиция

Национален конкурс Technovators League

Елза Хоск гушна второ дете

Таралеж в сърцето

Защо черните вдовици са хапали необичайно често мъже — и то по пениса?

Виц: Във врачански ресторант

Modernity Yellow Party: Sunset & Chill

Калпазанска есен 2026

Елза Хоск гушна второ дете

Таралеж в сърцето

Защо черните вдовици са хапали необичайно често мъже — и то по пениса?

Виц: Във врачански ресторант