OpenAI пусна сайт за преобразуване на реч в текст и обратно

Разработчикът на ChatGPT OpenAI представи гласови модели от следващо поколение за преобразуване на текст в реч и обратно. Компанията твърди, че тези модели се основават на „усъвършенствани алгоритми за машинно обучение“, съобщава Tech Crunch.
Системата позволява не само конвертиране на текст в реч, но и персонализиране на самия глас, както и на неговия звуков стил, тембър и емоционалност. Например, можете да накарате модела да говори „като пират“ или като разказвач на детски приказки. Налични са предварително зададени настройки, но е възможно и ръчно въвеждане на инструкции.
Освен това OpenAI е подобрила технологията си за разпознаване на реч. Новите модели gpt-4o-transcribe и gpt-4o-mini-transcribe правят по-малко грешки при преобразуването на реч в текст, дори при трудни условия като силни акценти, шумна среда и различни скорости на речта.
Разработката е насочена към подобряване на интуитивността на взаимодействието с изкуствен интелект, което го прави по-интуитивно и по-близко до реалното общуване. Актуализираните гласови модели могат лесно да бъдат интегрирани в различни приложения и услуги.
Новите модели вече са достъпни за разработчиците чрез API, а също така има възможност да се тестват на специален уебсайт за всички.
ОЩЕ ОТ КАТЕГОРИЯТА
|
|
Коментари
Няма въведени кометари.