26.11.2024 14:07

Nvidia показала модель ИИ, которая может изменять голоса и генерировать новые звуки

Компания Nvidia (NVDA) продемонстрировала новую модель искусственного интеллекта для создания музыки и аудио, которая может изменять голоса и генерировать новые звуки, сообщает Reuters.

Новая технология ориентирована на производителей музыки, фильмов и видеоигр. Модель генерирует звуковые эффекты и музыку на основе текстового описания, включая новые звуки, например, заставляя трубу лаять, как собака.


От других технологий ИИ отличается способностью воспринимать и изменять звук. Например, нейросеть может строчку, сыгранную на фортепиано, преобразовать во фрагмент, исполненный человеческим голосом. Механизм может взять запись устной речи и изменить используемый акцент и выраженное настроение.

Новая модель Nvidia была обучена на данных из открытых источников. В компании заявили, что все еще обсуждают, стоит ли публиковать ее в открытом доступе.


По словам аналитика Freedom Finance Global Владимира Чернова, данная модель ИИ несёт в себе множество дополнительных рисков ее применения из-за возможного нарушения авторских прав или использования личных данных. Технология нуждается в чётком регулировании её использования, что займёт достаточно много времени на фоне эффекта низкой базы в законодательстве в отношении ИИ. 


В компании уже ведут консультации с представителями индустрии развлечений, но они будут отстаивать авторские права и стараться добиться запрета на использовании некоторых возможностей данной модели. Однако сам факт создания такой модели уже указывает на высокие перспективы развития отрасли, от чего Nvidia также является бенефициаром.