Дуо сегодня злой)

Ivan

17 мая 2024 г.

Дуо сегодня злой)

Ответов: 12

🇦🇷 Аргентина форум

🇦

🇦🇷

Это все петроградный меркурий

Ivan

🇦🇷

Это все петроградный меркурий

А я думал с этой новостью связано:
Акции Duolingo рухнули на фоне презентации GPT-4o, которая может свободно говорить на любом языке.

don

Ivan

А я думал с этой новостью связано: Акции Duolingo рухнули на фоне презентации GPT-4o, которая может…

я на прошлых выходных длинных сделал себе приложение, которое может на лету переводить речь и озвучивать моим же голосом (на бэкэнде пайплайн из нейросетей). И тут выходит новая гпт и я такой — блэт 😄

Steax

don

я на прошлых выходных длинных сделал себе приложение, которое может на лету переводить речь и озвуч…

Так жпт и раньше так мог, просто голос надо было прикручивать)

G1276

don

я на прошлых выходных длинных сделал себе приложение, которое может на лету переводить речь и озвуч…

Поэтому я и не берусь что-то делать с нейросетями, они очень быстро развиваются, тут нужны миллиардные вложения чтобы выйти на долгосрочную прибыль.

don

G1276

Поэтому я и не берусь что-то делать с нейросетями, они очень быстро развиваются, тут нужны миллиард…

У меня прост работа напрямую с ними связана (работаю в одной крупной желтой ит компании по этому направлению), и я такой: А че бы и нет? =)

Ivan

don

я на прошлых выходных длинных сделал себе приложение, которое может на лету переводить речь и озвуч…

Что используете, если не секрет ?

G1276

don

У меня прост работа напрямую с ними связана (работаю в одной крупной желтой ит компании по этому на…

А ну если развлечься, то можно.
У меня была идея программки для анонимизации голоса и лица, чтобы люди могли свободно разговаривать на видеоконференции или записывать разные шорты или видео, если до сих пор стесняются.

don

Ivan

Что используете, если не секрет ?

Python, PyTorch, математика, публичные датасеты =)
из распознавания лучшее это Whisper (он кстати от openai, но его код доступен в паблике), для синтезирования много моделек, но мне качество не понравилось, я свою обучал. Перевод тоже элементарно обучается, но я взял готовую модель от Helsinki. По факту синтезирование речи только сам допиливал на торче

don

Python, PyTorch, математика, публичные датасеты =) из распознавания лучшее это Whisper (он кстати о…

ну и 4 карты 4090, что немаловажно

Ivan

G1276

А ну если развлечься, то можно. У меня была идея программки для анонимизации голоса и лица, чтобы …

Уже существует DeepFaceLive, но там для каждого лица нужно обучать заново, для чего нужна мощная видюха как минимум, для голоса есть RVC и другие похожие проекты

G1276

Ivan

Уже существует DeepFaceLive, но там для каждого лица нужно обучать заново, для чего нужна мощная ви…

Да как раз таки идея в том чтобы люди могли использовать на любых устройствах, просто пользуясь выбором нужного видео и аудио потока. Думаю реалистичность в таких вещах не сильно важна, главное отразить эмоции на лице и в голосе.

Похожие вопросы 🇦🇷