I
Ivan
17 мая 2024 г.
Дуо сегодня злой)
Ответов: 12
🇦
🇦🇷
Это все петроградный меркурий
I
Ivan
🇦🇷
Это все петроградный меркурий
А я думал с этой новостью связано:
Акции Duolingo рухнули на фоне презентации GPT-4o, которая может свободно говорить на любом языке.
D
don
Ivan
А я думал с этой новостью связано: Акции Duolingo рухнули на фоне презентации GPT-4o, которая может…
я на прошлых выходных длинных сделал себе приложение, которое может на лету переводить речь и озвучивать моим же голосом (на бэкэнде пайплайн из нейросетей). И тут выходит новая гпт и я такой — блэт 😄
G
G1276
don
я на прошлых выходных длинных сделал себе приложение, которое может на лету переводить речь и озвуч…
Поэтому я и не берусь что-то делать с нейросетями, они очень быстро развиваются, тут нужны миллиардные вложения чтобы выйти на долгосрочную прибыль.
D
don
G1276
Поэтому я и не берусь что-то делать с нейросетями, они очень быстро развиваются, тут нужны миллиард…
У меня прост работа напрямую с ними связана (работаю в одной крупной желтой ит компании по этому направлению), и я такой: А че бы и нет? =)
G
G1276
don
У меня прост работа напрямую с ними связана (работаю в одной крупной желтой ит компании по этому на…
А ну если развлечься, то можно.
У меня была идея программки для анонимизации голоса и лица, чтобы люди могли свободно разговаривать на видеоконференции или записывать разные шорты или видео, если до сих пор стесняются.
D
don
Ivan
Что используете, если не секрет ?
Python, PyTorch, математика, публичные датасеты =)
из распознавания лучшее это Whisper (он кстати от openai, но его код доступен в паблике), для синтезирования много моделек, но мне качество не понравилось, я свою обучал. Перевод тоже элементарно обучается, но я взял готовую модель от Helsinki. По факту синтезирование речи только сам допиливал на торче
I
Ivan
G1276
А ну если развлечься, то можно. У меня была идея программки для анонимизации голоса и лица, чтобы …
Уже существует DeepFaceLive, но там для каждого лица нужно обучать заново, для чего нужна мощная видюха как минимум, для голоса есть RVC и другие похожие проекты
G
G1276
Ivan
Уже существует DeepFaceLive, но там для каждого лица нужно обучать заново, для чего нужна мощная ви…
Да как раз таки идея в том чтобы люди могли использовать на любых устройствах, просто пользуясь выбором нужного видео и аудио потока. Думаю реалистичность в таких вещах не сильно важна, главное отразить эмоции на лице и в голосе.
 

Похожие вопросы 🇦🇷