VK voice
Так и хочется кричать: «Ура, свершилось!». Разработчики голосовых сообщений решили почистить себе карму и сделали нейросеть, способную расшифровывать огромные массивы звука.
Функцию распознавания «голосовух» уже тестирует часть пользователей. В ближайшие дни такая возможность появится у всех владельцев Вконтакте. Нейросеть способна перевести в текст голосовое сообщение до 30 секунд, что составляет 90% всех записей при общении вк.
Приятным бонусом станет пунктуация. Нейросеть учится правильно расставлять запятые и точки по субтитрам к фильмам и русской классике. Разработчики сообщают, что этот механизм изучил более миллиона строк, чтобы правильно расставлять запятые в нужных местах.
– Чтобы расшифровка была максимально точной, наша команда исследований разработала особую технологию — она подходит именно для ВКонтакте, потому что учитывает и высокие нагрузки, и сленг, и шумную обстановку, – заверяют разработчики.
Tone of voice // Что такое tone of voice // Голос бренда
Пока распознавание голосовых сообщений тестируется на приложении VK, но вскоре полезная функция появится и в компьютерной версии.
Источник: t-31.ru
ВКонтакте запустила технологию распознавания аудиосообщений
12 : 39 , 9 июня 2020 г.
Распознавание голосовых сообщений полностью автоматизировано и проводится при помощи методов искусственного интеллекта . Сотрудники ВКонтакте и любые другие сторонние лица не обладают доступом к личным сообщениям пользователей. Голосовые — не исключение. Чтобы собрать данные для обучения, участники программы VK Testers записывали специально подготовленные фразы. Также качество распознавания оценивалось с помощью обратной связи от тестировщиков.
ВКонтакте начала тестировать функцию распознавания голосовых сообщений в марте. Ранее VK представила нейросеть , генерирующую новостные заголовки, внедрила модели машинного обучения в модерацию контента и определение тематики публикаций, а также открыла в МФТИ собственную лабораторию искусственного интеллекта .
Подпишитесь на The GEEK в Telegram
Источник: news.myseldon.com
VK открыла доступ к распознаванию речи сторонним разработчикам Теперь они могут переводить речь в голос
К ак сообщает пресс-служба VK, технический директор «ВКонтакте» Александр Тоболь на конференции Saint HighLoad++ рассказал, что разработчики отныне могут бесплатно использовать в своих проектах фирменную технологию, считывающую голос и переводящую его в текст. Им доступны две модели: нейтральная подходит для распознавания четкой и разборчивой речи, которая фигурирует в интервью или телешоу.
Kill Eva & ENCASSATOR — Psycho Dreams (Sped Up)
Спонтанная модель предназначена для обычной речи, содержащей много сленговых выражений, сокращений и ненормативной лексики. Функцию распознавания речи можно подключить через веб-интерфейс или использовать ее при помощи публичного API. На информационной странице компания подготовила подробные инструкции по интеграции технологии.
Распознавание речи можно использовать как для разработки мини-приложений «ВКонтакте», так и для сторонних сервисов. Если проект обрабатывает до 100 минут аудио в сутки, то эту функцию можно применять для любых целей. Для безлимитного использования необходимо отправить заявку на электронную почту.
«Яндекс» тем временем научил распознавать нейросеть 10 языков одновременно:
«Яндекс» научил нейросеть распознавать 10 языков одновременно Она понимает речь в любых форматах
При помощи новой нейросети компаниям будет проще создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл-центров с большим потоком клиентов
Источник: digitalocean.ru