Хочу рассказать о такой удивительной технологии как Tts и, возможно, неожиданном её применении для озвучки субтитров на YouTube с использованием JavaScript. Реализовано в виде расширения для браузера Chrome (для Yandex и Atom тоже подойдет).
Изучая новое, или когда просто смотрим YouTube, иногда попадаются ролики, очень важные, но на другом языке, с одной стороны можно включить субтитры, выбрав перевод на родной язык, но бывает, сложно одновременно читать и смотреть на то, что происходит на мониторе.
В целом, технология Text-to-Speech достаточно известна, много чего на ней написано, распознавание речи и все такое. Большое внимание заострять не буду, вы и сами почитаете, если будет нужно. Для JavaScript почитать можно тут Web Speech API, послушать здесь Speech synthesiser.
Скажу только, что у Google есть множество разных голосов, но почти все они часть платного API, а базовый функционал, браузерного синтезатора речи, предоставляет по 1 голосу на язык (для английского доступно 3 голоса: en-US, en-GB Male, en-GB Female).
Как правильно сделать озвучку для видео?
Microsoft предоставляет 2 голоса на язык, в рамках языковых пакетов для Windows (10). Новые голоса добавляются в «Параметры->Время и язык->Распознавание голоса». Может у них есть и больше голосов, но установив все доступные мне языковые пакеты, получилось так:
Список доступных голосов win 10
Доступные голоса для Windows 10 Chrome
Code
Microsoft
Microsoft Hoda — Arabic (Egypt)
Microsoft Naayf — Arabic (Saudi)
Microsoft Ivan — Bulgarian (Bulgaria)
Microsoft Herena — Catalan (Catalan)
Microsoft Jakub — Czech (Czech Republic)
Microsoft Helle — Danish (Denmark)
Microsoft Michael — German (Austria)
Microsoft Karsten — German (Switzerland)
Microsoft Hedda — German (Germany)
Microsoft Katja — German (Germany)
Microsoft Stefan — German (Germany)
Microsoft Stefanos — Greek (Greece)
Microsoft Catherine — English (Australia)
Microsoft James — English (Australia)
Microsoft Linda — English (Canada)
Microsoft Richard — English (Canada)
Microsoft George — English (United Kingdom)
Microsoft Hazel — English (United Kingdom)
Microsoft Susan — English (United Kingdom)
Google UK English Female
Google UK English Male
Microsoft Sean — English (Ireland)
Microsoft Heera — English (India)
Microsoft Ravi — English (India)
Microsoft David — English (United States)
Microsoft Mark — English (United States)
Microsoft Zira — English (United States)
Google US English
Microsoft Helena — Spanish (Spain)
Microsoft Laura — Spanish (Spain)
Microsoft Pablo — Spanish (Spain)
Microsoft Raul — Spanish (Mexico)
Microsoft Sabina — Spanish (Mexico)
Google español de Estados Unidos
Microsoft Heidi — Finnish (Finland)
Microsoft Caroline — French (Canada)
Microsoft Claude — French (Canada)
Microsoft Nathalie — French (Canada)
Microsoft Guillaume — French (Switzerland)
Microsoft Hortense — French (France)
Microsoft Julie — French (France)
Microsoft Paul — French (France)
Microsoft Hemant — Hindi (India)
Microsoft Kalpana — Hindi (India)
Microsoft Matej — Croatian (Croatia)
Microsoft Szabolcs — Hungarian (Hungary)
Microsoft Andika — Indonesian (Indonesia)
Google Bahasa Indonesia
Microsoft Cosimo — Italian (Italy)
Microsoft Elsa — Italian (Italy)
Microsoft Ayumi — Japanese (Japan)
Microsoft Haruka — Japanese (Japan)
Microsoft Ichiro — Japanese (Japan)
Microsoft Sayaka — Japanese (Japan)
Microsoft Heami — Korean (Korean)
Microsoft Rizwan — Malay (Malaysia)
Microsoft Jon — Norwegian (Bokmål)
Microsoft Bart — Dutch (Belgium)
Microsoft Frank — Dutch (Netherlands)
Microsoft Adam — Polish (Poland)
Microsoft Paulina — Polish (Poland)
Microsoft Daniel — Portuguese (Brazil)
Microsoft Maria — Portuguese (Brazil)
Google português do Brasil
Microsoft Helia — Portuguese (Portugal)
Microsoft Andrei — Romanian (Romania)
Microsoft Irina — Russian (Russia)
Microsoft Pavel — Russian (Russia)
Microsoft Filip — Slovak (Slovakia)
Microsoft Lado — Slovenian (Slovenia)
Microsoft Bengt — Swedish
Microsoft Valluvar — Tamil (India)
Microsoft Pattara — Thai (Thailand)
Microsoft An — Vietnamese (Vietnam)
Microsoft Huihui — Chinese (Simplified, PRC)
Microsoft Kangkang — Chinese (Simplified, PRC)
Microsoft Yaoyao — Chinese (Simplified, PRC)
Microsoft Danny — Chinese (Traditional, Hong Kong S.A.R.)
Microsoft Tracy — Chinese (Traditional, Hong Kong S.A.R.)
Microsoft Hanhan — Chinese (Traditional, Taiwan)
Microsoft Yating — Chinese (Traditional, Taiwan)
Microsoft Zhiwei — Chinese (Traditional, Taiwan)
Работает оно в Chromium браузерах (Chrome, Яндекс, Atom )
YouTube
Попробовав несколько таких же расширений, а их в магазине Chrome, штук 5 точно есть, решил написать еще одно, мне показалось, что функционала в них недостаточно и хотелось немного исправить положение дел.
Забегая вперед, хочу сказать, что, одна из ключевых проблем, связанных с озвучиванием субтитров на YouTube, заключается в том, что, технология на данный момент реализована не полностью, и нет возможности задать время произношения текста.
Т.е. можно регулировать скорость произношения (быстро, медленно, нормально), но указать время для указанного текста (12 слов за 2 секунды) через API, пока что нет возможности. Там есть определенный формат SSML, но он еще не поддерживался, когда я его тестировал (лето 2021).
В конце концов, решить проблему кое как удалось, но не очень оптимально.
SpeechSynthesis API
Как все мы знаем, за синтез речи в браузере Chrome отвечает SpeechSynthesis.
В целом, все, достаточно просто, и на этом можно создавать функционал, позволяющий общаться с посетителями презентаций, выставок, сайтов, программ и т.д.
для более точного контроля за синтезатором речи, предусмотрены различные методы, слушатели и параметры. Например, событие «boundary» — Активируется, когда произносимый текст достигает границы слова или предложения.
Один из нюансов, связанных с голосами, таков, что у голосов от Google есть ограничение на время произношения, примерно 1-2 минуты, после чего синтезатор замолкает. Продолжить речь можно через паузу, программно нажать и тут же снять с паузы window.speechSynthesis.pause(); window.speechSynthesis.resume(); и речь продолжится. Но если есть очередь воспроизведения. Может быть так только в бесплатном API, платный проверить не доводилось.
У Microsoft таких ограничений нет. Чтобы проверить ограничения на максимальную длину текста и время работы для синтезатора речи, с голосом от Microsoft, как-то почти 2 часа сидел и слушал какой-то рыба-текст, продублированный для увеличения длины. надоело, выключил. Около 100.000 символов и больше 100 минут времени. Теоретически можно сказки или книги на ночь читать.
YouTube API
На Google API присутствует весь функционал, связанный с субтитрами, но он платный. Так что вариантов для бесплатного, остается всего 2: парсить страницу с видеороликом либо «брутфорсить» API плеера на youtube.
первый вариант с парсингом, выглядит так
и второй, примерно, так
Но, тем не менее, все более-менее доступно и досягаемо.
Получив таким образом url субтитров, и узнав в процессе много нового, о самом плеере и youtube в частности, можно уже построить какой-либо функционал с применением SpeechSynthesis API и YouTube API
Расширение
Так, примерно, и создавалось расширение для браузера, которое я назвал, после нескольких переименований
Translate and Speak Subtitles for YouTube™
иконка Ева из Валл-и
В качестве завершения
Не буду слишком вдаваться в подробности, как там и что, скучные подробности и все такое. Может быть позже.
Тем не менее, выровнять скорость произношения субтитров мне удалось лишь прокрутив все голоса по таймеру, определив скорость произношения 1 буквы. Заполнив ручками таблицу со скоростями, удалось кое как «отгадывать» нужную скорость произношения субтитров, чтобы голос не отставал от видео.
Часть API плеера на YouTube
А чтобы не сильно быстро и не сильно медленно, примерное ограничение по скорости, для русской озвучки от 1.1 до 1.6.
Не всегда помогает, бывает, что нужно скорость воспроизведения видео сделать 0.75 или 0.5 чтобы успеть за видео. Особенно в английском, если автор ролика быстро говорит, у них слова короткие, на русском нужно еще быстрее говорить, но выше 2х скорости, слова́ почти не разобрать.
Итого
Всем спасибо, что прочитали статью.
Источник: h.amazingsoftworks.com
Как дополнить видео закадровым голосом
Хотите включить в видеоролик реалистичное закадровое повествование? Отличная идея, ведь с хорошей озвучкой проще и интереснее смотреть любое видео, будь то публикация в соцсети, нарезка из лучших моментов игры, корпоративный ролик, урок или презентация.
Не хотите записывать собственный голос? Не проблема! Создайте бесплатную озвучку с помощью генератора речи Clipchamp на базе искусственного интеллекта (ИИ)! Мы предлагаем широкий выбор голосов с разными акцентами и поддерживаем целый ряд языков.
Что такое закадровый голос?
Закадровый голос — это прием видеопроизводства, с помощью которого преподаватели, компании и создатели контента могут передать зрителю информацию, не появляясь в кадре. Обычно для этого автор зачитывает заранее заготовленный текст, а затем добавляет запись к видеоролику — с прохождением игры, обучающим материалом, виртуальным уроком и так далее.
Что такое система преобразования текста в речь?
Если вы не горите желанием записывать собственный голос или просто хотите сэкономить себе время, создайте озвучку с помощью синтезатора речи. Например, система преобразования текста в речь от Clipchamp позволяет создавать закадровый голос с применением технологии искусственного интеллекта. К вашим услугам уникальная коллекция из более чем 170 голосов с разными акцентами, возрастными характеристиками и тональностями. Кроме того, функция озвучки поддерживает свыше 70 языков мира. Просто введите текст, выберите голос и задайте скорость повествования.
Как пользоваться нашим бесплатным генератором речи
Чтобы бесплатно озвучить ролик, первым делом нужно запустить онлайн-видеоредактор Clipchamp.
Шаг 1. Откройте вкладку «Запись и создание»
Откройте раздел «Запись и создание» на боковой панели слева. Перед вами появится всплывающая вкладка. Выберите пункт «Преобразование текста в речь».
Шаг 2. Выберите язык, голос и скорость речи
Введите текст в соответствующее поле и выберите нужный вам язык: испанский, итальянский, японский, корейский, греческий, хинди, арабский, немецкий, французский, и это далеко не весь перечень. Выберите голос из коллекции образцов разных возрастов, полов, произношений и тональности. Кроме того, с помощью ползунка скорости можно отрегулировать темп речи, который может быть медленным, средним и высоким.
Нажмите кнопку «Проиграть», чтобы послушать, как синтезатор речи справился с работой. Если всё в порядке, нажмите кнопку «В медиатеку», чтобы вернуться в видеоредактор.
Запись с повествованием появится во вкладке «Ваши медиаресурсы». Просто перетащите ИИ-озвучку на шкалу времени под видеоклипом.
Примеры применения генератора речи на базе ИИ
1. Для создателей контента
Синтезированный закадровый голос поможет привлечь внимание аудитории и подчеркнуть забавные моменты. С ним также проще следить за сюжетом ролика и считывать текст с экрана. Искусственный голос отлично впишется даже в блог, где его можно наложить поверх видеоряда в качестве источника дополнительной информации и пояснений.
2. Для бизнеса
Работа с генератором речи — один из лучших способов быстро подготовить ролик, который легко усвоит большинство сотрудников или клиентов. Искусственный голос поможет выдержать рабочие ролики в одном стиле, вдохнуть новую жизнь в видеоряд по корпоративной культуре или добавить профессионального лоска обучающему видео или записи с экрана.
3. Для электронного обучения
Профессиональные презентации, увлекательная подача материала и четкий план урока — всего этого можно добиться с помощью нашей программы голосового сопровождения.
Советы по написанию текста для озвучки
Правильно расставленные знаки препинания подскажут нашему генератору речи, где сделать многозначительную паузу. Что еще важно знать:
- Точка сигнализирует о необходимости паузы средней длины.
- Запятые добавляют в генерированную речь короткие паузы.
- Многоточие («…») добавит длинную паузу.
- Вопросительный знак влияет на интонацию.
- Восклицательные знаки не влияют на воспроизведение текста.
- Написание текста одними заглавными буквами также не влияет на воспроизведение.
Распространенные вопросы
Какие языки поддерживает генератор речи в Clipchamp?
Английский, арабский, болгарский, валлийский, венгерский, вьетнамский, голландский, греческий, гуджарати, датский, иврит, индонезийский, ирландский, испанский, итальянский, каталанский, китайский, корейский, латышский, литовский, малайский, мальтийский, маратхи, немецкий, норвежский (букмол), польский, португальский, румынский, русский, словацкий, словенский, суахили, тамильский, турецкий, украинский, урду, финский, французский, хинди, хорватский, чешский, шведский, эстонский и японский.
Что делать, если генератор речи неправильно произносит слова?
Если генератор речи неправильно произносит слово, попробуйте написать его с ошибкой (как оно звучит, а не как пишется по правилам). Если возникли проблемы с числительными, запишите их словами, например, вместо «2022 год» — «две тысячи двадцать второй год».
Можно ли к ролику с закадровым голосом также добавить субтитры?
Да. Добавлять субтитры к видеороликам с закадровым голосом не просто можно, но и нужно: это повысит удобство просмотра и расширит аудиторию ролика.
От печатного текста — к реалистичному закадровому повествованию
В бесплатном онлайн-редакторе видео Clipchamp можно озвучить ролик любого жанра и даже трек для TikTok.
Источник: clipchamp.com
Как сделать озвучку самостоятельно? И где заказать дикторскую запись голоса для видео?
После того как вы определились с сюжетом и подготовили текст для вашего будущего видеоролика из фото и видео, необходимо сделать его озвучку.
Вы можете сделать озвучку самостоятельно или же заказать профессиональную дикторскую запись голоса для видео. Выбор за вами.
Давайте сначала я покажу вам где можно заказать дикторскую запись голоса для вашего видеоролика, а потом разберем как сделать озвучку самостоятельно.
Где заказать дикторскую запись голоса для видео?
Есть такой замечательный ресурс, который называется kwork.ru и на котором можно заказать различные фриланс-услуги по фиксированной цене в 500 руб. Я несколько раз пользовался им, когда заказывал заставки для своих роликов и остался очень доволен выполненной работой. В интернете начали появляться клоны этого ресурса, поэтому чтобы не попасть на мошенников, воспользуйтесь ссылкой выше.
Перейдите на данный сервис и зарегистрируйтесь на нем.
В верхнем меню зайдите в раздел «Аудио и Видео» и там выберите пункт «Аудиозапись и Озвучка». У вас откроются кворки с предложением данной услуги.
Условия работы у всех разные. Кто-то берет 500 руб за 1 минуту, кто-то и за 5 минут. Поэтому читайте внимательно все что написано в кворке.
Вы можете сразу же прослушать голос диктора и понять подходит он для вас или нет. Чтобы узнать на сколько минут вытянет ваш текст свяжитесь с диктором и скиньте ему файл чтобы он уже мог определить время. Темп начитки желательно выбирать бодрый и выразительный, чтобы ваш будущий зритель не заскучал.
После того как вы определитесь с диктором и стоимостью услуги, можете пополнить баланс и сделать заказ.
Ну а когда ваш заказ будет выполнен, диктор пришлет вам кусочек озвученного им текста на проверку. Если вас все устроит, то вы подтверждаете оплату и получаете аудиофайл с озвученным текстом, который уже сможете использовать для своего будущего ролика.
Как сделать озвучку самостоятельно?
Теперь давайте разберем как сделать самостоятельную озвучку текста для видеоролика.
Самое важное для самостоятельной начитки это хороший микрофон. Я использую конденсаторный usb микрофон от фирмы audio-technica AT2020-USB.
Этот микрофон подключается к любому usb-порту и для его настройки ничего не нужно делать. Стоит он не дешево, но своих денег стоит.
Если же вы не готовы тратить около 10 000 руб на такой микрофон, то можно заказать на Aliexpress недорогой, но качественный по звуку петличный тряпичный микрофон. Я специально посмотрел несколько видеообзоров об этих микрофонах и почитал отзывы. Поэтому могу порекомендовать вам микрофон, который стоит всего 250 рублей и при этом записывает достаточно качественный звук.
С микрофоном определились. Теперь давайте покажу вам сам процесс начитки и обработки. Я записал весь процесс на видео. В начале там будет, информация о дикторской озвучке, а потом уже я показываю как я начитываю текст самостоятельно. Можете переместиться на время 3:30, чтобы не смотреть то, о чем уже прочитали.
ВИДЕО: Как сделать озвучку самостоятельно?
Ну а на сегодня Все! В следующем видео я покажу вам как искать тематические фотографии и небольшие видеофутажи для вашего будущего видеоролика. Подписывайтесь на мой канал если еще не подписаны и на оповещения, нажав на колокольчик рядом с кнопкой подписки!
Подпишись на нас ВКонтакте , FaceBook , Twitter , Telegram или смотри нас на YouTube
Ещё публикации из этой рубрики:
Как удалить фон на фото или картинке на ПК и телефоне?
Как проверить свой сертификат о вакцинации от COVID-19 на выигрыш?
Где быстро найти qr-код о вакцинации от COVID-19 в Госуслугах на телефоне?
Как записаться на вакцинацию от COVID-19 через Госуслуги? Пошаговая инструкция!
Как стать самозанятым и платить налог от 4 до 6%? Пошаговая инструкция!
Как узнать налоги по ИНН физического лица через Госуслуги и ФНС?
- WINDOWS 10
- Обзор и настройки Windows 10
- Ошибки Windows 10
- Установка и восстановление Windows 10
- Заработок в Интернет
- Заработок на Aliexpress
- Интернет-сервисы
- Расширения Браузеров
- Сайты и Блоги
- Секреты YouTube
- Telegram
- Viber
- HDD и SSD
- Видеокарты
- Квантовые компьютеры
- Модемы и роутеры
- Мониторы и телевизоры
- Полезные Гаджеты
- Системные блоки
- Смартфоны, планшеты и т.п.
- Антивирусы
- Майкрософт Офис
- Программы
- Работа с Видео
- Фотошоп
- ВКонтакте
- Инстаграм
- Одноклассники
- Игровые лайфхаки
- Компьютерная помощь
- Лайфхаки для Компьютера
- Тайм-менеджмент
СВЕЖИЕ СТАТЬИ
Как убрать фон с видео на телефоне? Достаточно нажать одну кнопку
Как удалить фон на фото или картинке на ПК и телефоне?
Как конвертировать JPG и PNG в формат WebP и наоборот?
- Ольга к записи Как убрать фон с видео на телефоне? Достаточно нажать одну кнопку
- Наталья к записи Как убрать фон с видео на телефоне? Достаточно нажать одну кнопку
- александр к записи Как написать в ВК, если Закрыта Личка?
ИНТЕРЕСНЫЕ МЫСЛИ
Скоро останутся лишь две группы работников: те, кто контролирует компьютеры, и те, кого контролируют компьютеры. Постарайтесь попасть в первую.
КАК СВЯЗАТЬСЯ СО МНОЙ?
По всем вопросам сотрудничества и рекламы на сайте вы можете писать мне на электронную почту, которую я указал на своем канале YouTube.
- Карта сайта
- О сайте — Компьютерные Секреты
- Оферта видеохостинга
- ПОЛИТИКА ИСПОЛЬЗОВАНИЯ ФАЙЛОВ COOKIE И ПОХОЖИХ ТЕХНОЛОГИЙ
- ПОЛИТИКА ОБРАБОТКИ ПЕРСОНАЛЬНЫХ ДАННЫХ
При копировании материалов с нашего сайта — ссылка на статью обязательна!
Источник: rabota-na-kompjutere.ru