Бот который меняет озвучку голоса в Телеграмме

Со временем озвучка Warcraft 3 стала культовой и породила множество мемов. Все эти фразы «опять работать», «жизнь за Нерзула!», «нужно больше золота» стали по-настоящему культовыми, как и голоса актеров.

Спустя 20 лет с релиза стратегии технологии дошли до такого уровня, что нейросети теперь могут генерировать голоса и превращать намечатанный текст в аудиосообщения. Именно этим и занимается Telegram-бот Silero — озвучкой любого текста голосами русского дубляжа Warcraft 3.

В нем можно выбрать множество героев тайтла от рассказчика до Артаса, Тралла или Тиранды. Естественно, есть некоторые проблемы. Например, нейросеть не везде правильно ставит ударение.

Есть также ограничения на фразу — всего 500 знаков. Но из этого можно выкрутиться с помощью редакторов.

Сейчас Blizzard занимается следующим дополнением для World of Warcraft. Dragonflight выйдет в этом году на PC.

ТУТОРИАЛ ПО ГОЛОСУ БОТА ` ️Как сделать красивую озвучку текста?гача клуб ️

Источник: beltion-game.com

Простейший голосовой помощник. Часть 2. Внедрение в telegram

По статье PYTHON: ПРОСТЕЙШИЙ ГОЛОСОВОЙ ПОМОЩНИК нам несколько раз писали в личные сообщение вопросы про возможность интеграции “голосового помощника” в telegram. Мы изначально не планировали этого делать, но потом задали себе вопрос – почему бы не попробовать?

Используемые библиотеки

Для решения данной задачи нам понадобятся следующие библиотеки.

  • telebot (pyTelegramBotAPI) – по словам автора библиотеки, простая, но расширяемая реализация на Python для Telegram Bot API.
  • requests – библиотека для обработки HTTP запросов.
  • random – библиотека для, как не странно, рандома.
  • speech_recognition – используем туже распозновалку голоса, что и в прошлой статье.
  • pyttsx3 – если раньше мы использовали консольный аналог say, то теперь нам нужно отправлять на сервера telegram голосовые файлы в формате oga
  • os – нам нужна для работы с файловой системой.
  • time – нужно только в одном моменте для sleep.
Еще по теме:  Как найти человека в Телеграмме если он скрыл номер телефона

import telebot import requests import random import speech_recognition as sr import os import pyttsx3 import time

Сразу отмечу, что тут указаны не все, но мы постараемся ничего не пропустить по ходу статьи

Получение токена и создание оболочки бота

Одной из важных вещей, которым делится с нами Крестный отец – токен нашего бота. Его мы и указываем в коде. В статье токен изменен для соблюдения анонимности

token = ‘fa3hnerpw25mga095mt125aga1si2lr!fk39sktndsawg’ bot = telebot.TeleBot(token)

Про ffmpeg

Так как в telegram использует в голосовых сообщениях файлы формата oga- (да не простой oga, а opus’овский), но мы можем обрабатывать библиотекой speech_recognition файлы формата wav, то на помощь придет к нам библиотека pydub, которой для работы нужно FFmpeg.

FFmpeg – это кроссплатформенное решение для записи, конвертации и записи аудио и видео. В нашем случае необходима для конвертации oga в wav и обратно. Для удобства FFpeg мы распаковали архив в директорию кода (ffmpeg был взят на сайте gyan.dev в разделе release). Про установку FFmpeg следует отметить, что корректно работать будет только после перезагрузки сервера или пк – это избавит нас от ошибки winerror 2.

В коде указываем для pydub расположение ffmpeg.

from pydub import AudioSegment AudioSegment.converter = os.getcwd() + «\ffmpeg\bin\ffmpeg.exe» AudioSegment.ffmpeg = os.getcwd() + «\ffmpeg\bin\ffmpeg.exe» AudioSegment.ffprobe = os.getcwd() + «\ffmpeg\bin\ffprobe.exe»

Инициализация голосового движка

Для формирования text-to-speech файлов нам понадобится pyttsx3. Особенностью pyttsx3 является возможность работы оффлайн, нам это навряд ли это пригодится, но отметить стоит. А также мы не забываем выбрать “голос” нашего бота.

import pyttsx3 text_to_speach = pyttsx3.init() voices = text_to_speach.getProperty(‘voices’) for voice in voices: print(‘———————‘) print(‘Имя: %s’ % voice.name) print(‘ID: %s’ % voice.id)
——————— Имя: Microsoft Irina Desktop — Russian ID: HKEY_LOCAL_MACHINESOFTWAREMicrosoftSpeechVoicesTokensTTS_MS_RU-RU_IRINA_11.0 ——————— Имя: Microsoft Zira Desktop — English (United States) ID: HKEY_LOCAL_MACHINESOFTWAREMicrosoftSpeechVoicesTokensTTS_MS_EN-US_ZIRA_11.0 ——————— Имя: Microsoft David Desktop — English (United States) ID: HKEY_LOCAL_MACHINESOFTWAREMicrosoftSpeechVoicesTokensTTS_MS_EN-US_DAVID_11.0

Еще по теме:  На какие виды подразделяются Телеграммы в зависимости от стадии их обработки

Не густо. Выбираем из доступных русскоговорящих голосов (или устанавливаем дополнительно в случае отсутствия или вкусовых предпочтений), в нашем примере имеется только IRINA, классический женский роботизированный голос. IRINA, I choose you.

RU_VOICE_ID = «HKEY_LOCAL_MACHINESOFTWAREMicrosoftSpeechVoicesTokensTTS_MS_RU-RU_IRINA_11.0» text_to_speach.setProperty(‘voice’, RU_VOICE_ID)

Начало (/start)

Наконец, мы добрались до самого бота. На команду /start бот напишет нам небольшое приветствие.

Подсказки (/help)

Наш новый бот будет иметь практически тоже самое, что его первая версия, но для понятия какой функционал имеется, воспользуемся командой /help.

Обработка контента

В Telegram используется достаточно большое количество типов контента: видео, аудио, голосовые сообщения, стикеры и т.д. И для каждого события отправки пользователем определённого типа сообщения мы можем задать различную обработку. В нашей сатье мы воспользуемся только text и voice. Начнем с text.

Обработка текстовых сообщений

Тип контента text – это отправленные пользователем текстовые сообщения. Наша версия первого бота с некоторыми улучшениями приведена ниже.

Обработка голосовых сообщений

С обработкой голосовых сообщений все несколько сложнее. Как мы упоминали ранее, telegram хранит голосовые сообщения в формате oga. Нам нужно их обработать в wav для обработки speech-to-text (можно этого и не делать – имеется отличный аналог от Яндекса с обработкой oga, но руки до него так и не дошли).

Текущие результаты

А вот так звучит наша Irina (Пример_1.mp3, Пример_2.mp3)

Планы развития

  • Развертывание на облачных серверах
  • Решить проблему с отправкой oga в telegram – не везде могут открываться отправленные потом голосовые сообщения
  • Внедрение “напоминалок” для пользователей бота
  • Изменение интерфейса на более юзерфрендли
  • Внедрение логирования событий сразу в бд
  • Отработка исключений, возникающих при нестандартных действиях пользователя
  • Перевод части существующего функционала в отдельные подфункции
Еще по теме:  Как видеть реакции в Телеграмме

Заключение

Вот мы и закончили с первой попыткой внедрения бота в telegram. Что-то получилось хорошо, что-то не очень. Не бойтесь комментировать и задавать вопросы – только так будет развиваться профсообщество и все мы вместе с ним!

Источник: newtechaudit.ru

Появился бот, который озвучивает текст русскими голосами Warcraft 3. Артас уморительно доказывает, что «попыт круче»

В Telegram появился бот, который озвучивает персонажей русскими голосами Warcraft 3. Silero TTS озвучивает текст, как говорят сами разработчики, в высоком качестве и разными голосами на основе движка синтеза речи. Его самостоятельно разработали в компании Silero. О процессе создания движка, а также вообще о технологии синтеза речи разработчики активно рассказывают на портале habr, рекомендуем ознакомиться всем интересующимся.

Бот, доступный по ссылке, может озвучивать любой текст голосами Silero и множеством голосов героев Warcraft 3. В сети уже появилось много забавных примеров. Одним из самых веселых оказался диалог Артаса с орком, в котором они пытались выяснить, а что круче: симпл-димпл или попыт.

Радует, что у нас появилась возможность вновь услышать замечательного актера озвучки Владимира Вихрова, который трагически погиб в 2010-м.

Источник: gameguru.ru

Рейтинг
( Пока оценок нет )
Загрузка ...