GetCont это один единственный бот-агрегатор в мессенджере для всех СМИ сразу. Возможно он избавит редакции производителей контента от заботы создавать своих ботов, а так же облегчит жизнь пользователям, желающим читать несколько изданий в одном канале.
В настоящее время почти каждое уважающее себя СМИ озадачилось созданием своего собственного канала или бота в мессенджерах. На самом деле, пока никто толком не знает зачем это нужно, но вроде как модно. Время покажет насколько действительно востребованы так называемые каналы СМИ в мессенджерах.
На наш взгляд, пока юзабилити мессенджеров оставляют желать лучшего и на сегодня сильно проигрывают мобильным приложениям. За исключением, пожалуй, WeChat.
GetCont bot это не первый наш проект, связанный с агрегацией контента в вебе, поэтому после запуска платформы для ботов в Facebook мы сразу решили поэкспериментировать с данной темой в мессенджерах, хотя бы в чисто прикладных целях.
По результатам тестирования, на наш взгляд, GetCont-бот на платформе Фейсбук мессенджера выигрывает у GetСont в Telegram.
ПЕРВЫЙ БОТ АГРЕГАТОР ТАКСИ telegram, БОЛЬШОЕ ОБНОВЛЕНИЕ. Теперь это не просто бот,а целое приложение
GetCont это один единственный бот-агрегатор в мессенджере для всех СМИ сразу. Возможно он избавит редакции производителей контента от заботы создавать своих ботов, а так же облегчит жизнь пользователям, желающим читать несколько изданий в одном канале.
Что умеет наш Бот? СМИ разбиты по странам и категориям. У Бота есть навигация и поиск по фидам, добавление любимых фидов в избранное и возможность открыть «вырезанную» упрощенную статью с помощью интеграции с сервисом Mercury (бывший Readability).
Работа сервиса Mercury в части “очистки” контента нас не совсем устраивает, т.к. на многих фидах это происходит не корректно, зачастую утрачивается объём текста или фото. Но, мы сознательно пошли на использование стороннего скрипта, т.к. по нашей задумке, режим “упрощенной статьи” позволяет быстрее открывать ссылку, адаптировать контент для просмотра, что особенно важно для мобильных пользователей. Наш собственный скрипт позволил бы избежать этих багов, а так же дал бы возможность открывать статьи практически мгновенно, но в целях экономии сил и времени, мы пока намеренно не стали фокусироваться на этой проблеме.
В GetCont боте реализована функция комментариев к статьям. Причём, для комментирования не нужно регистрироваться, по-умолчанию подтягивается публичная информация из профиля мессенджера. При необходимости Ее можно изменить через бота. Комментарии кроссплатформенные. Не важно, пользователь Telegram или Facebook оставил комментарий, его увидят все пользователи.
Бот реализован на собственной платформе, в основе которой yii2 framework. Ядро бота установлено в облаке Microsoft Azure.
Пока в боте доступно три страны: США, Россия и Украина. В планах расширение этого списка. Мы собрали черновой вариант изданий еще по нескольким странам, вероятно скоро мы добавим и их.
Если у вас есть СМИ, которого нет в нашем каталоге и вы хотели бы добавить его в каталог — просто свяжитесь с нами через GetCont-бот в Facebook или Telegram и и мы добавим ваш фид сами и совершенно бесплатно!
Если у кого-либо будут замечания и предложения по совершенствованию GetCont-бота, мы готовы его доработать. Напишите нам.
Источник: spark.ru
Анализ различий подачи новостей в Telegram-каналах
Привет. Прошло уже почти полгода как я сделал новостной агрегатор каналов в Телеграме с открытым исходным кодом. Краткую статью про него можно прочитать на VC. Здесь же я бы хотел поделиться некоторыми интересными вещами, которые я нашёл в данных за всё время работы агрегатора.
Дисклеймер 1: многое из этого отчёта может показаться политизированным, особенно некоторые примеры новостей. Но здесь я не делаю никаких выводов про то, кто прав, а кто виноват; кто грязный пропагандист, а кто носитель священной истины.
Дисклеймер 2: это не руководство по визуализации данных средствами Plotly и PyVis. В самой статье я не привожу код и не объясняю, почему он устроен именно так. При этом Colab с кодом открыт, и примеры оттуда можно использовать для своих задач.
При подготовке этого отчёта я вдохновлялся несколькими вещами:
- NewsViz — проект ODS ML4SG по визуализации тем в новостях, статья о нём. Впрочем, в финальной версии отчёта никаких тематических моделей нет, уж слишком они сложны для понимания.
- Упомянутая в той же статье визуализация разницы освещения разных событий американскими телеканалами.
Описание данных
Всего в коллекции около 225 тысяч документов с 5 апреля по 6 августа из 59 каналов основного выпуска, и около 4 тысяч состоящих из них сюжетов. На картинке ниже можно увидеть распределение количества документов и сюжетов во времени.
Что тут можно увидеть:
- меньшее количество документов по выходным
- общее уменьшение количества документов до конца июля
- рост в начале августа: добавил каналы для технологического выпуска
- дыра в мае: закончилось место на диске и часть данных не сохранилась
- уменьшение количества сюжетов в начале мая: измененил настройки кластеризации
Деление каналов по группам
Каналы в рамках основного выпуска новостей разделены на три категории: красные (прогосударственные, консервативные), синие (оппозиционные, зарубежные, либеральные) и фиолетовые (нейтральные).
Разделены они на глаз, но есть свидетельства того, что это деление разумное.
Первое свидетельство — Word2Vec-like модель, где вместо предложений сюжеты, а вместо слов каналы. В результате её работы для каждого канала получается вектор в некотором пространстве. Чем вероятнее каналы встречаются в одних и тех же сюжетах, тем ближе должны лежать их векторы. Подобная визуализация есть на картинке ниже. Цветами отмечены разные группы источников.
Красная и синяя группы явно выделяются на этой картинке.
Другое свидетельство — граф цитирований. Рёбра в нём означают наличие цитирований одними каналами других, размер вершин — это их PageRank в этом графе.
Видно, что на пару красных источников ссылаются почти все. Но в остальном графе есть чёткие сети синих и красных каналов.
Есть ли события, освещаемые только одной стороной?
Первый способ ответить на этот вопрос — посмотреть сами сюжеты. Сэмплировать их можно по-разному, в таблицах ниже приведены самые просматриваемые (по совокупности просмотров на документах) и случайные сюжеты каждой из сторон.
Второй способ — облака слов.
В целом видно, что различия в освещаемых событиях есть. Обычно это либо события, выставляющие другую сторону в плохом свете, либо продвигающие свою точку зрения, либо просто локальные новости.
Правда ли, что одни и те же события могут освещаться по-разному?
На этот вопрос ответить немного сложнее. С одной стороны, у нас есть данные кластеризации, которая пыталась склеить документы про одно и то же. Мы могли бы посмотреть на наиболее отличающиеся документы от разных сторон внутри одного сюжета. С другой стороны, кластеризация делает ошибки, и большинство таких пар будут именно этими ошибками.
Поэтому я выбрал путь компромисса. Примеры ниже отобраны вручную среди всех подобных пар документов (внутри одного кластера + с разных сторон + с большим расстоянием между векторами) для показа наличия разных точек зрения на одни и те же события.
Содержание таблицы примерно отражает то, что мы видели на иллюстрации в самом начале статьи.
Есть ли запретные термины или типичные штампы?
Здесь мы воспользуемся визуализацией отсюда. Идея в том, чтобы взять 3 источника с разными точками зрения и посчитать употребления ими разных слов. На картинке ниже я привожу 4 субъективно интересных примера слов-штампов, но в Колабе эта визуализация интерактивна.
Здесь приведены не все возможные способы исследования полученных данных. Более того, приведённые здесь примеры — малая часть даже из моих экспериментов. Если ты, читатель, знаешь как сделать лучше — данные открыты и регулярно обновляются. Буду рад увидеть другую аналитику.
Основная же мысль этой статьи проста: будьте аккуратны с теми источниками информации, которые используете. Пользуйтесь новостными агрегаторами — так вы хотя бы будете получать информацию из разных источников. К тому же и новостных агрегаторов сейчас существует немало:
- Яндекс.Новости (субъективно красный)
- The True Story (субъективно синий, ещё не конца запустившийся)
- НЯН (мой агрегатор, данные которого я здесь и использовал)
И как говорил классик, «берегите себя и своих близких!».
Ссылки
- Код в Google Colab: ссылка на ноутбук
- Оригинальные данные: ссылка на архив
- Код агрегатора: ссылка на Github
Источник: habr.com
Отзывы о Агрегатор бот в телеграм
Upd: Бот Агрегатор получил отметку scam, что еще раз подтверждает наш вывод.
Обзор бота Агрегатор в телеграмме: отзывы реальных людей
Мошеннические сообщества предлагают множество схем по заработку в интернете, а на деле оказывается, что деньги выкачивают у своих же подписчиков или просто используют бесплатную рабочую силу. Проведенный анализ бота Агрегатор в телеграмме показал, что здесь не платят и получить свои заработанные средства за подписки нереально.
Описание бота Агрегатор в телеграме
После запуска AGREGATOR BOT каждому желающему предлагают заработать на подписках. В заданиях необходимо подписаться на определенный канал (тематика сообществ разная, есть вообще пустые ресурсы). За одно действие платят 40 рублей. Вывод возможен от 500 рублей. Каждый день начисляется бонус в размере 5 рублей.
На проекте работает партнерская программа по привлечению новых пользователей, за каждого нового участника платят 5 рублей.
Как вывести заработанные средства?
После достижения 500 рублей на балансе в боте агрегатор в телеграмме можно создать запрос на вывод, перевести предлагают на Яндекс.Деньги, КИВИ и Сбербанк. Вот с данного момента и начинаются проблемы. Сначала вас попросят пройти верификацию, для этого необходимо привести по реферальной ссылке трех новых пользователей системы – как вообще это все связано, нам непонятно!
Важно! Заработать 500 рублей будет очень сложно, так как количество заданий ограничено, возможно, специально, чтобы люди не могли набрать необходимую сумму на счету.
Хотите посмотреть на топ лучших капперов, которым можно доверять? Сайты, которые проходят мою личную проверку и ведут честную статистику
Источник: www.kaper.pro