Этот репозиторий предназначен для исследования подписчиков сообществ соцсети VK. Конкретно здесь — интернет СМИ «Медуза».
Репозиторий создан в рамках прохождения практики. После ее защиты здесь будет описана документация. Сейчас она не может быть выложена по причинам возможного пересечения тем практики у студентов.
- Парсер участников группы, их групп и дружественных связей внутри группы
- Исследование участников группы интернет СМИ «Медуза»
- Датасет участников
Ход практической работы
11 Фев, 2021 | 13 Фев, 2021 | Написание парсера |
13 Фев, 2021 | 15 Фев, 2021 | Сбор данных |
15 Фев, 2021 | 17 Фев, 2021 | Анализ данных |
17 Фев, 2021 | 18 Фев, 2021 | Оформление отчета |
19 Фев, 2021 | 19 Фев, 2021 | Защита |
20 Фев, 2021 | Возможное продолжение проекта |
Источник: coder.social
Что такое Research & Development и почему в IT никак без R&D
Machine Learning с человеческим лицом. Кейс службы поддержки «ВКонтакте»
Создатели ML-моделей рассказали, почему не доверяют своих пользователей ботам.
1812 просмотров
Руководитель службы поддержки «ВКонтакте» Анастасия Фёдорова и продакт-менеджер AI Research Иван Самсонов выступили на конференции по Machine Learning, прошедшей в Selectel. В тексте — про первые попытки автоматизировать службу поддержки и целый ансамбль ML-моделей, которые заменяют 30 сотрудников.
Команде поддержки «ВКонтакте» исполнилось 10 лет. За это время ее сотрудники ответили на 43 млн вопросов и помогли 26 млн пользователей (примерно столько же человек живет в Австралии).
Но главное достижение в том, что 45 % этих ответов дал искусственный интеллект. Правда, не без помощи людей: во «ВКонтакте» любой автоматический ответ проходит через обработку сотрудника поддержки, или агента. Так соцсеть убеждается, что пользователь получил точный и полезный ответ.
У любой службы поддержки есть три основные точки контроля качества работы, рассказывает Иван:
- Время от первого ответа до решения проблемы. UX-исследования показывают, что качество ответа не окупает долгого ожидания.
- Содержательные и доброжелательные ответы.
- Время до первого ответа пользователю. Всем знакомо чувство раздражения, когда у вас какая-то проблема, а чат поддержки молчит. Нужно реагировать быстро, но ботов с их «Спасибо за обращение» во «ВКонтакте» использовать не хотят.
Очень не хочется, чтобы даже в далекой перспективе, когда это станет технологической нормой, пользователю отвечал робот. Мы максимально против ботов и переписки, где мы не контролируем общение с нашим пользователем. Потому что сохранять человеческое общение очень важно.
VK explains: How to find a research topic?
Иван Самсонов, продакт-менеджер AI Research «ВКонтакте»
С момента внедрения ML-моделей пользователи «ВКонтакте» стали получать первые ответы в 5 раз быстрее. Чтобы понять, как команда пришла к таким результатам, вернемся в 2011 год.
Что было до внедрения ML
В компании сразу поняли, что ответам службы поддержки нужна автоматизация. Большая часть вопросов связана с массовыми «поломками» соцсети — в таком случае в поддержку валятся тысячи сообщений на одну тему. Ответить нужно каждому, а в службе на тот момент было 30-50 человек.
В первую очередь внедрили скрипт, который позволял отвечать на однотипные вопросы одновременно. Сотрудникам не нужно было писать каждому отдельно, сформированное один раз сообщение отправлялось сразу нескольким десяткам пользователей. Другой скрипт распределял вопросы по ключевым словам: они сразу попадали к специалисту, который мог быстро разрешить проблему.
В 2017 году, когда «ВКонтакте» начала работать с платежными сервисами, ввели приоритизацию вопросов. На сообщения, связанные с вымогательством денег, мошенничеством, взломом аккаунтов, нужно было реагировать в срочном порядке. Поэтому они получали высший приоритет и направлялись специалистам «скорой помощи».
Все это повысило скорость ответа поддержки, но настоящим бустом для соцсети стала коллаборация с командой прикладных исследований.
Рождение Долорес
Первую модель машинного обучения для поддержки «ВКонтакте» создали в 2019 году. На тот момент технологии искусственного интеллекта уже были достаточно развиты, а соцсеть накопила большое количество данных для обучения модели — и вопросы пользователей, и классные ответы агентов.
Модель генеративная, то есть она учится генерировать данные на существующем массиве данных. Назвали Долорес — в честь героини сериала «Мир дикого Запада», который был популярен в то время.
Когда запустили модель, агентам было страшно, что вот, пришел искусственный интеллект, который лишит их работы. Но мы быстро поняли, что ИИ никогда не заменит живого человека. Он — помощник, который снимает часть работы с агентов, избавляет их от скучной рутины, позволяет сконцентрироваться на более важных задачах
Анастасия Фёдорова, руководитель поддержки «ВКонтакте»
Как работает модель
Пользователь отправляет в поддержку запрос с описанием проблемы. Модель «смотрит», как раньше реагировали агенты, и генерирует несколько подходящих, по ее мнению, ответов. Это не какие-то предзагруженные шаблоны.
Допустим, модель сгенерировала три ответа, как на картинке ниже, и агент должен выбрать наиболее подходящий.
Сотруднику поддержки не нужно руками вписывать ответ. Он просто выбирает корректный вариант и кликает «Использовать ответ».
Рядом есть кнопка «Передать». Ее агенты используют, если их компетенций не хватит, чтобы поддержать дальнейший разговор с пользователем. Юзер получает быстрый ответ, но модель переадресовывает переписку на «суперагентов», которые отвечают на сложные и специфические вопросы.
Бывают ситуации, когда сгенерированный ответ Долорес не подходит. Для этого есть две кнопки в интерфейсе: «Не подходит» и «Не подходит совсем». В первом случае модель правильно угадала направление мысли, но неправильно или неполно сформулировала. Агент может дописать или скорректировать ответ. «Не подходит совсем» дает понять, что ИИ сгенерировал какую-то дичь — сотрудник пишет ответ сам.
во столько раз увеличилась скорость первого ответа пользователю с появлением ML-инструментов
Нео, Оби-ван и Ко
Долорес развивается не одна, внутри нее есть целый ансамбль моделей, которые закрывают разные задачи службы поддержки. Все они носят имена каких-то маскотов — Нео, Принцесса Лея и другие узнаваемые персонажи. Так разработчикам «ВКонтакте» проще и веселее общаться между собой.
Какие модели существуют
Антитролль-модель
Не всегда людям, которые пишут в поддержку, действительно нужна помощь. Чтобы агенты не тратили свое время и силы на таких пользователей, «ВКонтакте» внедрила систему антитроллинга. Модель оценивает семантику запросов и классифицирует их. Так, разделяются вопросы, где пользователь реально хочет закрыть свою боль, и ехидные замечания со сленгом, нецензурной лексикой, которые не связаны с продуктом «ВКонтакте». Последние идут в урну, куда иногда заглядывают агенты для домодерации.
Есть отдельная категория вопросов, которую во «ВКонтакте» называют «Life is». В таких запросах нет отсылки к продукту, но нет и токсичной составляющей. Например, пользователь пишет: «Слушайте, мне так здорово сидеть на своей страничке, слушать музыку, но захотелось вьетнамской еды. Может, посоветуете доставку?» На таких вопросах агенты поддержки отдыхают. Никаких сложных технических моментов, можно просто человечно ответить и порадовать пользователя.
Когда приходит запрос от юзера, он автоматически классифицируется на некоторое количество тегов. Это могут быть теги «платежи», «угон страницы» и другие маркеры, которые определяют дальнейший путь сообщения.
Распределение по языкам
Также есть модель, которая идентифицирует язык вопроса и отправляет агентам-носителям. За десять лет работы сотрудники поддержки ответили на запросы на 24 языках.
Семантический классификатор для поиска аномалий
Эта модель позволяет разработчикам «ВКонтакте» быстрее фиксить баги и находить проблемы в системах. Например, запустили новый продукт или выполнили маленькое или крупное обновление. Если что-то пошло не так, пользователи заметят это первыми. С помощью семантического анализа можно достаточно быстро из пачки странных запросов вычленить зерно смысла. Может, нужно докрутить UX продукта или дописать пояснение, как что-то работает?
Не обязательно быть «ВКонтакте», чтобы внедрять ML-инструменты в работу.
Используйте готовый докер-контейнер с установленными фреймворками и инструментами, чтобы снизить порог входа в разработку решений с ИИ.
Узнать больше →
Как все ломается
Не все модели, которые делают разработчики «ВКонтакте» живут долго и счастливо. Летопись некоторых довольно скоротечна: они быстро затыкают дыры в процессах, разгружая агентов поддержки, а потом идут в утиль. Абсолютно нормально, что не все модели эволюционируют. Команда AI Research постоянно экспериментирует с ними, чтобы делать поддержку более адаптивной и современной, снабжать ее новыми технологиями.
Натренировать идеальный ИИ для службы поддержки «ВКонтакте» практически нереально. Продукт постоянно обновляется, а генеративным моделям нужно «мясо» — база ответов от агентов по новому инструменту или фиче. Кроме того, сотрудники поддержки работают с людьми, а люди способны написать слово «верификация» тысячей и одним способом или задать вопрос так, что даже агент не сразу разберется.
Вот так по-разному можно написать слово «верификация».
«Но все это не безнадежные случаи. Да, люди задают вопросы в странных формулировках, но на них тоже находятся ответы. А значит, Долорес будет обучаться и в будущем поймет, что на самом деле хочет пользователь. Сейчас наша модель понимает: когда ее спрашивают, любит ли она “Группу крови”, имеют в виду песню, а не биологическую жидкость. И это здорово», — говорит Иван Самсонов.
Источник: vc.ru
Исследование: что происходит с охватами и вовлечённостью во ВКонтакте
Livedune собрали базу из 160 тысяч групп размером от 3000 до 1 000 000 и проанализировали 180 млн постов.
Livedune проанализировали 180 млн постов в группах ВКонтакте за 9 полных месяцев: с января по сентябрь включительно 2022 года. При этом январь приняли за «норму» в 100%. Полученные графики продемонстрировали, что на волне «переезда», пользователи действительно рассматривали первые несколько месяцев ВКонтакте как базовую соцсеть, исправно оставляя реакции под постами. Но затем их активность стала угасать.
Пока, подводя итоги сентября, можно предположить, что причиной могли быть отпуска.
С полной версией исследования можно ознакомиться здесь.
#b7b7b7; font-weight: normal; font-style: normal; font-variant: normal; text-decoration: none; vertical-align: baseline; background-color: transparent;»>Алексей Ткачук
#000000; font-weight: bold; font-style: normal; font-variant: normal; text-decoration: none; vertical-align: baseline; background-color: transparent;»>DNative
1. В марте рост количества активных небольших групп составил почти 20–40%. Но к сентябрю (второй график) число активных сообществ существенно снизилось.
2. Охваты выросли вообще у всех. Чем большая аудитория, тем больший рост (в процентах) и охватов (в исследовании охваты приравняли к просмотрам).
3. ERR (ERV) упал на 5–15% относительно января. Это может быть связано с большим количеством вирусных холодных просмотров, в ленте постоянные эксперименты.
Интересные данные, виден рост активности и числа активных сообществ. С другой стороны, не покидает ощущение, что этот рост меньше тех значений, которые реально должны быть при блокировке главного конкурента в котором (по данным Медиалогии, в которые я не верю ни секунды) никто больше не сидит.
Присылайте свои комментарии к ситуации на digital-рынке (короткие или развёрнутые, во втором случае сделаем вам полноценную колонку в статейной ленте Коссы):
Вебинар «Авито как must-have инструмент для performance-маркетинга»
14 июля в 12:00 по московскому времени Авито приглашает на онлайн-встречу о своей партнёрской программе.
Вебинар будет полезен тем, кто хочет развивать клиентскую сеть и получать за это премию: рекламным агентствам, фрилансерам и начинающим агентам.
Источник: www.cossa.ru