Как устроена база данных Вконтакте

На одном закрытом форуме давно ещё набрел на базу пользователей ВКонтакте. Естественно, в ней нет какой-либо конфиденциальной информации, просто некоторые данные, собранные с открытых страниц пользователей.
База от 28.07.10, содержит информацию о всех или почти всех пользователях примерно до 76391587 id, экспортирована из MySQL, содержит поля id (порядковый номер в бд), userid (ид в вконтакте), name (имя), familyname (фамилия), gender (пол), familystatus (семейное положение), birthdate (дата рождения), birthcity (город рождения), country (страна), city (город проживания), mobile (номер мобильного), institute (институт), interests (интересы), groupslist (группы, в которых состоит пользователь).

Вес в распакованном виде: 9,23 Гб
Вес в архиве: 1,47 Гб
Архив разбит на части, добавлена информация для восстановления.

Update (18.01.2022): Ссылки выше недействительные. То же самое, но в другой разбивке по архивам: Часть 1 | Часть 2 | Часть 3 | Часть 4 | Часть 5 | Часть 6 | Часть 7

Что такое базы данных? ДЛЯ НОВИЧКОВ / Про IT / Geekbrains

Автор Kaimi Опубликовано 21 января, 2011 18 января, 2022 Рубрики Социальные сети Метки база пользователей, вконтакте, Социальные сети

База ВКонтакте: 89 комментариев

А Вы это в паблик.

Kaimi :

Источник: kaimi.io

Зачем нужны базы данных

Если вы будете делать веб-приложение — например интернет-магазин, блог или игры, — почти наверняка вы столкнётесь с базой данных. Вот что это такое с точки зрения программирования, какие тут основные понятия и что с ними делать.

Данные

Вокруг нас всегда много разных данных, например:

  • телефонные номера;
  • дела на день;
  • записи на бумажках, стикерах и в блокнотах;
  • опубликованные мысли разных людей;
  • фотографии в смартфоне;
  • и всё остальное, что можно прочитать, увидеть или услышать.

Если это компьютерная игра, то данными будут типы и местоположения врагов, их уровень здоровья, уровень здоровья героя, тип героя, его положение, характеристики карты.

Если это приложение для работы с клиентом, то там будут храниться имя клиента, его заказы, номер телефона, уровень в программе лояльности.

Если это служба слежения за гражданами — фотография, имя, посещённые станции метро и улицы, место работы.

База данных и СУБД

Есть понятие базы данных — это набор данных, организованных каким-то способом. Например, если у вас в квартире есть гардеробная или кладовка, то всё это помещение со всем её содержимым может считаться базой (но не данных, а вещей или банок с огурцами, что не меняет сути).

Есть понятие системы управления базой данных (СУБД) — это когда семья села за стол и самого младшего отправляют в кладовку за огурцами, он приносит её и не разбивает по дороге. То есть СУБД — это какое-то средство для манипуляции данными в базе, например программа.

Слив базы данных Вконтакте [Описание]

Для чего нужны

Вот основные задачи БД на примере гардеробной:

  • Сохранить наши данные по запросу — чтобы вы могли открыть дверь, повесить куртку, закрыть дверь и больше не думать ни о куртке, ни о гардеробной.
  • Изменить наши данные по запросу — чтобы можно было легко извлечь из гардеробной все дырявые носки и положить на их место целые.
  • Найти эти данные по запросу — чтобы быстро найти приличный пиджак или парный носок.
  • Не дать прочитать эти данные тем, кому не следует, а кому надо — дать. Например, младший брат может смотреть на ваши кроссовки, но не может их брать. А девушка (или парень) может положить свои вещи, но только на определённую полку.
  • Поддерживать порядок и не дать захламиться — если вам было лень и вы просто кинули толстовку куда попало, чтобы гардеробная либо сама нашла, куда эту толстовку правильно положить, либо сказала: «Э БРАТ ЗАЧЕМ ЗАХЛАМЛЯЕШЬ ПОЛОЖИ НОРМАЛЬНО ДАВАЙ»
  • Масштабироваться — чтобы вы могли просто вешать в гардеробную вещи и не думать об объёме полок.
  • Не потерять данные — если квартира будет гореть, приличная гардеробная не должна даже нагреться. Или, если она всё-таки горит, чтобы где-то в защищённом подземном гараже была точная копия этой гардеробной со всеми актуальными вещами.
Еще по теме:  Что такое анонимка Вконтакте

В чём преимущества

Базы данных и их системы управления заточены на работу с большим объёмом данных и от лица большого числа пользователей. Сейчас вы поймёте.

Представьте, что у вас есть экселька со списком клиентов. Это не база данных, это просто таблица. Чтобы прочитать или записать что-то в эту эксельку, вам нужно её открыть, сделать дело, сохранить.

❌ Допустим, экселька с клиентами лежит на сетевом диске. Вы открыли её и ковыряетесь в данных, вносите изменения. Пока вы это делаете, ваш коллега тоже её открыл и тоже вносит изменения. Потом вы сохранились и закрыли эксельку. Экселька перезаписалась вашими данными. Но у вашего коллеги эти данные не отобразились, он-то открыл её раньше.

Теперь, когда он сохранит свою эксельку, его данные перезапишутся поверх ваших, а ваши данные пропадут. Это полный ахтунг: вся ваша работа потеряна.

Зачем нужны базы данных

❌ Или у вас в компании правило: экселька всегда на одной флешке, работаем только с неё. Сейчас флешка в вашем компьютере, вы с ней работаете. А вашему коллеге нужно с ней тоже поработать. Он говорит: «Дай». Вы ему «Отстань». Ну и слово за слово…

Зачем нужны базы данных

✅ Но можно организовать своего рода СУБД. Один ответственный сотрудник назначается главным по эксельке. Она открыта на его компьютере, а вы ему говорите: «Петруха, добавь в клиента такого-то вот такие данные». «Петруха, а шо, когда дедлайн по поставке для этих ребят из Воронежа?», «Петруха, питерские отказались, поставь там отказ».

Зачем нужны базы данных

Петруха — ваша система управления базой данных. А экселька — это его база данных.

Понятно, что Петруха медленный и не всегда многозадачный, но хотя бы он избавляет от проблемы рассинхрона версий и потери данных.

Скорость — ещё одно преимущество базы данных. База данных устроена так, что она легко и быстро находит, записывает, переписывает и снова находит данные. Всё потому, что СУБД всегда знает, что где лежит и по какому критерию искать. Там не будет случайных данных в случайном месте.

Еще по теме:  Лол что это значит Вконтакте

Скорость важна ещё и потому, что СУБД обычно обслуживает сразу много потоков: одновременно ей могут пользоваться десятки и сотни тысяч человек, поэтому ей некогда копаться. В хорошо сделанных БД всё молниеносно.

Сложность. Базы данных нужны в числе прочего для хранения сложно структурированных данных. Мы привыкли думать, что база данных — это такая таблица, где есть строки и столбцы. Но база данных при правильной организации может намного больше:

  • Связывать одну единицу данных с множеством других. Например, если один человек совершил много заказов со множеством товаров внутри каждого, база данных способна хранить и обрабатывать такие связи.
  • База может хранить дерево данных — вроде того, о котором мы писали недавно. Попробуй в реальной жизни похранить дерево!
  • В базах могут жить ссылки на другие фрагменты и отделы базы.

Базу можно представить как таблицу, но лишь в самом упрощённом виде. Для более сложных задач базу можно представить как очень сложное дерево, или огромный склад упорядоченных коробок, или даже как огромный завод по фасовке данных.

База данных — это отдельный файл?

Чаще всего да, все данные СУБД хранит внутри одного большого файла. Но если данных много или сама база так устроена, то она может разбиваться на несколько файлов поменьше.

Но для пользователей нет разницы, как физически хранится база, это забота СУБД. Главное — уметь общаться с базой через СУБД.

Где их используют

Базы данных сейчас используются почти везде:

  • На сайтах, чтобы хранить контент для страниц. Все статьи в «Коде» на самом деле хранятся в базе данных и извлекаются оттуда по вашему запросу.
  • В смартфонах, чтобы хранить все ваши данные — фото, сообщения, заметки, контакты и музыку. Так как всего этого много, а доступ к этому должен быть молниеносный, используют разные виды СУБД.
  • В почтовых сервисах, чтобы можно было найти нужное письмо. Там строятся сложные индексные массивы, по которым ваш почтовый клиент ищет данные.
  • Везде, где есть личные кабинеты и регистрация, — чтобы запоминать пользователей и отличать их друг от друга.
  • В соцсетях и блогах почти всё хранится в базах данных.

Если у вас в работе появляется много одинаковых или похожих данных, то самый надёжный способ не потерять ничего из них — поместить их в базу данных.

Как это работает

Возьмём простой пример реляционной базы данных (можно упрощённо сказать, что это база данных в виде таблицы).

Каждая запись в реляционной базе данных раскладывается в одну или несколько ячеек. Например, запись в телефонной книге может выглядеть так:

Зачем нужны базы данных

В нашем примере у базы есть поля — Имя, Фамилия, Телефон и Фото, в которых могут храниться данные. Одна строчка — одна запись с данными.

Если пользователю нужно будет найти телефон Михаила Максимова по фамилии, происходит следующее:

Еще по теме:  Как прикрепить аудиозапись Вконтакте с компьютера

Запрос от пользователя: Выдай мне из базы «Контакты» все записи, где поле «Фамилия» равно «Максимов»

Ответ от базы данных: ЛОЛ КЕК Ты кто такой

Запрос пользователя: Я хозяин этой базы Админ Админыч, пароль •••••. Выдай мне из базы «Контакты» все записи, где поле «Фамилия» равно «Максимов»

Ответ от базы данных: Найдена одна запись: [Михаил, Максимов, +79057362163, вот фото]

Разные базы — разные правила

Внутри каждой базы данных и её управляющей системы свои строгие правила:

  • какие данные могут храниться: текст, цифры, фото, видео или всё вместе;
  • какие свойства есть у этих данных: дата записи, кто записал, кто может прочитать;
  • что делать, если с базой хотят работать одновременно несколько человек: разрешать только одному или пусть все вместе работают.

Рабочая ситуация: допустим, вы работаете в банке и открыли карточку клиента, чтобы поменять ему кредитный лимит. В этот же момент другой сотрудник из соседнего офиса тоже хочет поменять лимит этому же клиенту, но уже на другую сумму. Как база отреагирует на такое? Должна ли она разрешать второму сотруднику открывать карточку или её нужно заблокировать, пока первый не закончит?

А если она разрешит открыть карточку, то что будет, если двое сотрудников напишут там разный лимит — какой из них сохранять в итоге? СУБД задаёт эти правила и следит за их выполнением.

Что дальше

В следующей статье поговорим про MySQL — бурерождённую мать всех баз. Если разобраться, как она работает, то можно творить чудеса.

Текст и последняя схема

Редактура и остальные схемы

Источник: thecode.media

Как устроена база данных вконтакте

Будь в курсе последних новостей из мира гаджетов и технологий

iGuides для смартфонов Apple

В сети «всплыла» база пользователей «ВКонтакте». Там есть даже закрытые профили

Олег

Олег Воронин — 11 сентября 2022, 18:30

ВК

Специалисты по кибербезопасности обнаружили в интернете очень большую базу данных пользователей социальной сети «ВКонтакте». Об этом написали в «Коде Дурова».

Согласно источнику, специалист по кибербезопасности Боб Дьяченко рассказал о своей новой находке — огромной базе данных пользователей «ВКонтакте». Архив весит около 500 Гб и содержит более 32 миллионов записей о людях, среди которых имена, фамилии, ID-номер в соцсети, статус, страна и город проживания, место работы или учебы, фотографии и группы. Любопытно, что среди этой информации есть данные даже тех пользователей, страницы которых сейчас закрыты.

ВК

Эксперты говорят, что ничего «криминального» в этой базе не содержится, и сам факт её существования неудивителен. Поскольку никаких приватных данных — например, логинов и паролей — в ней не содержится, можно предположить, что собран архив был при помощи парсинга, то есть автоматизированного сбора открытой информации со страниц юзеров. Данные тех, чей профиль сейчас закрыт, могли попасть в архив ранее, в период общей доступности странички.

Комментарий ВК:
«Список собран из открытых данных. В нём нет конфиденциальной информации о пользователях ВКонтакте, только публичные данные с профилей. Поэтому речи о взломе или утечке информации пользователей не идёт.»

Источник: www.iguides.ru

Рейтинг
( Пока оценок нет )
Загрузка ...