Сколько весит база данных Вконтакте

форма: аватарка 125х125, ник, контактные данные, почта, skype, стаж, хобби, + 1000 знаков под поле о себе, + пара дополнительных полей.

Aleksei Minin

Ну тут ещё зависит от того, в чём база.
Аватары обычно хранятся отдельно, поэтому они занимают байт 30-50 — путь к файлу.
Остальное просто просуммируй, добавь процентов 10 служебной информации, возьми среднее значение по тому, что вышло. «О себе» если занимает 30 байт, то оно в базе скорее всего не будет 1000 занимать, если только поле не забивается нулями до нужной длины. В dbf вот вроде выделяется целиком весь размер, но там-то вряд ли dbf, или mysql или postgresql, да?
Возьми с потолка так два килобайта на пользователя, получишь 20 метров.

Источник: sprashivalka.com

В интернете нашли открытую базу с данными миллионов пользователей «ВКонтакте»

Специалист в области кибербезопасности Боб Дьяченко (Bob Diachenko) обнаружил базу данных с пользователями «ВКонтакте». Её вес составляет более 126 ГБ, в базе содержится более 32 млн записей. Они включают в себя даже закрытые профили.

БАЗЫ ДАННЫХ МАЙКРАСОФТ АКЦЕСС УРОК 27 БД БИЛИОТЕКА ТАБЛИЦА АБОНЕМЕНТ И СВЯЗЬ С ДРУГИМИ ТАБЛИЦАМИ

Специалист поделился скриншотами того, что обнаружил. Можно увидеть, что в файле хранится информация об имени пользователя, его айди, городе, стране. Есть ссылки на фотографии, статус и другие данные со страницы. Дьяченко показал, что аккаунты, перечисленные в базе, реальны:

Фото: Bob Diachenko

Дьяченко рассказал изданию «Код Дурова», что база данных выглядит как сервис для поиска информации о человеке на основе его имени и базируется на российском IP. «ВКонтакте» пока никак не прокомментировала ситуацию.

Комментировать
Новости партнеров
Новости партнеров

Еще по теме:  Как выкладывать клипы в ВК с телефона

ferra.ru, 2023 г. 18+

Нашли опечатку? Выделите текст и нажмите Ctrl+Enter

Все права защищены. Полное или частичное копирование материалов Сайта в коммерческих целях разрешено только с письменного разрешения владельца Сайта. В случае обнаружения нарушений, виновные лица могут быть привлечены к ответственности в соответствии с действующим законодательством Российской Федерации.

Источник: www.ferra.ru

Как лучше спроектировать базу MySql на несколько ТБ?

В планах создать социальную сеть. Для определённого круга людей.
Будет использоваться LAMP (apache mysql php).
По подсчетам БД будет наполнятся на 100gb месяц.

Как лучше спроектировать БД.
1. Одну базу или несколько, одну для статей другую для комментариев.
2. Как будет вести MySql при таких объемах? (все странички сайта будут кэшироваться и подружатся через аякс).
3. Если создать несколько бд например для комментариев то как искать нужную бд для вывода? (создать связывающую бд с индексами где будет хранится адрес сервера бд, а потом конектица и выводить нужные записи. Может так?

2. Базы данных. Модификация и выборка данных | Технострим

Буду благодарен за помощь.

  • Вопрос задан более трёх лет назад
  • 4329 просмотров

1 комментарий

Оценить 1 комментарий

Прошу не отвечать-Зачем социальная сеть. Еже есть. Социальные сети зло и т.д.
Решения вопроса 0
Ответы на вопрос 5

Вот тут Дмитрий Бородин CEO TopFace описывает как нужно делать архитектуру spb-borodin.livejournal.com/596.html

Ответ написан более трёх лет назад
Нравится 3 3 комментария
и вот тут он же php.spb.ru

edinorog

Троллей не кормить!
Социальные сети зло. Не нужно их множить. =)
Ответ написан более трёх лет назад
Нравится 1 1 комментарий

Смотря какие)
Linux-сисадмин с 8 летним стажем.

> Как будет вести MySql при таких объемах?
Х**во он себя будет вести через пару месяцев (ну или через 4 месяца, если у вас будет 256 гов памяти).
С другой стороны, 100 гб в месяц у вас там и не будет. А если и будет — то прекратите хранить в базе картинки и другую чушь.

Еще по теме:  Как подать объявление в ВК в группе без юлы

> Если создать несколько бд например для комментариев то как искать нужную бд для вывода?
if comment_id < 1000000 and commend_id >0 then use mysql1
if comment_id < 2000000 and comment id >1000000 then use mysql2
Примерно так. А вообще это называется шардированием, как его организовывать — решать вам. Обычно делают метабазу, в которой хранят диапазоны id-шников и соответствия с конкретным сервером. К тому же на сервера со старыми комментариями нагрузка со временем будет и меньше и их можно будет «решардировать» — т.е., например, сливать 3 старых базы в 1 и править id-ники в метабазе. А 2 освободившихся сервера ставить под запись для новых комментариев.

> Одну базу или несколько, одну для статей другую для комментариев.
Тупиковый путь, если объём данных станет больше определенного порога.
Станет много статей — загнется mysql со статьями, станет много комментариев — .
В любом случае, нужно и делить по типу хранимых данных, и шардировать.

Ответ написан более трёх лет назад
Комментировать
Нравится 1 Комментировать

Кто-то где-то определенно врет. Как полмиллиона пользователей может сгенерировать 100гб за месяц? Вы там может сервис «в интернет по паспорту» пишете по заказу гос структур? Где на каждыцй пук — обязательный лог.
А нужен ли mysql?

Ответ написан более трёх лет назад
может и 100 переборщил но 40 точно. Никто не говорил про полмиллиона. В несколько раз больше.
Я просто пробежался по предыдущим вопросам

Будем писать очень масштабный проект вот и вопросы появляются сами собой. Нужно продумать архитектуру.

Django developer

ну ну , данные вконтакте весят примерно 1ТБ и вконтакт для всех . Так что не фантазируйте про несколько ТБ

Еще по теме:  Как получить токен от страницы ВК

Источник: qna.habr.com

Рейтинг
( Пока оценок нет )
Загрузка ...