Количество данных в мире растёт по экспоненте. Если ваш сервис тоже вносит существенную лепту в эту общемировую статистику, то рано или поздно возникнет вопрос «Где хранить эту нагенерированную бигдату?». Маячащий на пороге Чебурнет наводит на мысли, что неплохо было бы иметь запасной вариант, например, в ближнем зарубежье. Беларусь отлично подойдет.
КХД, он же DWH — корпоративные централизованные хранилища данных. Это гораздо более сложная система, чем обычная база данных. По сути DWH — это совокупность всех данных, которые использует бизнес, которые хранятся в одном месте, а не в отдельных БД.
Это позволяет можно агрегировать данные (как архивные, так и актуальные) из разных источником и делать глубокую аналитику, создавать витрины/дашборды, строить полноценные Business Intelligence системы
Запасная хата
Компания Датахата, базирующая в Минске, предлагает услуги своего центра обработки данных: облачный хостинг, аренда сервера (Dedicated), аренда стойки (Colocation) и IT-аутсорсинг, если у вас нет нужных специалистов в штате. Естественно, присутствует SLA по аптайму, который можно прописать в договоре. Полный список услуг можно посмотреть тут.
Белорусские инженеры с умом подошли к проектированию ЦОД: всё телекоммуникационное оборудование зарезервировано по схеме N+1. Это значит, что каждый элемент имеет свой запасной модуль и примет на себя всю нагрузку на себя, если произойдёт сбой.
Дахата — это коммерческий ЦОД, не связанный с государственными структурами и возможными сопутствующими проблемами и бюрократическими проволочками. Оформить доступ можно за 24 часа, а в срочных случаях и за час.
В команде есть штатные инженеры, которые помогут с заменой комплектующих, настройкой доступа, прорестартят кластер или зальют нужную операционную систему. При этом для клиентов саппорт круглосуточный — на смене всегда есть дежурный специалист.
Переходить ли на DWH?
Как мы уже знаем, Data Warehouse собирает данные из разных источников в единое хранилище.
Если у вас есть различные источники информации, если вам близки принципы data driven компании и вы используете данные для принятия решений, то стоит присмотреться к решению DWH/BI. Хранилище данных может автоматизировать многие задачи отчетности
Взять простой пример — статистика продаж. В этом бизнес-процессе довольно много сущностей, которые необходимо сопоставить — не всегда эти данные есть в обычной CRM. Не говоря уже о том, что количество отделов, участвующие в создании CJM, анализирующая MOU и другие метрики явно больше одного.
Каждая структура хранит ключевые показатели эффективности для определенного бизнес-процесса и соотносит эти показатели с факторами, которые их создали. Для примера посмотрите на то, как организовано хранилище данных у компании Lamoda (можно найти на Хабре)
Нужно иметь ввиду, что структура хранилища данных требует много дискового пространства, поэтому вам необходимо определить, как и какие архивировать данные. Но поскольку хранилища данных отслеживают производительность эти данные должны быть всегда доступны. Стоит учитывать этот фактор при переходе на DWH.