Введение

Exasol – это реляционная аналитическая in-memory база данных. Ее прямые конкуренты: HP Vertica, Teradata, Hana, Redshift, BigQuery.

СУБД Exasol – отличный вариант для построения хранилища данных и аналитической системы на нём.

Данные хранятся в столбце-ориентированном виде и используются собственные методы сжатия в памяти. Настройки не нужны, так как база данных включает в себя автоматическую самооптимизацию (например, автоматические индексы, статистику таблиц и распространение данных).

Эта аналитическая база данных была спроектирована специально для эффективной работы с системами класса Business Intelligence, такими как Tableau, Qlik, Power BI, Dundas, Microstrategy, Hadoop и т.д.

 

Основные выгоды для бизнеса:

  1. Функциональность, универсальность и масштабируемость Exasol позволяют интегрировать множество источников и выполнять более сложные запросы гораздо быстрее.
  2. Позволяет принимать быстрее бизнес-решения на основе данных.
  3. Помогает компаниям создавать новые услуги и внедрять инновации в свой бизнес.
  4. Cсовокупная стоимость владения ниже аналогичных продуктов.
  5. Проста в использовании, что снижает расходы на обучение персонала.

Основные отличия БД Exasol.

Exasol базируется на трех основных концепциях:

Массивно-параллельная архитектура (MPP)

SQL-запросы базе выполняются параллельно на всех нодах, максимально используя все доступные ресурсы: ядра процессоров, память, диски, сеть. Понятие «мастер ноды» отсутствует — все серверы в системе равнозначны. Отдельные стадии выполнения одного запроса также могут идти параллельно. При этом частично рассчитанные результаты передаются в следующую стадию, не дожидаясь окончания предыдущей.

Колоночное хранение

Exasol хранит данные в колоночной форме, а не в форме отдельных рядов, как в классических СУБД. Каждая колонка хранится отдельно, разделяется на большие блоки, сортирируется, сжимается и равномерно распределяется по всем нодам.

Эффективность сжатия сильно варьируется в зависимости от типов данных и распределения значений в таблицах.

Колоночное хранение позволяет многократно ускорять аналитические запросы, а также вычленять только те данные, которые необходимы для выполнения запроса. В классических СУБД необходимо прочитать весь ряд целиком, даже если в нем используется всего одна колонка.

In-memory analytics

В Exasol есть механизм, похожий на буферный пул в MySQL или заданный объем памяти (shared buffer) в PostgreSQL. Блоки данных, однажды загруженные с диска, остаются в памяти и могут быть повторно использованы для последующих запросов. Как правило, в реальной жизни пользователи работают в первую очередь с «горячими» данными (последний день, неделя, месяц). Если у кластера достаточно памяти, чтобы вместить их целиком, то Exasol не будет трогать диск вообще.

Данную базу отличают следующие характеристики:

Отличительные особенности базы Exasol

Варианты использования Exasol.

Существуют следующие варианты использования базы Exasol:

  1. Хранилище данных
  2. Искусственный интеллект
  3. Источник данных для приложений
  4. Ускорение BI-инструментов

Изображение выглядит как текст Автоматически созданное описание

Архитектура Exasol как центральное хранилище данных:

Результаты пользовательских тестов.

По данным независимого исследования TPC-H (ТРС – некоммерческая организация, основанная для оценки производительности обработки транзакций и баз данных и распространения объективной и достоверной информации рынку)» с 2008 года Exasol возглавляет Тест TPC-H во всех категориях на основе объемов данных 100 ГБ, 300 ГБ, 1 ТБ, 3 ТБ, 10 ТБ, 30 ТБ и 100 ТБ. Exasol занимает первое место по абсолютной производительности, а также по соотношению цена / качество.

«Данные хранятся в памяти поколочено и неплохо сжимаются (настроек сжатия при этом обнаружить не удалось).

Если при обработке запроса надо данных больше чем есть ОЗУ, база начнет использовать своп (спилл) на диски. Запрос не упадет (привет Hana и memSQL), просто будет работать медленней»

Источник: https://habr.com/ru/company/tinkoff/blog/310620/

Видео о системе:

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *