Трансформируем ваши данные в прибыль

Пн — Пт: с 10:00 до 19:00

ГлавнаяБлогКак Prophet обеспечивает прогнозирование временных рядов в Apache Superset

Как Prophet обеспечивает прогнозирование временных рядов в Apache Superset

3 минут(ы)

Мы очень часто смотрим на результативные графики и так хочется, чтобы они отображали не только текущее состояние, но и автоматически выстраивали прогноз на будущее. Ии теперь это возможно!
Чтобы добиться подобных результатов в рамках Apache Superset, на сервере нужно установить Prophet. Сделать это можно через командную строку:

pip install prophet

Дожидаемся установки и заходим в Superset.

Прогнозирование с Prophet

Однако, не во всех графиках данная функция доступна. Начнем с самого распространенного: Time-series Chart – см. скриншот.

Прогнозирование с Prophet

Элементы управления диаграммой представлены в виде ленты с возможностью вертикальной прокрутки с левой стороны. Слева от неё отображается информация о наборе данных. Эти поля можно для удобства сворачивать по вертикали.

Поля по вертикали

Под Chart type расположены элементы управления временем (Time).TIME COLUMN указывает, какой столбец в таблице содержит временную область. TIME GRAIN можно использовать для отображения  данных с большей или меньшей степенью детализации. Выберите Hour для отображения графика в промежутке одного часа.

Chart type

Ниже элементов управления временем (Time) расположены элементы управления Query, каждый из которых предоставляет возможность изменять базовый запрос привычными способами.

  • METRICS позволяет выбрать, какие агрегированные данные отображать на графике.
  • GROUP BY позволяет суммировать данные по определенным свойствам. В этом наборе данных isAnonymous— это логическое значение, указывающее на анонимность изменений.
  • Режим CONTRIBUTION MODE регулирует отображение вклада каждой группы в общую сумму в процентах.
  • FILTERS позволяет включать или исключать данные, применяя логические операторы к указанным столбцам, или писать пользовательские SQL-запросы для выполнения того же действия.
  • Если базовая таблица содержит измерения с высокой мощностью, что является общей чертой многих наборов данных временных рядов, работающих в реальном мире, установка SERIES LIMIT может повысить производительность запроса.
  • SORT BY и SORT DESCENDING определяет, какая метрика используется для упорядочения данных в диаграмме.

управления временем

Под элементами управления запросами расположены стандартные опции для определения слоев подписей к диаграмме, которые отлично подходят для разметки диаграммы. Наконец, переходим, к самому интересному.

Чтобы включить Prophet, нужно развернуть панель Predictive Analytics и установить флажок ENABLE FORECAST. Ниже поясняем некоторые дополнительные параметры:

  • FORECASTING PERIODS позволяет выбирать, на какой период будущего будет выведен прогноз. Нужно иметь в виду, что более отдаленные прогнозы менее точны для реальных данных.
  • CONFIDENCE INTERVAL <определяет, какой уровень статистической достоверности следует применять к прогнозу. Этот же уровень достоверности будет применён к той части временного ряда, для которой у нас есть данные.

SEASONALITY – это сезонные периодические колебания, часто сопровождающие диаграммы временных рядов. Например, ежечасно температура повышается и понижается каждый день в зависимости от движения солнца. Сезонные допущения могут быть использованы для годовых, еженедельных или ежедневных периодов. Важно сообщить Prophet правильные сезонные допущения, сам по себе Prophet известен тем, что справляется со связанными с сезонностью сложностями без особых дополнительных настроек.
Чтобы увеличить количество точек и улучшить прогноз за счёт сокращения времени вычислений, уменьшите интервал прогнозируемого времени до 10 минут. При условии, что ваши данные не слишком массивны, использование более конкретного интервала времени улучшит прогнозы Prophet (по общему признаку).

SEASONALITY

В результате мы увидим прогноз Prophet на 10 заданных периодов периодов в будущее (100 минут). Стоит отметить, что для каждой выбранной группы генерируется отдельный прогноз, отображаемый разными цветами. На примере видно, что на данные оказывается некоторое периодическое влияние, однако оно не имеет четкой дневной, недельной или годовой сезонности.
При помощи этого инструмента можно работать и с другими типами данных в других документах, составляя прогноз при помощи Prophet.

Прогнозируйте будущее с Prophet

Узнайте, как добавить прогнозирование в ваши графики