Проект завершен

Усовершенствование контроля качества данных для построения дэшбордов по разведке и добыче углеводородов

Приём откликов

до 16 августа 2019

Сроки работы

7 месяцев 1 день

В чем суть проекта?

Необходимо найти техническое решение, позволяющее выявлять ошибки в данных, на основе которых строятся дэшборды для менеджмента

Расскажите о задаче подробнее

Отчеты по разведке и добыче углеводородов для руководства компании формируются с помощью Qlick View в виде дэшбордов. В последнее время пользователи стали находить ошибки и несоответствия в данных. Необходимо автоматизировать выявление этих ошибок

Что предстоит сделать?

Вам предстоит уточнить и зафиксировать правила расчета показателей эффективности, а также сформировать перечень требований к качеству данных, используемых для расчета этих показателей. Для этого нужно опросить потребителей данных, уточнив, с какими именно данными они работают и как оценивают их качество, проанализировать их ответы и описать выбранные показатели. Кроме того, вам будет необходимо создать проверки в системе верификации данных

Каким должен быть результат работы?

1. Перечень 50 показателей для отслеживания качества данных, составленный на основе опроса 5 потребителей данных По каждому показателю представлена информация, на основании которой сотрудники компании будут отслеживать качество данных: • название показателя • определение • SQL-запрос • правила расчета • бизнес-требование к качеству данных. Требований может быть от 1 до 10. Если по какому-то показателю требования к качеству невозможно определить, показатель заменяется новым • правило проверки соблюдения бизнес-требования 2. Описание текущего потока данных, с которыми работает Заказчик: • перечень исходных данных, на основе которых считаются показатели • промежуточные системы/файлы, через которые данные поставляются потребителю • алгоритм расчета или преобразования (если есть)

По каким критериям будут оценивать результат?

Задача считается выполненной качественно, если: • Описание каждого показателя соответствует требованиям раздела «Каким должен быть результат работы» • Время исполнения SQL-запроса не превышает 1 минуты • Описание каждого правила проверки бизнес-требований соответствует требованиям раздела «Каким должен быть результат работы»

В каком формате нужно представить результат?

Итоговый результат работы представляется в виде таблицы MS Excel с названиями столбцов: показатель, определение, SQL-запрос, правила расчета, бизнес-требование к качеству данных, правило проверки соблюдения бизнес-требования Промежуточные результаты представляются в виде презентации в формате MS PowerPoint, которая наглядно показывает итоги недели, узкие места, цели на неделю и демоскрипты (промежуточные SQL-запросы, реализующие неполный функционал)

Понадобится ли команда?

Да, для этого проекта нужны два исполнителя: аналитик данных и архитектор/инженер данных. За каждую роль предусмотрено денежное вознаграждение в размере 150 тыс. рублей после выплаты налогов

До какой даты можно откликнуться на проект?

Отклики принимаются до 01.08.2019