до 07 апреля 2020
4 месяца
435 000 ₽
Необходимо разработать, проверить и защитить концепцию функционального математического алгоритма для анализа промысловых данных в нефтегазовой сфере
Сейчас процесс анализа промысловых данных в компании «Газпром нефть» имеет ряд недостатков: • устаревший и малоэффективный инструментарий; • непрозрачность работы текущих алгоритмов; • недостаток автоматизации и связанная с этим высокая частота критичных ошибок, вызванных человеческим фактором; • высокая сложность и большие трудозатраты на обработку, анализ и интерпретацию результатов при разборе массивов данных с большой вариативностью. Необходимо доработать и оптимизировать этот процесс, разработав прототип, который: • использует продуктивные алгоритмы и передовые качественные инструменты — статистические модели и методики (минимальный набор инструментов: регрессия, корреляционный анализ); • помогает качественно прогнозировать эффективность применения технологий и наглядно представлять жизненный цикл объектов бизнес-отрасли, таких как нефтяные скважины, геологические пласты и залежи; • оперативно обеспечивает достоверный результат; • использует платформу Python и дополнительные библиотеки.
Проект реализуется в четыре этапа На первом этапе вам предстоит погрузиться в задачу, выполнить предварительный анализ данных, очистить их и построить несколько статистических моделей с использованием библиотек pandas/NumPy/statsmodels. Результаты этого этапа помогут Заказчику поставить достижимые цели по созданию более сложных алгоритмов На втором этапе вы реализуете более сложные модели и сопроводите их визуализацией, а также подготовите аналитический отчета о выборе моделей регрессии и составите инструкцию по работе с прототипом На третьем этапе вы доработаете прототип по замечаниям Заказчика На четвертом, заключительном этапе вы подготовите презентацию и отчеты о выполненной работе и защитите проект
1. Общий отчет о выполненной работе, в котором описаны требования, согласованные с Заказчиком в ходе проекта, и полученные результаты. 2. Обзор методов регрессионного анализа. 3. Аналитический отчет о выборе моделей регрессии. 4. Программный код. 5. Инструкция по проведению анализа. 6. Прототип приложения. 7. Презентация с ключевыми выводами и результатами. Прототип должен представлять собой автономное приложение, которое написано на языке Python с использованием библиотек с открытым исходным кодом (pandas/statsmodels/NumPy/scikit-learn и т. п.) и реализует следующую общую логику работы: 1. Принимает блок слабоструктурированных, разрозненных и объемных данных в заранее оговоренном формате (XLSX, CSV) 2. Прогнозирует добычу для скважин, отработавших менее 180 дней, чтобы дополнить матрицы 3. Определяет корреляционные зависимости, вычисляет связи, выявляет признаки, находит кривые, формирует трендовые цепочки либо констатирует отсутствие таких цепочек 4. Экспортирует результаты обработки в заранее оговоренном формате (XLSX, CSV) и с заранее оговоренной
• Текстовые документы (отчеты, обзоры, инструкции) представляются в формате MS Word • Исходный программный код на языке Python представляется в формате простого текста • Прототип приложения передается в формате исполняемого файла • Презентация с ключевыми выводами и результатами представляется в формате MS PowerPoint
1. Приложение является самостоятельным решением с высокой степенью автономности. 2. Прототип приложения позволяет пользователю выбрать модель расчета, настроить параметры модели, задать условия завершения расчета и его точность, настроить вывод верхних N строк в ранжированном наборе выходных данных. 3. Исходный код оформлен в соответствии с официальным руководством по написанию программного кода на Python — PEP 8. 4. Исходный код оформлен в соответствии с правилами написания ПО с открытым исходным кодом для дальнейшего сопровождения на стороне Заказчика. 5. Также предполагается разработка базового пользовательского интерфейса для конфигурации приложения и работы с ним (Jupyter Notebook). 6. Дополнительно со стороны Заказчика будет предоставлен список объектов-справочников предметной области с соответствующим атрибутивным составом и связями, а также правила-основы алгоритмов для построения математической модели и разрабатываемого аппарата и описание логической доменной модели объектов предметной области
Проект рассчитан на одного человека со специализацией инженера-математика