до 12 мая 2022
2 месяца
По договорённости
Необходимо разработать, проверить и защитить алгоритм статистического анализа промысловых данных в нефтегазовой сфере, реализованный на языке Python.
Чтобы моделировать жизненный цикл своих объектов (нефтяных скважин, геологических пластов и залежей) и прогнозировать эффект применения на объектах тех или иных технологий, компания «Газпромнефть-Салым» использует статистическую модель анализа промысловых данных и оценки нетрадиционных запасов, разработанную для Пальяновского месторождения. Ключевой недостаток этой модели в том, что она учитывает только факторы технологического дизайна скважины, из-за чего не может точно моделировать гидроразрывы пласта. Необходимо разработать для этих целей новую модель с использованием языка программирования Python и готовых библиотек программного кода таким образом, чтобы она:
· учитывала новые данные по уже используемым факторам и целевым переменным;
· учитывала внешние факторы, влияющие на продуктивность скважины (параметры геологии и т. п.);
· опиралась на продуктивные алгоритмы и передовые качественные инструменты статистического анализа и моделирования;
· оперативно обеспечивала достоверные результаты.
Лидер проекта ищет математика-аналитика, который сможет решить эту задачу.
На первом этапе:
· Презентация результатов анализа исходных данных и моделирования в формате PowerPoint (*.pptx).
· База данных для дальнейшей работы в формате Excel (*.xslx).
На втором этапе:
· Скрипт статистической модели на языке Phyton, использующий дисперсионный анализ, регрессию, корреляционный анализ.
· Описание алгоритма работы модели в формате *.txt.
· Инструкция пользователя по работе с моделью.
· Аналитический отчет о выборе метода регрессии в формате презентации PowerPoint (*.pptx).
На третьем этапе:
· Скрипт статистической модели, доработанный по замечаниям лидера проекта.
На четвертом этапе:
· Программный код статистической модели в формате Jupyter Notebook.
· Отчет о выполненной работе, описывающий требования к модели, согласованные с лидером проекта в ходе проекта, и полученные результаты.
· Обзор и аналитический отчет о выборе методов анализа для построения модели.
· Презентация с ключевыми выводами о наиболее подходящих методиках расчета и перечнем результатов выполненных работ в формате PowerPoint (*.pptx).
· Успешная защита проекта перед лидером проекта в онлайн-формате.
1. Статистическая модель использует современные методы статистики и машинного обучения (как минимум дисперсионный анализ, регрессию, корреляционный анализ).
2. Проанализированы методологии моделирования из различных источников информации (не менее 10 источников), в том числе полученных от лидера проекта.
3. Оформление исходного кода модели соответствует требованиям официального руководства по написанию программного кода на Python — PEP 8.
4. Все документы соответствуют полученным шаблонам.
Вы получите вознаграждение, о котором договоритесь с лидером проекта (160 000 - 200 000 рублей после выплаты налогов).