Помещен в архив

Разработка алгоритмов автоматической классификации наименований в перечне МТР

Сферы деятельности

  • Добыча полезных ископаемых
  • Бурение
  • Разведка

Приём откликов

до 16 июля 2021

Сроки работы

1 месяц 1 день

Бюджет

160 000 ₽

В чем суть проекта?

Требуется провести автоматическую классификацию наименований перечня МТР для анализа свободных запасов.

Расскажите о задаче подробнее

Компания АО «Мессояханефтегаз» — совместное предприятие ПАО «Газпром нефть» и ПАО «НК „Роснефть”», которому принадлежат лицензии на разведку и разработку Восточно-Мессояхского и Западно-Мессояхского нефтегазоконденсатных месторождений. Для увеличения производительности компании-заказчику требуется детальный учет позиций материально-технических ресурсов (МТР), находящихся на складе или в стадии закупки. Для этого необходимо постоянно актуализировать спецификации и описания, поступающие от проектных институтов, и сопоставлять их со спецификациями МТР, уже находящихся на складе. Из-за масштабности проекта и различных подходов проектных институтов к классификации и наименованию МТР этот процесс очень неэффективен — специалисты нескольких подразделений компании вручную компонуют данные из нескольких Excel таблиц, классифицируют и сопоставляют их. Для снижения трудоемкости процесса в компании разрабатывается специализированный цифровой продукт, позволяющий решить задачу автоматической классификации терминов МТР. Для этого требуется подобрать алгоритмы классификации и реализовать их в виде программного кода, который затем можно будет использовать в составе цифрового продукта.

Понадобится ли команда?

Нет, проект рассчитан на то, что им будет заниматься один специалист — математик-программист.

Что предстоит сделать?

1. Обсудить с лидером проекта математическую постановку задачи. 2. Провести первичный анализ предоставленного набора данных и подготовить датасет. 3. Выбрать и согласовать с лидером проекта наиболее подходящие для задачи алгоритмы автоматической классификации терминов. 4. Реализовать согласованный алгоритм на языке C#. 5. Провести классификацию терминов МТР по предоставленному набору данных, используя разработанный алгоритм. 6. При необходимости внести корректировки в алгоритмы и программный код. 7. Передать лидеру проекта результаты работы и интеллектуальные права на них.

Что представляет собой результат работы?

1. Алгоритм предобработки данных и автоматической классификации терминов МТР, реализованный на языке C# (в формате проекта Visual Studio Code). 2. Аналитическая записка в свободной форме с описанием использованных в решении задачи методов обработки данных, математических моделей и алгоритмов автоматической классификации в формате *.docx.

По каким критериям будут оценивать результат?

1. Разработанный код полностью решает математическую задачу автоматической классификации: определены классы для 100% терминов МТР, имеющихся в предоставленном лидером проекта наборе данных, классификатор позволяет сформировать справочник материалов. 2. Описание методов обработки данных и алгоритмов позволяет воспроизвести или модифицировать решение другому специалисту с профильным образованием или схожими компетенциями.

Что можно получить за этот проект?

Проект предусматривает денежное вознаграждение в размере 160 000 рублей после выплаты налогов.

На какую помощь можно рассчитывать?

1. Лидер проекта предоставит набор данных, содержащий 400 000 записей терминов и классификаторов МТР в формате *.xlsx. 2. Лидер проекта организует взаимодействие с другими участниками проекта со своей стороны и даст комментарии, пояснения и консультации по предметной области проекта по ходу выполнения работ.

Выбрать роль