Проект стартовал

Разработка прототипа системы определения барьеров производственной безопасности

Направления деятельности

  • Разработка
  • Промышленная безопасность

Приём откликов

до 13 ноября 2020

Сроки работы

2 месяца

В чем суть проекта?

Требуется разработать прототип системы, анализирующей сообщения от систем безопасности.

Расскажите о задаче подробнее

Одна из целей компании «Газпром нефть» — повышение производственной безопасности и сокращение количества прецедентов в подразделениях компании, дочерних обществах и подрядных организациях. Для этого используются в том числе различные информационные системы, где фиксируются причины прецедентов и хранятся отчеты о них, написанные на естественном языке. Впоследствии специалисты по промышленной безопасности должны проанализировать отчеты, чтобы выяснить: • встраивается ли прецедент в существующую классификацию; • насколько эффективно работает спроектированный барьер, призванный снизить количество соответствующих прецедентов. Чтобы собрать, классифицировать и проанализировать накопившийся в информационных системах объем записей об опасных действиях и условиях, в компании разрабатывается специализированный инструмент. Его внедрение позволит компании повысить достоверность данных, на основании которых принимаются решения в сфере производственной безопасности. В рамках НИОКР уже разработан прототип инструмента. Вам предстоит доработать его и разработать модель данных (логическую и физическую).

Понадобится ли команда?

Да, проект рассчитан на то, что им будут заниматься два человека, которые присоединятся к команде компании-заказчика: • фулстек-разработчик; • аналитик данных. Со стороны команды заказчика наиболее тесное взаимодействие предполагается с техническим руководителем (tech lead) и специалистом по анализу и обработке данных (data scientist).

Что предстоит сделать?

Оба специалиста должны: 1. Изучить материалы, предоставленные лидером проекта: программный код текущей версии прототипа, документацию на него, датасет описаний прецедентов. 2. Участвовать в регулярных встречах команды проекта и планировании работ. Аналитику предстоит: 1. Разметить датасет. 2. Валидировать разметку по контрольной выборке совместно с экспертами компании-заказчика. 3. Разработать предложения по аугментации данных. 4. Участвовать в валидации продуктов проекта. Фулстек-разработчику предстоит: 1. Разработать микросервисы на основании моделей данных, предоставленных лидером проекта. 2. Разработать фронтенд приложения в соответствии с бэклогом.

Что представляет собой результат работы?

1. Работающий в Docker сервис с регистрацией и авторизацией пользователей, полным логированием истории действий пользователей, работой с БД и моделями. 2. Исходный код сервиса в форматах *.python, *.js. 3. Инструкция к программному обеспечению в форматах *.pdf, *.md. 4. Размеченный датасет в форматах *.csv, *.xlsx. 5. Провалидированный датасет в форматах *.csv, *.xlsx.

По каким критериям будут оценивать результат?

1. Сервис можно полностью развернуть в докер. 2. Вся история действий пользователей логируется в БД; 3. Внутри поднимается микросервис модели, с которым работа происходит по REST; 4. Есть возможность вносить изменения в работу сервиса, в его результаты. Изменения также должны логироваться. 5. Всего размечено не менее 10 000 прецедентов; 6. Размечено по 200 примеров по каждому из 25 барьеров. Если примеров не хватает, сформированы искусственные случаи; 7. Валидированы с экспертами 2500 примеров; 8. Созданы скрипты для обработки данных от исходного документа до объекта pandas.DataFrame (в идеальном случае — до записи в БД) с нормализованными и токенизированными данными.

Что можно получить за этот проект?

Проект предусматривает денежное вознаграждение в размере 455 054 рублей после выплаты налогов, в том числе: • 261 000 рублей для фулстек-разработчика; • 194 054 рублей для аналитика данных.

На какую помощь можно рассчитывать?

1. Вы получите существующий программный код приложения, техническую документацию. 2. Эксперты компании-заказчика протестируют промежуточные версии приложения.