Проект завершен

Оценка и доработка алгоритмов анонимизации промысловых данных

Сферы деятельности

  • Разработка ПО

Приём откликов

до 16 февраля 2021

Сроки работы

1 месяц 20 дней

Бюджет

200 000 ₽

В чем суть проекта?

Требуется оценить алгоритм анонимизации данных, опираясь на мировой опыт организации площадок обмена большими данными, и составить требования к его доработке.

Расскажите о задаче подробнее

Компания «Газпром нефть» разрабатывает современные модели для прогнозирования эффективности работы нефтегазовых месторождений, которые помогают инженерам-нефтяникам принимать решения. Эти модели используют технологии Data Science и машинного обучения. Использование промысловой информации с похожих месторождений помогло бы расширить выборку исходных данных для обучения и тестирования моделей, поэтому компания предполагает создавать площадки для обмена данными между нефтяными компаниями, вузами и нефтесервисными компаниями. При этом в силу специфики деятельности участников площадки передача третьим лицам неанонимизированных данных может быть запрещена, поэтому в компании разрабатывается алгоритм анонимизации данных. Необходимо проверить, соответствует ли этот алгоритм анонимизации мировым стандартам и требованиям экспертов и при необходимости внести предложения по его доработке.

Понадобится ли команда?

Нет, проект рассчитан на то, что им будет заниматься один человек — аналитик.

Что предстоит сделать?

1. Изучить мировой опыт организации площадок обмена данными и анонимизации данных. 2. Ознакомиться с образцами промысловых данных, предполагаемых к обмену. 3. Взять интервью у лидера и экспертов проекта, чтобы проанализировать требования к алгоритму анонимизации промысловых данных. 4. По итогам интервью и анализа мирового опыта составить перечень требований к алгоритму анонимизации. 5. Протестировать алгоритм, чтобы проверить, что он отвечает этим требованиям. 6. Если будут обнаружены несоответствия, сформулировать задание на доработку. 7. Сформулировать предложения по дальнейшему развитию площадки обмена данными.

Что представляет собой результат работы?

1. Отчет в формате *.docx, который содержит: • обзор мирового опыта создания площадок обмена данными в различных сферах; • результаты тестирования алгоритма анонимизации и при необходимости рекомендации по его доработке; • предложения по дальнейшему развитию площадки обмена данными. 2. Презентация в формате *.pptx объемом 10–50 слайдов. 3. Краткая версия презентации в формате *.pptx с основными выводами по результатам работы. Итоговое содержание и объем отчета и презентации вы согласуете с лидером проекта.

По каким критериям будут оценивать результат?

1. Рассмотрены и проанализированы как минимум 2 примера площадок обмена данными. 2. Результаты тестирования алгоритмов анонимизации позволяют принять решение о выборе оптимального алгоритма. 3. Предложения по дальнейшему развитию площадки учитывают накопленный опыт и согласованы с командой. 4. Отчет имеет ясную логику и структуру. 5. Все выводы обоснованы и подтверждены ссылками на конкретные источники информации.

Что можно получить за этот проект?

Проект предусматривает денежное вознаграждение в размере 200 000 руб. после выплаты налогов.

На какую помощь можно рассчитывать?

Лидер проекта предоставит вам образцы промысловых данных, а также организует оперативное взаимодействие с экспертами.

Выбрать роль