до 16 февраля 2021
1 месяц 20 дней
200 000 ₽
Требуется оценить алгоритм анонимизации данных, опираясь на мировой опыт организации площадок обмена большими данными, и составить требования к его доработке.
Компания «Газпром нефть» разрабатывает современные модели для прогнозирования эффективности работы нефтегазовых месторождений, которые помогают инженерам-нефтяникам принимать решения. Эти модели используют технологии Data Science и машинного обучения. Использование промысловой информации с похожих месторождений помогло бы расширить выборку исходных данных для обучения и тестирования моделей, поэтому компания предполагает создавать площадки для обмена данными между нефтяными компаниями, вузами и нефтесервисными компаниями. При этом в силу специфики деятельности участников площадки передача третьим лицам неанонимизированных данных может быть запрещена, поэтому в компании разрабатывается алгоритм анонимизации данных. Необходимо проверить, соответствует ли этот алгоритм анонимизации мировым стандартам и требованиям экспертов и при необходимости внести предложения по его доработке.
Нет, проект рассчитан на то, что им будет заниматься один человек — аналитик.
1. Изучить мировой опыт организации площадок обмена данными и анонимизации данных. 2. Ознакомиться с образцами промысловых данных, предполагаемых к обмену. 3. Взять интервью у лидера и экспертов проекта, чтобы проанализировать требования к алгоритму анонимизации промысловых данных. 4. По итогам интервью и анализа мирового опыта составить перечень требований к алгоритму анонимизации. 5. Протестировать алгоритм, чтобы проверить, что он отвечает этим требованиям. 6. Если будут обнаружены несоответствия, сформулировать задание на доработку. 7. Сформулировать предложения по дальнейшему развитию площадки обмена данными.
1. Отчет в формате *.docx, который содержит: • обзор мирового опыта создания площадок обмена данными в различных сферах; • результаты тестирования алгоритма анонимизации и при необходимости рекомендации по его доработке; • предложения по дальнейшему развитию площадки обмена данными. 2. Презентация в формате *.pptx объемом 10–50 слайдов. 3. Краткая версия презентации в формате *.pptx с основными выводами по результатам работы. Итоговое содержание и объем отчета и презентации вы согласуете с лидером проекта.
1. Рассмотрены и проанализированы как минимум 2 примера площадок обмена данными. 2. Результаты тестирования алгоритмов анонимизации позволяют принять решение о выборе оптимального алгоритма. 3. Предложения по дальнейшему развитию площадки учитывают накопленный опыт и согласованы с командой. 4. Отчет имеет ясную логику и структуру. 5. Все выводы обоснованы и подтверждены ссылками на конкретные источники информации.
Проект предусматривает денежное вознаграждение в размере 200 000 руб. после выплаты налогов.
Лидер проекта предоставит вам образцы промысловых данных, а также организует оперативное взаимодействие с экспертами.