Нужно решить, где бурить новую скважину для нефтяной компании. Предоставлены пробы нефти в трёх регионах: в каждом 10 000 месторождений, где измерили качество нефти и объём её запасов. Необходимо построить модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. Необходимо проанализировать возможную прибыль и риски техникой Bootstrap.
Шаги для выбора локации:
- В избранном регионе ищут месторождения, для каждого определяют значения признаков;
- Строят модель и оценивают объём запасов;
- Выбирают месторождения с самым высокими оценками значений. Количество месторождений зависит от бюджета компании и стоимости разработки одной скважины;
- Прибыль равна суммарной прибыли отобранных месторождений.
- Импорт библиотек и подготовка файлов
- Обучение и проверка модели
- Подготовка к расчету прибыли
- Расчет прибыли и убытков
- Общий Вывод
- Обучена модель (LinearRegression) и проверена на валидационной выборке;
- Рассчитаны прибыль и убытки с помощью доверительного интервала;
- Сделаны общие выводы и выбрана наиболее подходящая под запросы нефтяная скважина для разработки: #2.
matplotlib
, numpy
, pandas
, sklearn