Skip to content
View egorumaev's full-sized avatar
  • Omsk
  • 06:50 (UTC -12:00)
Block or Report

Block or report egorumaev

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
egorumaev/README.md

Привет) 👋

РЕЗЮМЕ


ПРОФЕССИОНАЛЬНАЯ ПЕРЕПОДГОТОВКА


КУРСЫ


"Курсы, пройденные на портале STEPIK"


НАВЫКИ

Python 3 Git Jupiter Notebook PostgreSQL MySQL
SQLite DataLens Redash Pandas Numpy
SciPy Scikit-learn Catboost LightGBM XGBoost
Matplotlib Seaborn A/B-тесты

ВЫПОЛНЕННЫЕ ПРОЕКТЫ

Название Цель Библиотеки Технологии
1 «SQLite & PostgreSQL. Анализ данных в Google Colab» провести анализ данных с помощью SQLite и PostgreSQL в Google Colab Sqlite3, SQLAlchemy, Pandas, Missingno, Matplotlib SQLite, PostgreSQL, ElephantSQL, оконные функции, Google Colab, Google Drive
2 «Прогнозирование исхода лечения цирроза печени – Prediction of Cirrhosis Outcomes» (Kaggle) предсказание вероятности исхода лечения пациентов с циррозом печени (задача мультиклассификации) Pandas, Numpy, Matplotlib, Seaborn, Missingno, Dataprep, Phik, Category_encoders, Sklearn, Imblearn, Catboost, XGBoost IQR (Interquartile Range), PCA (Principal component analysis), LDA (Linear Discriminant Analysis), t-SNE (T-distributed Stochastic Neighbor Embedding), Feature Engineering, Polynomial Features, Pipeline, VarianceThreshold, SMOTETomek
3 «Турникеты» (Open Data Science) на основе накопленных данных идентифицировать посетителя в зависимости от характерного времени его прохода на территорию организации, исключив вероятность передачи пропуска одним сотрудником другому (задача мультиклассификации) Pandas, Numpy, Random, Matplotlib, Seaborn, Datetime, Sklearn, Imblearn, CatBoost Feature Engineering, Polynomial Features, SelektKBest, GridSearchCV, RandomizedSearchCV, Pipeline, OneVsRestClassifier, confusion_matrix
4 «Разработка модели машинного обучения для предсказания температуры стали для оптимизации производственных расходов металлургического комбината „Так закаляем сталь‟» (Яндекс.Практикум) разработка модели машинного обучения, предсказывающей температуру стали, выплавляемой на металлургическом комбинате «Так закаляем сталь» (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, DateTime, Phik, Sklearn, Imblearn, Feature_Engine, Catboost, Xgboost, Lightgbm Pipeline, Feature Engineering, RandomizedSearchCV, PolynomialFeatures, MinMaxScaler, DropCorrelatedFeatures, SelektKBest, VotingRegressor, background_gradient
5 «Разработка модели машинного обучения для прогнозирования оттока клиентов оператора связи „Ниединогоразрыва.ком‟» (Яндекс.Практикум) разработка модели машинного обучения, прогнозирующей возможный отток клиентов (задача классификации) Pandas, Numpy, Matplotlib, Seaborn, Skimpy, Datetime, ydata-profiling, Psutil, Phik, Sklearn, Imblearn, Catboost, Xgboost, LightGBM Pipeline, Feature Engineering, RandomizedSearchCV, MinMaxScaler, mutual_info_regression, Mutual Information, OneHotEncoder, OrdinalEncoder, MinMaxScaler, SelectKBest, chi2, VotingClassifier, confusion_matrix, background_gradient
6 «Определение возраста покупателей» (Яндекс.Практикум) построение модели, которая по фотографии определит приблизительный возраст человека (задача регрессии для Computer Vision) Pandas, Numpy, Matplotlib, Seaborn, PIL, Tensorflow, Keras Yandex Compute Cloud
7 «Выявление токсичных комментариев в отзывах покупателей интернет-магазина „Викишоп‟» (Яндекс.Практикум) построение модели классификации комментариев пользователей на позитивные и негативные (задача классификации для Natural Language Processing / NLP) Pandas, Numpy, Matplotlib, Seaborn, Autocorrect, Contractions, Gc, Collections, Re, NLTK, Sklearn, Catboost Pipeline, RandomizedSearchCV, TfidfVectorizer, CountVectorizer, ngram_range
8 Задача «Классификация тональности текста» (Яндекс.Практикум) обучение логистической регрессии для определения тональности текста (задача классификации для Natural Language Processing / NLP) Pandas, NLTK, Sklearn Google Drive
9 «Прогнозирование количества заказов такси на следующий час для компании „Чётенькое такси‟» (Яндекс.Практикум) построение модели, предсказывающей количество заказов такси на следующий час (задача регрессии для Time Series) Pandas, Numpy, Matplotlib, Seaborn, Statsmodels, Sklearn, Catboost, LightGBM seasonal_decompose, TimeSeriesSplit, RandomizedSearchCV
10 «Определение рыночной стоимости автомобилей» (Яндекс.Практикум) разработка модели машинного обучения, предсказывающей рыночную стоимость автомобиля (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Joypy, Skimpy, Datetime, Sklearn, Feature-engine, Catboost, LightGBM KNNImputer, SimpleImputer, OneHotEncoder, OrdinalEncoder, MinMaxScaler, DropCorrelatedFeatures, SelectKBest, mutual_info_regression, make_scorer, RandomizedSearchCV
11 «Защита персональных данных клиентов страховой компании „Хоть потоп‟» (Яндекс.Практикум) разработка метода преобразования данных, гарантирующего одновременно невозможность восстановления персональной информации и высокое качество моделей машинного обучения, использующих обезличенные персональные данные Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn
12 «Разработка модели, предсказывающей коэффициент восстановления золота из золотодобывающей руды для группы компаний „Цифра‟» (Яндекс.Практикум) подготовка прототипа модели машинного обучения, предсказывающей коэффициент восстановления золота из золотосодержащей руды (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Torchmetrics, Joypy, Sklearn Symmetric Mean Absolute Percentage Error, make_scorer, RandomizedSearchCV
13 «Поиск локации для скважины для ПАО „ГлавРосГосНефть‟» (Яндекс.Практикум) определение региона, где добыча нефти принесёт наибольшую прибыль (задача регрессии) Pandas, Numpy, Matplotlib, Seaborn, Phik, Sklearn Анализ возможной прибыли и рисков с помощью техники Bootstrap
14 «Предсказание оттока клиентов из банка» (Яндекс.Практикум) построение модели машинного обучения, предсказывающей отток клиентов из банка (задача классификации) Pandas, Numpy, Random, Matplotlib, Seaborn, Skimpy, Imbalanced-learn, Phik, Collections, Tqdm, Sklearn SMOTE, ADASYN, RandomUnderSampling, SMOTETomek, OneHotEncoder, OrdinalEncoder, StandardScaler, mutual_info_regression, SelectKBest, GridSearchCV
15 «Рекомендация тарифов» (Яндекс.Практикум) на основе данных о поведении клиентов оператора мобильной связи 'Мегалайн', уже перешедших на новые тарифы 'Smart' и 'Ultra', построить модель для классификации пользователей в зависимости от используемого ими тарифа (задача классификации) Pandas, Numpy, Matplotlib, Seaborn, Tqdm, Sklearn GridSearchCV
16 «Интернет-магазин „Стримчик‟» (Яндекс.Практикум) на основе исследования информации из открытых источников выявить факторы и закономерности, определяющие успех выпуска компьютерной игры при планировании вывода на рынок новой компьютерной игры и оптимизации бюджета рекламной компании Pandas, Numpy, Random, Matplotlib, Seaborn, Scipy
17 «Исследование объявлений о продаже квартир в Санкт-Петербурге и Ленинградской области» (Яндекс.Практикум) проведение исследовательского анализа данных датасета с объявлениями о продаже квартир Pandas, Numpy, Random, Matplotlib, Seaborn

Popular repositories

  1. 2022-realty-spb 2022-realty-spb Public

    Исследование объявлений о продаже недвижимости

    Jupyter Notebook

  2. 2022-computer-games-sales 2022-computer-games-sales Public

    Анализ мирового рынка продаж компьютерных игр

    Jupyter Notebook

  3. 2022-telekom-tarif-recomendation 2022-telekom-tarif-recomendation Public

    Классификация пользователей в зависимости от используемого тарифа телеком-оператора

    Jupyter Notebook

  4. 2022-bank-customers-churn 2022-bank-customers-churn Public

    Предсказание оттока клиентов из банка

    Jupyter Notebook

  5. 2022-location-oil-well 2022-location-oil-well Public

    Поиск локации для нефтяной скважины

    Jupyter Notebook

  6. 2022-gold-recovery-prediction 2022-gold-recovery-prediction Public

    Предсказание коэффициента восстановления золота из золотодобывающей руды

    Jupyter Notebook