Skip to content

tvk2772/HH_DataCleaning

Repository files navigation

Учебный проект по очистке данных соискателей агенства HH

выполнил: Кулакова Татьяна

Файлы проекта

  • Project_HH_DataCleaning.ipynb - ноутбук проекта
  • outliers.py - библиотека процедур поиска выбросов в данных

Размещение файлов данных

Google Disk, директория /data, содержит файлы:

  • dst-3.0_16_1_hh_database.csv - данные соискателей HH
  • ExchangeRates.csv - курсы обмена валют

Используемые инструменты

  • Python 3.10.6
  • pandas 1.5.1
  • numpy 1.23.4
  • matplotlib 3.6.1
  • seaborn 0.12.1
  • plotly 5.11.0

Инструкция по сборке проекта

  1. Создать директорию проекта.
  2. Инициировать локальный репозиторий и скачать файлы проекта: git init git remote add origin https://github.com/tvk2772/HH_DataCleaning.git git branch -M master git pull origin master
  3. Скачать файлы данных и разместить их в поддиректории /data основной директории проекта
  4. Запустить проект

Дополнение

диаграммы проекта, построенные при помощи библиотеки plotly:

About

HH applicant data research, cleaning and outliers detecting

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published