- Project_HH_DataCleaning.ipynb - ноутбук проекта
- outliers.py - библиотека процедур поиска выбросов в данных
Google Disk, директория /data, содержит файлы:
- dst-3.0_16_1_hh_database.csv - данные соискателей HH
- ExchangeRates.csv - курсы обмена валют
- Python 3.10.6
- pandas 1.5.1
- numpy 1.23.4
- matplotlib 3.6.1
- seaborn 0.12.1
- plotly 5.11.0
- Создать директорию проекта.
- Инициировать локальный репозиторий и скачать файлы проекта: git init git remote add origin https://github.com/tvk2772/HH_DataCleaning.git git branch -M master git pull origin master
- Скачать файлы данных и разместить их в поддиректории /data основной директории проекта
- Запустить проект
диаграммы проекта, построенные при помощи библиотеки plotly:
- Гистограмма распределения опыта работы соискателей
- Коробчатая диаграмма распределения опыта работы соискателей
- Гистограмма распределения желаемой заработной платы
- Коробчатая диаграмма распределения желаемой заработной платы
- Диаграмма зависимости медианной зарплаты от готовности к переезду и/или к командировкам
- Диаграмма зависимости медианной зарплаты от уровня образования
- Диаграмма распределения медианной зарплаты по городам
- Диаграмма распределения заработной платы в зависимости от пола и возраста