Skip to content

kiprenko/machine-learning-purple

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Лабораторная работа по машинному обучению

Работа была выполнена с помощью Jupyter Notebook
Слово purple в имени репозитория нужно лишь как отличительная черта этого репозитория от остальных, в будующем возможных, репозиториев по machine learning.

Задание от преподавателя

  • Построить распределение жанров по рейтингу, прибыльности, лайкам
  • Найти топ 20 связок (если такие есть) актер-режиссер, которые дают больше денег в прокате
  • Указать, фильмы из какой страны имеют лучший средний рейтинг. Проанализировать ответ и аргументировать вердикт
  • Какой сюжет в среднем содержат фильмы жанра драма (plot_keywords). Есть ли у этих фильмов общий сюжетный ход.
  • Влияет ли возрастной рейтинг на бюджет фильма
  • Самое интересное - я целенаправленно внес некоторые некорректные данные (несуществующий фильм или фильмы или фичи) - надо его (их) найти. НЕ ВРУЧНУЮ. Можно вывести все плохие фильмы в виде списка, а потом удалить из датасета. То же самое с фичей (фичами). Более качественно очищенный датасет дает более качественный результат модели. После очистки датасета провести вышеперечисленные пункты еще раз, сравнить результаты в зависимости от кол-ва найденных фильмов. Точное число испорченных лично мною образцов (ячеек / строк / столбцов).

Author 🦝

About

This repository contains my machine learning laboratory work from the 4th course of Computer Science in KhNU by the name of V. N. Karazin.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published