Skip to content

Домашние задания и лекции по курсу "Python для анализа данных" в Netology https://netology.ru/programs/python-for-analytics

Notifications You must be signed in to change notification settings

romanshalimov/python_analytics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📜 Лекции и домашние задания по курсу "Python для анализа данных"

Python
  1. Условные конструкции
  2. Регулярные выражения
  3. Поиск групп в ВК. Подсчёт лайков, репостов и их фильтрация. List и dict comprehension
  4. Функции. Args and Kwargs. Lambda-функции, итераторы, map, filter.
  5. Чтение файлов. Кодировки. Конструкция .strip().split(','). Контекстный менеджер. Чтение списков и словарей из файла. Модуль pickle и запись объекта сразу в файл, как поток байтов.
  6. Исключения и ошибки. Как сделать, чтобы цикл с расчётом не падал каждый раз. Замечания про try-except. Даты.
  7. Классы. Демо-счетчик Яндекс.Метрики.
  8. Лабораторная работа
Pandas
  1. Библиотека Numpy. Метрики схожести текстов (расстояние Хемминга - число различающихся символов у строк одинакового размера). Расстояние Левенштейна. Библиотека векторного представления слов Word2vec.
  2. Где собирать логи. Ставим Docker desktop. Устанавливаем образ Clickhouse. Запись данных Pandahouse
  3. Pandas. Логические условия. Забор данных с сайта BeautifulSoup. Отдельный столбец (тип Series). Сортировка. Inplace.
  4. Автоматизация авторизации с помощью библиотеки Selenium.
  5. Создание столбцов на ходу. Группировки и оконные функции. Группировки с пустыми значениями.
  6. Сводные таблицы. Объединение датафреймов по разным столбцам. Объединение нескольких датафреймов. Задача про LEFT JOIN. CROSS JOIN. Задачка с собеседований. Подвохи: дубликаты, ошибочное объединение. Запись датафрейма в базу данных. Чтение из базы. Построчная обработка.
  7. Парсинг сайта. Алгоритм экспоненциальной задержки.
Статистика
  1. Базовые понятия статистики
  2. Библиотеки по визуализации данных
  3. Теория вероятностей
  4. Корреляционный анализ и линейная регрессия
  5. Классификация и кластеризация
  6. A/B тестирование
  7. Кейс-стади
Нейронные сети / DataLens, PowerBI / Системная аналитика
  1. Нейронные сети 1
  2. Нейронные сети 2
  3. Нейронные сети 3
  4. Нейронные сети 4
  5. Datalens
  6. PowerBI
  7. Системная аналитика
Дипломная работа
  1. Дипломная работа