Skip to content

Предоставлен файл с сервера. Вам нужно спарсить его содержимое, создать базу данных под данные, вставить данные в базу данных, удаленно подключиться к базе данных и проанализировать данные.

AnvarShagvaleev/AnalysisOfWebLogs

Repository files navigation

AnalysisOfWebLogs

Предоставлен файл с сервера. Вам нужно спарсить его содержимое, создать базу данных под данные, вставить данные в базу данных, удаленно подключиться к базе данных и проанализировать данные.

Описание задачи

Имеется книжный Интернет-магазин с простой структурой:
index.phtml - главная страница
|--catalog.phtml - сценарий просмотра каталога
|--search.phtml - сценарий поиска
|--addbasket.phtml?id_book=NN - сценарий добавления в корзину книги с номером NN
|--order.phtml - сценарий оформления заказа
Нам предоставили лог-файл с Web-сервера Apache с данными за месяц работы интернет-магазина access.log.

Необходимо выполнить следующее:

  1. Распарсить данные файла access.log используя python;
  2. Создать БД, используя СУБД Postgresql;
  3. Залить распарсенные данные в БД;
  4. Подключиться к БД через Python;
  5. Ответить на вопросы из списка ниже:
    • Сколько посетителей было на сайте за месяц?
    • Сколько в среднем посетителей бывает за час?
    • Сколько посетителей сделало заказы?
    • Сколько страниц просмотрел посетитель в среднем, максимум, минимум?
    • Сколько времени прошло с момента входа на сайт до оформления заказа, в среднем, максимум, минимум?
    • Сколько в среднем заказов оформляется за день?
    • Имеются ли какие-то взаимозависимые товары, которые покупатель кладет в корзину (например, с уровнем поддержки выше 0.01 и достоверностью выше 0.6)? (Задача поиск ассоциативных правил).

About

Предоставлен файл с сервера. Вам нужно спарсить его содержимое, создать базу данных под данные, вставить данные в базу данных, удаленно подключиться к базе данных и проанализировать данные.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published