Skip to content

RomanKyrychenko/Q-Q-training

Repository files navigation

Web Content Mining

Курс, присвячений отриманню структурованого контенту з веб-ресурсів для його подальшого аналізу

Для освоєння бази. Достатньо і одного пункту з нижче поданих, головне зрозуміти суть основних трьох типів даних

Важливо зрозуміти сутність форматів даних в R. Це розуміння є запорукою того, що ми зможемо потім їх переконвертувати в найбільш зручний для аналізу формат!

З розумінням вектору ще, відчуваю, проблеми через шкільний курс математики і фізики. Там вектор має дещо інше значення. Наше розуміння вектору описане тут - https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%B8%D0%B7%D0%BD%D0%B0%D0%BA%D0%BE%D0%B2%D0%BE%D0%B5_%D0%BE%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5 Список - дерево даних (з різною кількістю гілочок різного розміру і цими гілочками в кінці-кінців, якщо повністю розгорнути дерево, є вектори). Дата фрейм - аналог таблички в Excel.