Skip to content

nguyenngocbinh/BMLB

Repository files navigation

Quick read for Data Sciences

Bao gồm các chủ đề quan trọng để phát triển kỹ năng và kiến thức trong lĩnh vực khoa học dữ liệu và phân tích dữ liệu.

01-Introduction

  • Giới thiệu về khoa học dữ liệu và vai trò của nó trong thế giới hiện đại.
  • Lý do tại sao khoa học dữ liệu là một lĩnh vực quan trọng.
  • Các nguyên tắc cơ bản và các khái niệm quan trọng trong khoa học dữ liệu.
  • Ngôn ngữ python
  • Ngôn ngữ R

02-Data Manipulation

  • Hướng dẫn cách trích xuất dữ liệu từ các nguồn khác nhau.
  • Xử lý, biến đổi và làm sạch dữ liệu.
  • Sử dụng các thư viện như Pandas trong Python để thao tác dữ liệu.

03-Data Visualization

  • Phân tích và trực quan hóa dữ liệu bằng các biểu đồ và biểu đồ khác nhau.
  • Sử dụng các công cụ như Matplotlib và Seaborn để tạo đồ thị.
  • Làm thế nào để trình bày thông tin dữ liệu một cách rõ ràng và hấp dẫn.

04-Basic Statistics

  • Các khái niệm cơ bản về thống kê, như trung bình, phương sai và độ lệch chuẩn.
  • Phân tích phân phối dữ liệu.
  • Ứng dụng các phương pháp thống kê trong khoa học dữ liệu.

05-Regression

  • Hướng dẫn về mô hình hồi quy và các loại hồi quy khác nhau.
  • Sử dụng mô hình hồi quy để dự đoán giá trị.
  • Đánh giá hiệu suất của mô hình hồi quy.

06-Timeseries

  • Làm thế nào để xử lý dữ liệu chuỗi thời gian.
  • Mô hình hóa và dự đoán xu hướng và mùa vụ trong dữ liệu chuỗi thời gian.
  • Sử dụng các thư viện như Time Series Analysis trong Python.

07-Panel Data Models

  • Giới thiệu về mô hình dữ liệu bảng và ứng dụng của chúng trong khoa học dữ liệu.
  • Làm thế nào để xử lý dữ liệu bảng có cấu trúc phức tạp.
  • Sử dụng mô hình dữ liệu bảng cho các vấn đề phức tạp.

08-Machine Learning

  • Tổng quan về học máy và các thuật toán học máy phổ biến.
  • Tiếp cận và giải quyết các vấn đề thực tế bằng học máy.
  • Đánh giá hiệu suất của các mô hình học máy.

09-Model Deployment

  • Cách triển khai các mô hình học máy vào sản phẩm hoặc ứng dụng thực tế.
  • Giới thiệu về các nền tảng triển khai mô hình như AWS, Azure, và Google Cloud.
  • Quản lý và duy trì mô hình đã triển khai.

10-Publication

  • Cách viết bài báo khoa học và báo cáo dự án trong lĩnh vực khoa học dữ liệu.
  • Làm thế nào để trình bày kết quả của dự án khoa học dữ liệu một cách chuyên nghiệp.

11-Git

  • Hướng dẫn về Git và quản lý phiên bản dự án.
  • Làm thế nào để làm việc với kho lưu trữ Git và GitHub.
  • Quy trình làm việc cộng tác trong nhóm sử dụng Git.

12-Docker

  • Giới thiệu về Docker và containerization.
  • Tạo và quản lý các container Docker cho các ứng dụng khoa học dữ liệu.
  • Triển khai ứng dụng trong các môi trường container Docker.

13-Database

  • Cơ sở dữ liệu và các loại cơ sở dữ liệu khác nhau (SQL, NoSQL, ...)
  • Làm thế nào để truy xuất dữ liệu từ cơ sở dữ liệu.
  • Sử dụng SQL và các thao tác cơ sở dữ liệu trong khoa học dữ liệu.

14-Web Scraping

  • Cách trích xuất dữ liệu từ các trang web bằng web scraping.
  • Sử dụng các thư viện như BeautifulSoup và Scrapy trong Python.
  • Xử lý dữ liệu trích xuất từ web để sử dụng trong khoa học dữ liệu.

15-Crypto

BMLB
├─ 01-Introduction
│  ├─ Index.md
│  └─ README.md
├─ 02-Data Manipulation
│  └─ README.md
├─ 03-Data Visualization
│  └─ README.md
├─ 04-Basic Statistics
│  ├─ README.md
│  └─ statistics.md
├─ 05-Regression
│  ├─ README.md
│  └─ Survival Analysis Basics.Rmd
├─ 06-Timeseries
│  ├─ history_of_timeseries_models.Rmd
│  ├─ holt-winters.Rmd
│  ├─ Multiple_Time_Series_Forecast.Rmd
│  ├─ README.md
│  └─ STL_decomposition.Rmd
├─ 07-Panel Data Models
│  └─ README.md
├─ 08-Machine Learning
│  └─ README.md
├─ 09-Model Deployment
│  └─ README.md
├─ 10-Publication
│  └─ README.md
├─ 11-Git
│  └─ README.md
├─ 12-Docker
│  └─ README.md
├─ 13-Database
│  ├─ README.md
│  └─ README.Rmd
├─ 14-Web Craping
│  └─ README.md
├─ 15-Blogdown
│  └─ blogdown_dev.R
├─ 99-Practice
│  ├─ 2. Scripts
│  │  └─ R
│  │     └─ push_data_to_db.R
│  ├─ Slides
│  │  ├─ css
│  │  │  ├─ nnb.css
│  │  │  ├─ tpb_background.PNG
│  │  │  └─ tpb_title_background.PNG
│  │  └─ xaringanthemer.Rmd
│  ├─ tuning_models_with_workflowsets.Rmd
│  └─ Vitae
│     ├─ mariecurie.jpg
│     ├─ packages.bib
│     ├─ twentysecondcv.cls
│     ├─ Vitae.Rmd
│     └─ Vitae.tex
├─ bml.lectures.Rproj
├─ dev
│  └─ templates
│     ├─ Power point
│     │  └─ facet.pptx
│     └─ Rmd
│        ├─ powerpoint.pptx
│        ├─ powerpoint.Rmd
│        ├─ r-presentation-figure
│        │  └─ unnamed-chunk-2-1.png
│        ├─ r-presentation.md
│        └─ r-presentation.Rpres
├─ images
│  ├─ b_hex.png
│  ├─ faylab-manual-quarto-yml.png
│  ├─ faylab-manual.png
│  ├─ github-action-green.png
│  ├─ github-action-orange.png
│  ├─ github-edit-readme.png
│  ├─ github-source-gh-pages.png
│  ├─ openscapes_hex.png
│  ├─ quarto-files-github.png
│  ├─ quarto-yml-site-side-by-side.png
│  ├─ quarto-yml-site-side-by-side2.png
│  ├─ rstudio-insert-citation-doi.png
│  └─ rstudio-insert-citation.png
├─ include-files.lua
├─ index.qmd
├─ LICENSE
├─ README.html
├─ README.md
├─ _quarto.yml
└─ _site
   ├─ images
   │  ├─ github-action-green.png
   │  ├─ github-action-orange.png
   │  ├─ github-edit-readme.png
   │  ├─ github-source-gh-pages.png
   │  ├─ openscapes_hex.png
   │  ├─ quarto-files-github.png
   │  └─ quarto-yml-site-side-by-side2.png
   ├─ index.html
   ├─ learning-more.html
   ├─ quarto-workflows
   │  ├─ browser.html
   │  ├─ images
   │  │  ├─ github-commit.png
   │  │  ├─ github-edit-index.png
   │  │  ├─ github-preview-show-diff.png
   │  │  ├─ jupyter-execute-cell.png
   │  │  ├─ jupyter-python-example.png
   │  │  ├─ jupyter-raw-chunk.png
   │  │  ├─ jupyter-side-by-side.png
   │  │  ├─ quarto-yml-site-side-by-side3.png
   │  │  └─ rstudio-orientation.png
   │  ├─ index.html
   │  ├─ jupyter.html
   │  └─ rstudio.html
   ├─ robots.txt
   ├─ search.json
   ├─ sitemap.xml
   ├─ site_libs
   │  ├─ bootstrap
   │  │  ├─ bootstrap-dark.min.css
   │  │  ├─ bootstrap-icons.css
   │  │  ├─ bootstrap-icons.woff
   │  │  ├─ bootstrap.min.css
   │  │  └─ bootstrap.min.js
   │  ├─ clipboard
   │  │  └─ clipboard.min.js
   │  ├─ quarto-html
   │  │  ├─ anchor.min.js
   │  │  ├─ popper.min.js
   │  │  ├─ quarto-syntax-highlighting-dark.css
   │  │  ├─ quarto-syntax-highlighting.css
   │  │  ├─ quarto.js
   │  │  ├─ tippy.css
   │  │  └─ tippy.umd.min.js
   │  ├─ quarto-nav
   │  │  └─ quarto-nav.js
   │  └─ quarto-search
   │     ├─ autocomplete.umd.js
   │     ├─ fuse.min.js
   │     └─ quarto-search.js
   └─ transition-from-rmarkdown.html

About

Personal book for Data Science

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published