Skip to content

Latest commit

 

History

History
103 lines (83 loc) · 1.57 KB

README.md

File metadata and controls

103 lines (83 loc) · 1.57 KB

高效学习方法 MAS

  • Muilti-Dimension 多角度
  • Ask 不懂就问
  • Sharing 最好的学习就是分享

数据分析多维度

  1. 基础概念
  2. 工具
  3. 题库

数据分析的三个重要组成部分

全景图

  • 数据采集

    • 数据源
      • 爬虫
      • 日志采集
      • 传感器
    • 工具使用
      • 八爪鱼
      • 火车采集器
      • 搜集客
    • 爬虫编写
      • phantomjs
      • Scarp
      • lxml
      • Selenium
  • 数据挖掘

    • 数学基础
      • 概率论与数据统计
      • 线性代数
      • 图论
      • 最优化方法
    • 基本流程
      • 商业理解
      • 数据理解
      • 数据准备
      • 模型建立
      • 模型评估
      • 上线发布
    • 十大算法
      • 分类算法
        • C45
        • 朴素贝叶斯
        • SVM
        • KNN
        • Adaboost
        • CART
      • 聚类算法
        • K-Means
        • EM
      • 关联分析
        • Apriori
      • 连接分析
        • PageRank
    • 实战
      • 如何识别手写字
      • 如何进行乳腺癌症检测
      • 如何对文档进行归类
      • ...
  • 数据可视化

    • Python 数据清洗 挖掘
      • matplotlib
      • Seaborn
    • 第三方工具
      • 微图
      • DataV
      • Data GIF Maker

认知三部曲

实战
    工具
        认知

自上而下 疑问回答做分解

带着问题找答案

自下而上 概况总结做聚合

带着概念作总结

牢记原则

  1. 不重复造轮子
  2. 工具决定效率
  3. 熟练度

总结

  1. 记录一下每天的认知
  2. 这些认知对应工具的那些操作
  3. 做更多的联系来工具你的认知