Applied Data Science with Python Specialization小结

Applied Data Science with Python Specialization 五张证书拿到.

小结一下这几门课

  • 第1门. Introduction to Data Science in Python 讲Pandas基础, 严重推荐, 必学必会.

  • 第2门. Applied Plotting, Charting & Data Representation in Python 讲Matplotlib绘图, 严重推荐, 必学必会

  • 第3门, Applied Machine Learning in Python 讲scikit learn, 严重不推荐, 建议上youtube随便找找教程也比那个老师讲得好, 理解一下ROC, 知道如何评估模型. 传统机器学习学会随机森林一项即可, 遇到问题一切默认参数先来一把梭, 效果不好就换深度学习了, 不要浪费时间.

  • 第4门, Applied Text Mining in Python 讲NLTK, 如果有处理自然语言的需求可以学学, 普通大众意义不大. 老师幽默风趣, 印度口音十足, 可供练习听力.

  • 第5门, Applied Social Network Analysis in Python 讲networkX, 推荐, 生物医学化学领域推荐学习, 以此为基础再听听图论可能更佳.

在图像之外的领域, 手工提取feature的技能还是有意义的, 需要借鉴前人的研究基础, 比如自然语言, 图论中的很多预处理的函数, 理解其意义\用途, 很有帮助.

但在模型构建和训练上, 线性/SVM/决策树之类, 与深度学习相比, 除了需要数据量略少, 其他看起来并没有什么优势.

随机森林搭建省力, 可以作为基准. gbdt虽然效果类似, 但..RadomForest的名字比较好记.