【每周一本书】之《Python大战机器学习:数据科学家的第一个小目标》

abby |  2017-04-06 17:04

【数据猿导读】 要说时下最热门的职业,既不是传统的信息科学家,也不是大数据工程师,而是数据科学家!那么,数据科学家必备的技能又有哪些呢?机器学习和Python一定是位列前五的两项

【每周一本书】之《Python大战机器学习:数据科学家的第一个小目标》

来源:数据猿   作者:abby

数据科学家可谓是当下炙手可热的职业,机器学习则是他们的必备技能。机器学习在大数据分析中居于核心地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。

Python作为最好最热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的首选语言。

本周,小编就为大家分享一本有关机器学习和Python的入门级图书《Python大战机器学习:数据科学家的第一个小目标》。本书以快速上手、四分理论六分实践为出发点,讲述了机器学习的算法和Python 编程实践,采用“原理笔记精华 + 算法Python 实现 + 问题实例 + 代码实战 + 运行调参”的形式展开,理论与实践结合,算法原理与编程实战并重。

本书从内容上大致分为四个部分:

第一篇:机器学习基础篇(第1~6 章):

包括线性模型、决策树、贝叶斯分类、k近邻法、数据降维、聚类和 EM算法等内容。

这些基础算法非常经典,原理也相对简单,是入门的最佳选择,掌握这些算法,才能更好地理解后续的高级算法。非菜鸟可以直接忽略这部分。

第二篇:机器学习高级篇(第7~10 章):

包括支持向量机、人工神经网络、半监督学习和集成学习等内容。

这些高级算法是目前应用非常广泛,也是效果不错的算法,需要深入理解算法的原理、优劣势等特点以及应用场景,要能达到应用自如的程度。

第三篇:机器学习工程篇(第11~12章):

讲述机器学习工程中的实际技术,包括数据预处理,模型评估、选择与验证等内容。

数据清洗、数据预处理和模型评估选择在实际中非常重要,在整个工程项目的开发过程中通常占到一半以上的时间,这部分给出的一些步骤和方法是实践的精华,值得熟练掌握。

第四篇:Kaggle 实战篇(第13章):

Step by step讲述了一个Kaggle竞赛题目的实战,有代码,有分析。

Kaggle是目前顶级的数据科学比赛平台,很多机器学习的牛人都在这里玩过,咱们可以学习牛人好的算法,也可以启发自己的思路。对于梦想成为牛人的您,还是去里面混混先:)万一拿了个好的名次呢,拿个一流公司的offer还是很easy的。

适读人群:

本书可供为高等院校计算机、金融、信息、自动化及相关理工科专业的本科生或研究生使用,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。

本书的代码全部开源,请自行下载 https://github.com/huaxz1986/git_book,也欢迎在这上面交流。


推荐阅读:

【每周一本书】之《图解Spark:核心技术与案例实战》

【每周一本书】之《大数据技术概论》:菜鸟学大数据,如果这些还不会,劝你一定要补上!

【每周一本书】之《数据新闻实战》:趁早学!这些工具,新闻人将越来越离不开

点击查看更多大数据书籍……


本书由 数据猿联合电子工业出版社 共同推荐

【本栏目合作伙伴】:清华大学出版社、电子工业出版社、北京师范大学出版社、中国人民大学出版社。

欢迎更多合作伙伴加入!也欢迎勾搭小编,微信:wmh4178,备注“书”

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

【金猿人物展】九章云极联合创始人兼CEO方磊:2020年,数据科学平台将迎来新一轮爆发
【金猿人物展】九章云极联合创始人兼CEO方磊:2020年,数据科...
【金猿产品展】DataCanvas数据科学平台:让AI变得更简单,让决策变得更智能
【金猿产品展】DataCanvas数据科学平台:让AI变得更简单,让决...
【金猿产品展】KesciLab:实现高效协作的数据科学协同平台
【金猿产品展】KesciLab:实现高效协作的数据科学协同平台

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

OSCA 2016 最佳应用评选
运营新玩法
回到顶部