【每周一本书】之《数据可视化与数据挖掘》:基于Tableau和SPSS Modeler图形界面

原创 abby |  2018-01-16 07:59

【数据猿导读】 大数据时代正在改变着我们的生活、工作和思维,要让大数据发挥出最大价值,最重要的手段就是进行数据可视化挖掘。利用可视化数据挖掘工具和技术,分析人员能够从全新的角度快速、轻松地挖掘信息。可视化数据挖掘使数据挖掘变得更简单,建模过程不需要编写代码,非技术出身的业务人员等也...

【每周一本书】之《数据可视化与数据挖掘》:基于Tableau和SPSS Modeler图形界面

来源:数据猿   作者:abby

当前,经典的数据挖掘算法日趋成熟,相关标准和技术已经在各行各业得到广泛应用。为了使数据挖掘技术满足不同层次用户的需要,可视化数据挖掘技术被提出,通过可视化的手段将数据挖掘过程的各个阶段展示给用户,使用户能更好地理解过程,目前该技术已经成为数据挖掘领域的研究热点。

今天小编为大家推荐的《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》就旨在为读者介绍最新的可视化数据挖掘技术。本书内容主要基于 Tableau 10.3和 IBM SPSS Modeler 18.0 编写,详细介绍了 Tableau 的数据连接、图形编辑、创建地图、表计算和聚合计算等功能,以及 IBM SPSS Modeler 的数据连接、CRISP-DM(跨行业数据挖掘标准流程)等功能。通过实际案例,重点介绍了可视化数据挖掘技术在电信、电力、医药、银行、电商和房地产等行业中的应用,可以作为互联网、银行证券、电商等行业的从业者,以及高等院校相关专业学生参考使用。

数据可视化_数据挖掘_Tableau-1

大数据时代正在改变着我们的生活、工作和思维,要让大数据发挥出最大价值,最重要的手段就是进行数据可视化挖掘。利用可视化数据挖掘工具和技术,分析人员能够从全新的角度快速、轻松地挖掘信息。可视化数据挖掘使数据挖掘变得更简单,建模过程不需要编写代码,非技术出身的业务人员等也可以利用数据做出决策。

本书从内容方面主要分为15个章节:

第1章:介绍数据可视化和可视化数据挖掘的基本理论及主要软件,前者包括Tableau、QlikView和Power BI,后者包括IBM SPSS Modeler、Intelligent Miner和SAS Enterprise Miner。

第2章:介绍Tableau Desktop 10.3软件简介、数据类型、运算符及优先级、软件的安装与激活和Tableau的文件类型等。

第3章:介绍Tableau Desktop可以连接的数据源,包括Excel文件、文本文件、Access文件、JSON文件、PDF文件、空间文件和统计文件等,还介绍了如何连接各类数据库,如Tableau Server、SQL Server、MySQL和Oracle等。

第4章:首先介绍Tableau Desktop的维度和度量、连续和离散的概念和操作,然后介绍工作区和工作表的基础操作,最后详细介绍表计算、创建字段、创建参数和聚合计算等高级操作。

第5章:介绍如何使用Tableau生成一些统计图形,如条形图、饼图、直方图、折线图、散点图、并排图、甘特图等。

第6章:介绍IBM SPSS Modeler的发展历史、软件特点、软件算法、软件功能、安装过程和授权许可等。

第7章:介绍使用IBM SPSS Modeler进行数据挖掘的6个基本步骤:业务理解、数据理解、数据准备、建立模型、评估模型和应用模型。

第8章:介绍IBM SPSS Modeler的基本操作,包括连接到文件和连接到数据库,前者包括Excel文件、SAS文件、SPSS Statistics文件、变量文件和固定文件等,后者包括Oracle、SQL Server、DB2、MySQL等数据库。

第9章:介绍IBM SPSS Modeler的数据流操作,包括生成数据流、添加和删除节点、连接数据流、修改连接节点和执行数据流等。

第10章:介绍可视化数据挖掘在电信行业中的应用,根据客户流失数据,运用Logistic回归算法,建立了基于客户属性、服务属性和客户消费信息的客户流失预警模型。

第11章:介绍可视化数据挖掘在电力行业中的应用,由于用电负荷具有季节性和周期性的特点,因此运用时间序列模型,同时选择时间序列中的专家建模器进行建模。

第12章:介绍可视化数据挖掘在医药行业中的应用,根据患者的用药数据,应用K-Means聚类算法,建立基于药物在人体的类胆固醇TC、Na、Ka等因素的药物效果聚类模型。

第13章:介绍可视化数据挖掘在银行业中的应用,根据银行客户的登记记录数据,运用判别分析算法,建立基于客户的属性数据、信用等级和资产状况等因素的客户类型判别模型。

第14章:介绍可视化数据挖掘在电商行业中的应用,根据促销的费用、促销前的销售额和促销后的销售额等数据,运用神经网络模型,建立基于促销费用、促销前的销售额和促销后的销售额等因素的促销效果评价模型。

第15章:介绍可视化数据挖掘在房地产行业中的应用,根据购房者的个人信息数据等,运用CHAID决策树算法,建立基于年龄、性别、学历、月薪和家庭人数等因素的购房决策树模型。

适度人群

本书的内容和案例适用于互联网、银行证券、电商、医药等行业数据分析用户进行可视化数据挖掘,可供高等院校相关专业学生及从事可视化数据挖掘的研究人员参考使用,也可作为Tableau和IBM SPSS Modeler软件培训和自学的教材。


推荐阅读:

【每周一本书】之《深度学习入门与实践》

【每周一本书】之《人之彼岸》:郝景芳带你提前踏入人机交互的未知世界

【每周一本书】之《数据素养:数据使用指南》:如何将数据信息转变为迷人的故事?

【每周一本书】之《图解机器学习》:187张图解轻松入门

【每周一本书】之《大数据智能——互联网时代的机器学习和自然语言处理技术》

【每周一本书】之《大数据日知录:架构与算法》

点击查看更多大数据书籍……


本书由 数据猿联合电子工业出版社 共同推荐

【本栏目合作伙伴】:清华大学出版社、电子工业出版社、北京师范大学出版社、中国人民大学出版社。

欢迎更多合作伙伴加入!也欢迎勾搭小编,微信:wmh4178,备注“书”

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

Tableau收购来自MIT的AI初创公司Empirical Systems
Tableau收购来自MIT的AI初创公司Empirical Systems...
把扎克伯格拉下水,大数据挖掘犯错了吗
把扎克伯格拉下水,大数据挖掘犯错了吗
想要精通数据可视化?先弄清我们能用非结构化数据做什么吧想要玩转数据可视化?先弄清我们能用非结构化数据做什么吧
想要精通数据可视化?先弄清我们能用非结构化数据做什么吧想要玩...

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

OSCA 2016 最佳应用评选
运营新玩法
回到顶部