本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

数据分析系列篇(7):十本数据分析推荐精读

数据分析 cdadata 7062℃

数据分析系列篇(7):十本数据分析推荐精读

现在碎片化的信息太多,而没有太多系统的知识整理,买几本好书放在家里或者车上,没事的时候可以看看。找了几本书,基本的要求如下:

1)废话不要太多,读下来没任何印象;

2)有数据分析的技能介绍;

3)有当下的热点分析,有实际案例;

4)跨行业信息,值得多读。

—————————————————————————————————————

1.《数据之美数据之美 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

这本书相对来说还算比较新,是从英文版翻译过来的。英文版2009年出版。中文版2010年10月出版。由20篇相互独立的文章组成。每篇讲一个数据处理相关的项目。不涉及具体的技术细节,仅仅是概括说明原理、思路、过程、结果。

总体来说,阅读起来有点晦涩。感觉作者基本都明白英文版的意思,不过有些地方中文表达上不够通顺。这在IT业的翻译书中已经算不错的组合了,强过中文过关但是不懂技术的情况。

其中讲数据可视化的文章有几篇。还都比较有意思。比如第六章“照片档案的地理之美”,说的是英国的一个名叫“Geograph”的项目,收集了大量的英国的照片及普通用户对照片的标签,作者分析这些标签,并且用图形化的方法把许多分析结果展现出来;第11章“都市数据可视化”,讲的是把警察局的犯罪发生的数据与地图结合起来,预测犯罪发生的地点与类型从而提早预防;第12章“Sense.us的设计”讲以可视化手段分析美国150年以来的人口数据,得出许多有趣的结论;第17章“数据浅析:探索形形色色的社会定型”说的是用图形化方法分析一个网站的大量用户相互之间的评论;第19章“美丽的政治数据”同样使用可视化手段分析选举相关数据。

第4章“PNUTShell中的云存储设计”,说的是雅虎的一个云存储的项目PNUTShell的设计思路和优缺点。这个项目面对的应用主要是社交方面的应用,数据一致性要求不高,可用性、扩展性要求很高。因此就对一致性做了一些牺牲,满足比较高的可用性和扩展性。数据只要最终按照操作顺序执行了相关的操作,最终一致就可以了。每一条数据都记录了版本号,好知道自己执行到那个步骤了。每一条记录还需要记录自己是不是主备份。写操作要先写主备份然后逐步同步到其他数据库上。如果系统发现用户比较频繁地写数据但是主备份所在服务器的物理距离与用户的物理距离比较远,就自动把主备份记录转移到距离用户更近的服务器上。如果主备份损坏,系统也会从剩下的数据中挑选最合适的一条做主备份。

第9章“探寻Deep Web”说的是如何让搜索引擎自动搜索Form表单。Form表单可以有无穷个组合,这篇文章给出一些基本思路来让搜索引擎判断如何去选择下拉列表或者去填写文本框,目标是用尽量少的操作步骤尽量多地获取form表单后面的数据库中的内容。
2.浪潮之巅 浪潮之巅 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

 

近一百多年来,总有一些公司很幸运地、有意识或无意识地站在技术革命的浪尖之上。在这十几年间,它们代表着科技的浪潮,直到下一波浪潮的来临。

从一百年前算起,AT&T 公司、IBM 公司、苹果公司、英特尔公司、微软公司、思科公司、雅虎公司和Google公司都先后被幸运地推到了浪尖。虽然,它们来自不同的领域,中间有些已经衰落或正在衰落,但是它们都极度辉煌过。本书系统地介绍了这些公司成功的本质原因及科技工业一百多年的发展。

在极度商业化的今天,科技的进步和商机是分不开的。因此,本书也系统地介绍了影响到科技浪潮的风险投资公司,诸如 KPCB 和红杉资本,以及百年来为科技捧场的投资银行,例如高盛公司,等等。

在这些公司兴衰的背后,有着它必然的规律。本书不仅讲述科技工业的历史,更重在揭示它的规律性。
3.数据之魅 数据之魅 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

数据之魅:基于开源工具的数据分析》结合作者多年来从事数据分析工作的丰富经验,阐述了数据分析所涉及的概念和方法。本书四部分19章,主题包括如何通过图表来观察数据,如何通过各种建模方法来分析数据,然后着重阐述如何进行数据挖掘,最后强调数据分析在商业和金融等领域的实际应用。本书包含大量的模拟过程及结果展示,并通过实例来阐述如何使用开源工具来进行数据分析。通过本书的阅读,读者可以清楚地了解这些方法的实际用法及用途。

本书结构合理,通俗易懂,适合数据分析爱好者和从业者阅读,也适合以科学计算为工具的科研人员参考。同时,本书还适用于计算机科学、数学、工程技术和其他相关专业本科或研究生的数据分析课程,是一本不错的参考书。
4.数据挖掘技术 数据挖掘技术 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

 

本书是数据挖掘领域的经典著作,数年来畅销不衰。全书从技术和应用两个方面,全面、系统地介绍了数据挖掘的商业环境、数据挖掘技术及其在商业环境中的应用。自从1997年本书第1版出版以来,数据挖掘界发生了巨大的变化,其中的大部分核心算法仍然保持不变,但是算法嵌入的软件、应用算法的数据库以及用于解决的商业问题都有所演进。第2版展示如何利用基本的数据挖掘方法和技术,解决常见的商业问题。

本书涵盖核心的数据挖掘技术,包括:决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外,还提供了数据挖掘最佳实践、数据挖掘的最新进展和一些富有挑战性的研究课题,极具技术深度与广度。
5.社交网站的数据挖掘与分析 社交网站的数据挖掘与分析 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。

每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。

•获得对社交网络世界的直观认识

•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据

•学习如何应用便捷的Python工具来交叉分析你所收集的数据

•通过XHTML朋友圈探讨基于微格式的社交联系

•应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术

•通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化
6.集体智慧编程 集体智慧编程 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。

本书是Web开发者、架构师、应用工程师等的绝佳选择。
7.大数据时代 大数据时代 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

《大数据时代》是国外大数据研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。

维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。

维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。

本书认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。
8.从0到1 从0到1 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

硅谷创投教父、PayPal创始人作品,斯坦福大学改变未来的一堂课,为世界创造价值的商业哲学。

在科技剧烈改变世界的今天,想要成功,你必须在一切发生之前研究结局。

你必须找到创新的独特方式,让未来不仅仅与众不同,而且更加美好。

从0到1,为自己创造无限的机会与价值!

Paypal创始人、Facebook第一位外部投资者彼得•蒂尔在本书中详细阐述了自己的创业历程与心得,包括如何避免竞争、如何进行垄断、如何发现新的市场。《从0到1》还将带你穿越哲学、历史、经济等多元领域,解读世界运行的脉络,分享商业与未来发展的逻辑,帮助你思考从0到1的秘密,在意想不到之处发现价值与机会。

揭开创新的秘密,进入彼得•蒂尔颠覆式的商业世界:

创新不是从1到N,而是从0到1

全球化并不全是进步

竞争扼杀创新

“产品会说话”是谎言

失败者才去竞争,创业者应当选择垄断

创业开局十分重要,“频繁试错”是错误的

没有科技公司可以仅靠品牌吃饭

初创公司要打造帮派文化
9.失控 失控 (豆瓣)

数据分析系列篇(7):十本数据分析推荐精读

《失控》,全名为《失控:机器、社会与经济的新生物学》(Out of Control: The New Biology of Machines, Social Systems, and the Economic World)。

2006年,《长尾》作者克里斯·安德森在亚马逊网站上这样评价该书:

“这可能是90年代最重要的一本书”,并且是“少有的一年比一年卖得好的书”。“尽管书中的一些例子在十几年后可能有些过时,但(它们所表达的)信息却越来越成为真知灼见”。“在那时人们还无法想象博客和维基等大众智慧的突起,但凯利却分毫不差地预见到了。这可能是过去十年来最聪明的一本书。”

这是一部思考人类社会(或更一般意义上的复杂系统)进化的“大部头”著作,对于那些不惧于“头脑体操”的读者来说,必然会开卷有益。

《失控》成书于1994年,作者是《连线》杂志的创始主编凯文·凯利。这本书所记述的,是他对当时科技、社会和经济最前沿的一次漫游,以及借此所窥得的未来图景。

书中提到并且今天正在兴起或大热的概念包括:大众智慧、云计算、物联网、虚拟现实、敏捷开发、协作、双赢、共生、共同进化、网络社区、网络经济,等等。说它是一本“预言式”的书并不为过。其中必定还隐藏着我们尚未印证或窥破的对未来的“预言”。
10.一个广告人的自白 book.douban.com/subject

数据分析系列篇(7):十本数据分析推荐精读

在这本书中,奥格威坦诚地介绍他本人和奥美广告公司的宝贵经验,包括怎样经营广告公司、怎样争取客户、怎样维系客户,怎样当一个好客户,怎样撰写有效的文案、怎样制作上乘的电视广告等等。

著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:宿痕
来源:知乎

转载请注明:数据分析 » 数据分析系列篇(7):十本数据分析推荐精读

喜欢 (3)or分享 (0)