本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

不仅仅是一个标题:如何识别数据科学家

数据分析 cdadata 3211℃

 不仅仅是一个标题:如何识别数据科学家
不仅仅是一个标题:如何识别数据科学家

经过我们倍受争议的博客文章,4种方式现货假数据科学家,很多读者都好奇,想知道什么样的标准Burtch作品用来识别数据的科学家,因为标题本身并不总是一个指标。以下是改编自我国日前公布的数据科学的研究工资的进入更详细的关于学术背景,技能,和每天的日常工作职责,我们期待识别数据时,科学家为。要下载完整的薪酬数据和人口统计信息,以及数据的科学薪酬如何比较预测分析报告全文,请点击此处

数据科学家利用复杂的定量和计算机科学技能,在结构和分析海量非结构化数据集或连续的数据流,以及从数据中派生的见解和行动规定。其编码技能的深度从其他预测分析的专业人员区分开来,并允许它们无论其来源,尺寸或格式利用数据。通过使用一个或多个通用编码语言,数据科学家可以解决,是非常复杂的,由于该数据的大小和解体的问题。

为了识别数据科学家招聘我们的努力和Burtch工程研究中,我们使用下列标准:

1. 教育背景 -数据科学家通常有一个更高的学位,通常是硕士或博士,在定量学科,如应用数学,统计学,计算机科学,工程学,经济学或运筹学。随着新数据的科学学位计划,大规模的开放式在线课程(MOOCs),和新兵训练营继续扎根于社区的数量,并且,随着越来越多的专业人士做职业的变化,从其他领域,它很可能是数据科学家的教育背景可以多元化。

2. 技能 -数据科学家通常是在Hadoop的/ MapReduce的生态系统,如Pig和Hive,以及AWS工具熟练的用户。同时也出现了很多议论周围的Apache火花,这正在成为数据科学工具箱中的一个重要工具。数据科学家们可以使用语言如Python和Java来编写程序来自动分析数据,转换和分析,通常有使用诸如R和SAS工具统计和机器学习方法的专业知识。许多也使用其他方法来获得从数据,包括模式识别,信号处理和可视化的有用信息。

3. 数据集大小 -数据科学家通常与千兆高达PB级数据集测量工作,并经常与连续数据流工作。

4. 工作职责 -数据科学家都配备了工具和技能的工作分析的生命周期,包括每一个阶段上:

  • 数据采集 -这可能涉及刮数据,与API的接口,查询关系和非关系数据库,或者甚至相对于什么样的数据,以追求定义策略。
  • 数据清洗/转换 -这可能涉及到分析和汇总杂乱,不完整的,非结构化的数据源,产生可以在分析/预测模型中使用的数据集。
  • 分析 -这涉及统计和机器学习的建模以描述或预测模式中的数据。
  • 处方行为 -这包括解释分析结果,并利用数据驱动的洞察力通知的经营策略。雄厚的技术印章本身并不能作出一个特殊的数据科学家,所以招聘时,我们找了技术和非技术技能组合。
  • 编程/自动化 -在许多情况下,数据科学家还负责创建库和工具,以实施或简化这一过程的各个阶段。通常情况下,它们将有助于生产级代码为一个公司的数据产品。

目前已经有很多解决这个发展的领域谈话,我毫不怀疑,随着大数据工具的不断发展,我们的标准将需要发展为好。无论你是一个科学家的数据,一个分析专业,程序员或数据工程师,重要的是你继续学习的工具进入市场,并跟上新技术是非常重要的。这将是非常有趣的,如果这个名单在明年的学习变化。我敢肯定有,我们已经错过了一些前沿的工具,所以一定要留下你的想法在下面的评论。

请注意:预测分析的专业人士被有意排除在数据科学的薪酬研究,并为自己的研究中,受试者的Burtch工程研究:预测分析专家的薪金,在发布2014年9月。

转载请注明:数据分析 » 不仅仅是一个标题:如何识别数据科学家

喜欢 (1)or分享 (0)