为什么数据科学家“感觉像魔术师”

三个工作数据,科学家们描述一下自己的工作就像

今年年初,数据科学家这个角色被评为2016年“最受关注的职业”。热门的工作从那以后,人们对这个职位产生了相当大的兴趣。就在最近,白宫特别挑选了数据科学家上诉寻求帮助。

如果有的话,这份工作的底薪中值大约为116,840美元它需要什么。但是数据科学家是什么样的呢?继续往下读,听听目前在前线的三个人是怎么说的。

一天是如何度过的

毫无疑问,数据科学家会花很多时间研究数据。不那么明显的是,会议和面对面的时间也是这个画面的重要部分。

LatentView Analytics的客户经理和数据科学家塔努·乔治(Tanu George)说:“通常情况下,一天从会议开始。”她说,这些会议可以有各种各样的目的,包括确定客户的业务问题、跟踪进展或讨论报告。

tanu乔治latentview LatentView Analytics(分析)

Tanu George是LatentView Analytics的数据科学家。

她说,上午10点左右,会议就结束了。“这是我们开始做数字运算的时候,”通常集中在试图回答之前在会议上提出的问题。

下午的时间通常花在协作会议上,目的是解读数据,然后在一天结束时通过电子邮件分享分析和结果。

她估计,George大约有50%的时间花在会议上,另外20%花在计算工作上,30%花在解释工作上,包括可视化和将数据转化为可操作的形式。

与客户的会议还代表日瑞安罗萨里奥的显著部分,一个独立数据科学家他还是在线教育网站Springboard的导师。“客户会解释问题,以及他们希望看到什么样的结果,”他说。

接下来讨论需要哪些类型的数据。罗萨里奥说:“大多数情况下,客户实际上并不掌握这些数据,或者不知道从哪里获取。”“我帮助制定一个如何获得它的计划。”

瑞安·罗萨里奥,数据科学家 瑞安罗萨里奥

Ryan Rosario是一位独立的数据科学家和工程师。

医疗保健公司MedeAnalytics的预测分析科学家维吉尼亚·朗(Virginia Long)表示,很多数据科学并不是针对数据本身,而是试图理解“这对公司或客户意味着什么”。“第一步是了解这个领域——我会花很多时间搜索文献、阅读并试图理解这个问题。”

接下来要弄清楚谁拥有什么样的数据,Long说。“有时候这是一个挑战,”她说。“人们真的很喜欢使用数据来指导决策,但有时他们就是没有正确的数据。找到收集正确数据的方法有时是我的工作之一。”

一旦数据在手,“挖”和理解说到未来。“这是基本的背景研究的另一面,”龙永图说。“你真的找到了什么数据实际上是,这可能是乏味的,但有时你会发现,你可能没有注意到,否则事情。”

维吉尼亚长medeanalytics 维吉尼亚长

Virginia Long是MedeAnalytics的一名预测分析科学家。

Long还花了一些时间制作内部和外部使用的教育材料,一般解释各种数据科学技术是如何工作的。

“尤其是在大肆宣传的情况下,人们会看到像机器学习这样的东西,只看到它闪亮的外表。”他们会说,‘哦,我们需要这么做,’”她解释道。“每天的部分工作至少是解释一下什么是可能的以及它是如何运作的。”

这份工作最好和最坏的部分

会议是乔治一天中最喜欢的部分:“它们让我热爱我的工作,”她说。

对于罗萨里奥,他过去的角色包括一个短暂的a机器学习Facebook的工程师,工作中最好的部分随着时间的推移而变化。

“当我在硅谷工作时,我最喜欢的部分就是处理数据,”他说。“数据经常以一种杂乱的格式出现在我们面前,或者只有特定的软件才能理解。我会把它转换成一种格式,让人们易于理解。”

作为顾问,他喜欢向人们展示数据可以做什么。

“很多人知道他们需要数据方面的帮助,但他们不知道他们可以用这些数据做什么,”他说。“这感觉就像一个魔术师,打开他们的思想的可能性。这种探索和探索是我现在最喜欢的部分。”

Long最喜欢的有很多,包括研究要解决问题的背景的初始阶段,以及想办法获得必要的数据,然后一头扎进去的阶段。

尽管一些报告表明数据科学家仍然花费过多的时间在数据上“家居”的任务“我不认为这是清洁工,”朗说。“我认为这是深入了解的一部分。”

至于不那么令人兴奋的部分,“我宁愿不去管理项目,”Long说。这样做意味着“我经常不得不花时间管理其他人的优先事项,同时努力完成自己的事情。”

对于Rosario来说,他接受过统计学和数据科学的训练,系统构建和软件工程是他不愿意强调的部分。

准备中的作用

众所周知,数据科学需要大量的教育,这三位专业人士也不例外。她说,LatentView Analytics的乔治拥有电子电气工程学士学位和工商管理硕士学位。

罗萨里奥拥有加州大学洛杉矶分校的统计学和计算数学学士学位,以及统计学硕士学位和计算机科学硕士学位;他目前正在那里完成统计学博士学位。

至于MedeAnalytics的Long,她拥有行为神经科学的博士学位,研究重点是学习、记忆和动机。

“我已经厌倦了追逐数据,”朗嘲讽道,他指的是科学界进行的实验。“作为一名科学家,你工作的一半是做数据分析,我真的很喜欢这方面。我也对做出实际的改变感兴趣。”

的下一个前沿

事情将会怎样发展呢?

“我认为未来会有更多的数据,”George说,他引用了物联网(IoT)等技术的发展。“未来,所有的高级和中级管理职位都将融入数据管理的某些方面。”

对流媒体数据的关注越来越多,这意味着“需要做更多的工作,”Rosario同意。“我们将看到更多的重点放在开发能够将数据流合并在一起的算法和系统上。我认为物联网和流数据将是下一个前沿领域。”

他补充说,安全和隐私将是整个过程中需要解决的主要问题。

Long说,数据科学家仍然经常被认为是“独角兽”,也就是说,他们被要求单枪匹马地做所有的事情,包括编码、数据操作、数据分析等等。

“一个人负责所有事情是很难的,”她说。“希望未来将是拥有不同技能的不同类型的人。”

单词的建议

对于那些考虑从事数据科学工作的人,罗萨里奥主张至少要获得一个硕士学位。他还建议试着从数据的角度来思考。

“我们身边都有问题,无论是理财还是计划度假,”他说。试着想想如何利用数据来解决这些问题。询问这些数据是否存在,并试着找到它。”

对于早期建立投资组合的经验,常见的建议是,从Kaggle等网站找到一组数据,然后找出可以使用它解决的问题。

“我建议反过来,”罗萨里奥说。“选择一个问题,然后找到解决它所需的数据。”

“我觉得最好的准备是了解一些科学方法,或者你如何处理问题,”MedeAnalytics的Long说。“它将决定你如何处理和使用这些数据。”

工具是可以掌握的,但“解决问题的敏感性是你需要擅长的,”她补充道。

当然,最终的数据科学家最后一英里是展示他们的成果,乔治指出。

“有很多细节,”她说。“如果你是一个很会讲故事的人,如果你能从中编织出一个故事,那就没有比它更好的了。”

加入网络世界社区足球竞猜app软件脸谱网LinkedIn对最重要的话题发表评论。

版权©2016足球竞彩网下载

工资调查:结果在