当你想到完美的数据科学团队时,你想象的是同一位计算机科学和统计学教授的10份副本吗?我希望不是!

谷歌的Geoff Hinton是我的英雄,也是深度学习的一位了不起的研究员,但我希望你不打算让他的应用数据科学团队与他一起工作,而不是其他人!
谷歌的Geoff Hinton是我的英雄,也是深度学习的一位了不起的研究员,但我希望你不打算让他的应用数据科学团队与他一起工作,而不是其他人!

应用数据科学是一项高度跨学科的团队运动。透视的多样性很重要!事实上,观点和态度至少与教育和经验一样重要。

如果您希望通过决策智能工程方法使数据变得有用,那么这就是我对团队发展的顺序的看法。

#0数据工程师

当然,我们从零开始计数,因为在谈论数据分析之前,您需要能够获取数据。如果您正在处理小型数据集,那么数据工程实际上是在电子表格中输入一些数字。当您以更令人印象深刻的规模运营时,数据工程本身就成为一门复杂的学科。您团队中的某个人需要负责处理提供其他员工可以使用的数据的棘手工程方面。

#1决策者

在聘请经过博士培训的数据科学家之前,请确保您拥有一位了解数据驱动决策的艺术和科学的决策者。

在团队从数据中获取价值之前,必须具备决策技能。

这个人负责确定值得用数据做出的决策,构建它们(从设计指标到根据统计假设做出决定),并根据对业务的潜在影响确定所需的分析严谨程度。寻找一位深思熟虑的人,他不会一直说,“哦,哎呦,我在思考这个决定时甚至没有想到。”他们已经想到了。然后。那也是。

#2分析师

然后下一个雇员是…每个人都已经和你合作了。每个人都有资格查看数据并获得灵感,唯一可能缺少的是对熟悉该工作的软件的熟悉程度。如果您曾经看过数码照片,那么您已经完成了数据可视化和分析。

学习使用R和Python等工具只是对MS Paint进行数据可视化的升级; 它们只是用于查看更多种类数据集的多功能工具,而不仅仅是红绿蓝像素矩阵。

如果您曾经看过数码照片,那么您已经完成了数据可视化和分析。这是同一件事。

嘿,如果你有胃的话就是在电子表格中查看前五行数据,那么,这仍然比没有好。如果整个劳动力都有权这样做,那么你就可以更好地掌握业务脉搏,而不是没有人在查看任何数据。

Nessie 1934:这是数据。明智地得出结论。
Nessie 1934:这是数据。明智地得出结论。

要记住的重要一点是,除了数据之外,你不应该得出结论。这需要专业培训。就像上面的照片一样,这里有你可以说的全部内容:“ 这就是我的数据集中的内容。“请不要使用它得出的结论是尼斯湖水怪是真实的。

#3专家分析师

进入闪电般的版本!此人可以更快地查看更多数据。这里的游戏是速度,探索,发现……有趣!(分析的另一个术语是数据挖掘。)这不是关注严谨和谨慎结论的角色。相反,这是帮助您的团队尽可能多地关注您的数据的人,以便您的决策者可以更加谨慎地了解值得追求的东西。

这里的工作是速度,尽快遇到潜在的见解。

这可能违反直觉,但不要与最可靠的工程师合作,他们编写华丽,强大的代码。这里的工作是速度,尽可能快地遇到潜在的见解,不幸的是,那些对代码质量过高的人可能会发现很难快速缩放数据以便在这个角色中发挥作用。

那些着迷于代码质量的人可能会发现很难在这个角色中发挥作用。

我看到有关工程导向团队的分析师被欺负,因为他们的同行没有意识到“优秀代码”对于描述性分析意味着什么。伟大的是“快速和谦虚”在这里。如果快速但邋 – 的程序员没有得到太多的爱,他们就会离开你的公司,你会想知道为什么你没有掌握你的业务脉搏。

#4统计学家

现在我们已经让所有这些人高兴地探索数据,我们最好让周围的对喂食狂潮施加阻碍。看看Nessie的 “照片”是安全的,只要你有纪律让自己远离实际存在的东西……但你呢?虽然人们非常善于合理地思考照片,但其他数据类型似乎在窗外传递常识。让周围的人阻止团队做出无根据的结论可能是一个好主意。

灵感很便宜,但严谨是昂贵的。

Lifehack: 不要做出结论,你也不必担心。我只是半开玩笑。灵感很便宜,但严谨是昂贵的。用纯粹的灵感来支付或满足自己。

统计学家帮助决策者在数据之外安全地得出结论。

例如,如果您的机器学习系统在一个数据集中工作,那么您可以安全地得出结论,它在数据集中起作用。它在生产中运行时会起作用吗?你应该推出吗?你需要一些额外的技能来处理这些问题。统计技能。

如果我们想要在没有完美事实的情况下做出认真的决定,那么让我们放慢脚步并采取谨慎的态度。统计学家帮助决策者在分析的数据之外安全地得出结论。

#5应用机器学习工程师

应用的AI / 机器学习工程师的最佳属性不是对算法如何工作的理解。他们的工作是使用它们,而不是构建它们。(这就是研究人员所做的。)专业的争论代码可以让现有算法接受并通过您的数据集流失,这正是您所寻求的。

除了快速编码手指外,还要寻找能够应对失败的个性。你几乎永远不会知道你在做什么,即使你认为你做了。您可以通过一堆算法尽快运行数据,看看它是否正常工作……合理的期望您在成功之前会失败很多。这项工作的很大一部分是盲目地涉足,并且需要一定的个性来享受这一点。

完美主义者倾向于作为ML工程师而斗争。

因为您的业务问题不在教科书中,所以您无法事先知道什么会起作用,所以您不能指望在第一时间获得完美的结果。没关系,尽可能快地尝试很多方法并迭代解决方案。

说到“通过算法运行数据”……什么数据?当然,分析师认为这些输入可能很有意思。这就是分析师作为早期雇员有意义的原因。

虽然有很多修修补补,但机器学习工程师必须深入尊重严谨至关重要的过程部分:评估。该解决方案是否真的适用于新数据?幸运的是,你在以前的雇佣中做出了明智的选择,所以你所要做的就是将接力棒传递给统计学家。

最强大的应用ML工程师非常清楚应用各种方法需要多长时间。

当一个潜在的ML雇员可以在各种数据集上尝试它们的时候对选项进行排名,给人留下深刻的印象。

当一个潜在的ML雇员可以在各种数据集上尝试它们的时候对选项进行排名,给人留下深刻的印象。

#6数据科学家

我使用这个词的方式,数据科学家是在前三个角色中都是完全专家的人。不是每个人都使用我的定义:你会看到那里的工作应用程序,人们称自己为“数据科学家”,当他们真正掌握了三者之一时,所以值得检查。

数据科学家是以前三个职位中的全部专家。

这个角色位于第6位,因为雇用真正的三合一是一个昂贵的选择。如果您可以在预算范围内雇用一个,这是一个好主意,但如果您的预算紧张,请考虑提升并培养现有的单一角色专家。

#7分析经理/数据科学负责人

分析经理是产生金蛋的鹅:它们是数据科学家和决策者之间的混合体。他们在团队中的存在充当了力量倍增器,确保您的数据科学团队不会在杂草中脱离,而不是为您的业务增加价值。

决策者+数据科学家混合体是一种力量倍增器。不幸的是,它们很少见,很难雇用。

这个人在晚上保持清醒,问题是“ 我们如何设计正确的问题?我们如何做出决定?我们如何最好地分配我们的专家?什么值得做?技能和数据是否符合要求?我们如何确保良好的输入数据?

如果你有幸雇用其中的一个,请坚持下去,永远不要让他们离开。在此处详细了解此角色。

#8定性专家​​/社会科学家

有时候你的决策者是一个出色的领导者,经理,激励者,影响者或组织政治的导航者……但是在决策的艺术和科学方面并不熟练。决策不仅仅是一种人才。如果你的决策者没有磨练他们的手艺,他们可能会造成更大的伤害。

您可以使用定性专家来增强他们,而不是解雇一个不熟练的决策者。

不要解雇一个不熟练的决策者,加强他们。您可以以帮助者的形式雇用他们升级。定性专家在这里补充他们的技能。

这个人通常具有社会科学和数据背景 –  行为经济学家,神经经济学家和JDM心理学家接受最专业的培训,但自学成才的人也可以擅长。这项工作是帮助决策者澄清想法,检查所有角度,并将模棱两可的直觉转化为语言中经过

深思熟虑的指令,以便团队的其他成员轻松执行。我们没有意识到社会科学家是多么有价值。他们通常比数据科学家更有能力将决策者的直觉和意图转化为具体的指标。

定性专家不会打电话给任何一个镜头。相反,他们确保决策者已经完全掌握了可用于呼叫的镜头。他们也是值得信赖的顾问,头脑风暴的伴侣,以及决策者的声音板。让他们参与是确保项目开始朝着正确方向发展的好方法。

#9研究员

许多招聘经理认为他们的第一个团队成员需要成为前教授,但实际上你并不需要那些博士学位,除非你已经知道该行业不会提供你需要的算法。大多数团队都不会提前知道,所以按照正确的顺序做事更有意义:在建立自己的太空笔之前,先检查一支铅笔是否能完成工作。首先开始,如果您发现现有的解决方案没有给您太多的爱,那么您应该考虑聘请研究人员。

如果研究人员是您的第一个雇员,您可能没有合适的环境来充分利用它们。

不要把它们直接带上蝙蝠。最好等到你的团队发展到足以弄明白他们需要研究人员的时候。等到你已经用尽了所有可用的工具,然后再雇用某人来建造昂贵的新工具。

在您发明在太空中工作的笔之前,请检查现有解决方案是否已满足您的需求。
在您发明在太空中工作的笔之前,请检查现有解决方案是否已满足您的需求。

#10 +其他人员

除了我们看到的角色,这里有一些我最喜欢的人欢迎参与决策情报项目:

  • 领域专家
  • 伦理学家
  • 软件工程师
  • 可靠性工程师
  • UX设计师
  • 交互式可视化/图形设计师
  • 数据收集专家
  • 数据产品经理
  • 项目/项目经理

许多项目离不开它们 – 他们未列入我的前10名的唯一原因是决策智能不是他们的主要业务。相反,他们是自己学科的天才,并且已经对数据和决策有足够的了解,对您的项目非常有用。可以把他们想象成拥有自己的专业或专业,但他们对决策智能充满热爱,他们选择对其进行微调。

庞大的团队还是小团队?

阅读完所有内容后,您可能会感到不堪重负。这么多角色!深吸一口气。根据您的需要,您可以从前几个角色中获得足够的价值。

easyai公众号

重温我将应用机器学习作为厨房创新的比喻,如果您个人想要开设一家制作创新比萨饼的工业规模比萨饼店,您需要大团队或需要与供应商/顾问合作。如果你想在这个周末制作一个或两个独特的披萨 – 焦糖凤尾鱼惊喜,任何人? – 那么你仍然需要考虑我们提到的所有组件。你要决定做什么(角色1),使用哪些成分(角色2和3),在哪里获得成分(角色0),如何定制食谱(角色5),以及如何给它一个品味测试(角色4)在为想要给人留下深刻印象的人服务之前,但对于不那么重要的随意版本,你可以自己完成所有这些工作。如果你的目标只是制作标准的传统披萨,你甚至不需要这一切:抓住别人经过试验和测试的配方(不需要重新发明自己的配方)和配料,开始做饭!

easyai公众号