应用

技术

物联网世界 >> 物联网新闻 >> 物联网热点新闻
企业注册个人注册登录

给数据科学家判死刑:5年后将被机器学习取代

2019-03-05 09:27 新智元

导读:数据科学家会被机器学习取代吗?虽然现在的数据科学家岗位需求非常热,但是所从事的工作领域,正好面临机器学习的不断挑战。福布斯作者认为,数据科学家工作的5个领域,未来5-10年会被机器学习取代,Reddit网友对此进行了激烈的讨论。

数据科学家会被机器学习取代吗?虽然现在的数据科学家岗位需求非常热,但是所从事的工作领域,正好面临机器学习的不断挑战。福布斯作者认为,数据科学家工作的5个领域,未来5-10年会被机器学习取代,Reddit网友对此进行了激烈的讨论。

数据科学岗位正在面临巨大的变革。

计算器被发明之前,它的工作是由人来担当的;互联网刚刚发展起来的时候,网管是一个非常热门的职业;中层领导曾经并不自己做PPT,这些琐碎的工作由他们的秘书处理。

如今,计算员、网管、中层领导的秘书这些岗位,早已被科技的浪潮淹没在海底深处。

数据科学淘金热

数据科学家岗位现在的形势,很像当年美国西部淘金热潮。一些数据科学家赚到了高薪,各大公司、薪酬网站也在不算释放缺人、待遇高的信号。



根据美国最热岗位排行榜数据显示,数据科学家岗位的招聘信息在过去3年时间,增加了75%,而薪资也提升到了吓人的30万美元,相当于200万人民币。

与此相对应的是,包括UC伯克利在内的多所高校,均新增了数据科学专业,并很快就成为最热门专业。

著名科技网站Slashdot联合创始人、Sight Machine联合创始人兼CTO、福布斯科技委员会成员Nate Oostendorp对此表示,未来只会有一小部分人能够真正成为数据科学家,而其中大部分,前途依旧充满未知。

从汇编到高级语言,再到数据自动化

作为一名元老级别的开发者,Nate Oostendorp经历了从低级语言到高级语言的变革时期。

最早的时候,编译器设计是一门必修课程,比如把C转换成汇编。在商业应用上直接使用汇编,是再正常不过的事情。

然而仅仅几十年后,大家都还是用高级语言,直接用汇编语言开发的软件,基本上绝迹了。而数据科学领域的变化,显然更快。

如今,很多公司都在提供数据分析工具,就算你不懂代码,也可以轻松进行数据分析。

3年后,更高级别的工具将越来越多地减少对基础技术的专业知识的要求。这些工具的不仅简化了数据科学家的工作流程、提升了工作效率,更重要的是降低了入行门槛,及时没学过数据科学的人,不懂代码也可以完成一些数据科学家的工作。

机器学习,人工智能,像吹气球一样吹大了数据科学的旺盛需求,同时也将在5年后,吹爆数据科学家这个职业。

数据科学家岗位在5年后将不复存在

Nate认为,当下非常火的数据科学家,5年后将不再作为一个独立岗位存在。而是分裂成5种类型:



1. 通才

他们将解释数据并使其可用。这些通才将专注于教育最终用户,帮助用户提出数据问题而不是自己找到所有答案。这可能是一个过渡性的角色,五年内比十年更常见。

2. 行业专家

他们将在制造,医学和金融等特定行业应用数据科学技术和工具。这是我认为大部分工作都将在这里的地方。但是,这些不会被视为数据科学工作。这名工作人员不会是了解制造业的数据科学家,而是了解数据科学的制造业领导者。今天相当于研究员是统计学王牌。

3. 深度专家

这些细分的特定数据科学技术的深度专家,人数是也最少的。这是剩下的纯数据科学工作所在的地方。他们的角色将是抽象地追求数据科学,提高算法的性能和设计新的通用方法。他们将像今天的计算机科学家一样,建立理论基础而不是解决日常问题。

4. 分析开发人员

他们将从数据科学家转变为分析开发人员。这些是软件开发专家,负责处理数据交互并帮助人们从数据报告中进行推断。算法设计将是他们工作的一小部分,由数据平台以及以交钥匙方式完成大量工作的强大代码库提供帮助。

5. 数据工程师

他们构建管道,将数据转换并传输到基础平台,进行分析和可视化。虽然数据科学家通常因其出色的算法而受到认可,但数据科学家80%的时间可用于收集,清理和组织数据。

此言论一出,造成了非常大的争议,并在Reddit上产生了激烈的讨论。与其说是讨论,不如说是一边倒的反对此观点。

各方观点

反方

logicchains用stackexchange上一个问题(What happens if the explanatory and response variables are sorted independently before regression?)来说明,数据科学并不单单是自动化。选择正确使用,正确清理和验证数据的数据至少与选择正确的模型同样重要。

他指出,目前没有任何软件能够通过组织内部进行拖网查找`Sales`表上的’Extra2`字段的正确解释,该字段有三个值:“TRUE”,“Error”和null。言下之意:5年内不可能,10年内不可能。

FrenchCuirassier认为,数据以指数速度增长,未来将会有更多的工作,但其中大部分将分析、理解和解释数据。

人工智能并不能解释,也不能理解它做的所有事情。AI在未来可能达到人类智能,但谁敢说我们能活着看到那一天呢?

BeneficialArcher也持有相同观点,认为大多数数据科学角色不太可能实现自动化。目前自动化已经很成熟了,但没有任何软件能够解决模糊的问题,并使用所有可用的数据解决它。

但他又认为未来几年工资会有所下降是合理的,因为初中政治学到的最基本的经济原理:供大于求。

killver声称没有看到一个案例能够证明AutoML优于熟练的数据科学家。如果有,那每年举行的Kaggle比赛,靠一个算法就够了。

具体而言,领域知识将始终是重要的。尝试了几次AutoML工具后发现,这些工具从来没有达到过满意的效果。

正方

当然,每个人的认知都是不同的。也有人表示认可Nate的部分观点。

sid__想的比较实际,他认为软件工程作为一门学科将比数据科学更难实现自动化。

考虑一家不希望聘请150k数据科学家的普通公司,如果能够利用普通的软件工程师,将数据投入到autoML引擎中,使用api调用并获得预测结果,在很多情况下这已经足够了,特别是如果不是一些关键任务应用程序。

亲爱的读者,你怎么看?