时间: 2021-08-03 09:56:56 人气: 16 评论: 0
随着人工智能能和大数据的热潮来临,带来了更所的科技创新的机遇与前景,但与此同时,也增加了初创者们颠覆大公司的机**……
新的一周,Google公开了一项在AI领域的破纪录研究成果。该项研究成果揭示了一个重要的信息。传统上我们认为,日益依赖消费者和社**经济的科技公司特征是创新和反垄断的——这也是小企业可以颠覆大公司的机**所在。然而当科技公司之间的竞争依赖于通过大数据进行的机器学习之时,小公司颠覆巨头的道路将**变得更加艰难。
Google周一发布了他们与Carnegie Mellon大学一项不菲的合作。双方的图像识别实验室在两个月里整合了50个强大的图形处理器,并使用了一个前所未有的3亿张标记图像(其他实验室大部分都只使用百万量级的图**标准集合)。这个实验的目的在于测试是否可以通过给计算机更大量的数据,而不是通过调整算法来提高机器对图**的识别率。
答案是可以。
Google和CMU的研究人员使用规模庞大的新数据集对一套标准的图像处理系统进行训练之后,发现系统在数项标准测试中得到了新的高分——这些测试目的在于在评估软件解读图**的能力,比如识别照**中的物体。在他们输入的数据量和图像识别算法的准确性之间有着清晰的关系。这些发现在某种程度上解答了一个在人工智能学界流传的问题,即即是否可以从现有的算法中获得大量的数据,从而进一步获得更多的数据。
数据越多能产生更多的性能。这表明,像谷歌、Facebook或微软这样的数据丰富的科技巨头,可能**有更大的好处。
图像处理系统基于谷歌包含3亿张图**的巨大数据集进行学习,这并未产生巨大的好处——从100万张图**到3亿张图**,系统识别对象能力的得分仅仅提升了3个百分点——但论文作者表示,他们认为可以通过调整软件更好地适应**大型数据集来扩大这种优势。
即便事实证明情况并非如此,但在科技行业当中,很小的优势也可能造成重要影响。比如,就自动驾驶汽车视觉技术的准确性来说,每一点增益都是至关重要的;而对一款能够创收数十亿美元的产品而言,小小的效率提升将能产生滚雪球效应。
在科技公司眼中,囤积数据已经成为一种防御性策略。
谷歌、微软和其他公司都开放了大量的软件,甚至是硬件设计,但是对于这些工具的使用却没有那么大的自由。科技公司确实发布了数据:去年,谷歌发布了一个庞大的数据集,从**过700万的YouTube视频中提取出来,而Salesforce则开放了一个从维基百科中提取的数据,以帮助算法处理语言。
但是,人工智能发展实验室的合作伙伴、劳伦斯伯克利国家实验室的访问研究员卢克德Oliveira说,(正如你所预料的那样)这样的发布通常不**给潜在的竞争对手提供太多的价值。他说:“这些数据从来都不是真正对产品市场地位至关重要的数据集。”
谷歌和CMU的研究人员表示,他们想要他们的最新研究成果,即他们所说的“海量数据”的价值,以促进更大的、谷歌规模的、开放的图像数据集的创建。他们写道:“我们真诚的希望是,这能激励愿景社区不要低估数据,并在构建更大数据集的过程中共同努力。”CMU的Abhinav Gupta说,一个选择是与普通的视觉数据基金**合作,这是一个由Facebook和微软**助的非营利组织,它已经发布了开放的图像数据集。
与此同时,数据量小的公司想要在数据竞争中生存下来,他们需要自己的算法变得更聪明和更有创意。Jeremy Achin是初创公司DataRobot的首席执行官,他猜测,随着机器学习变得对越来越多的公司和行业举足轻重,一种见于保险行业的模式可能在更大范围内流行起来,即众多小保险公司(认真地)把各自数据“拼”到一起,以使其风险预测能够匹敌那些规模更大的竞争对手。
让机器学习不再那么渴求数据,这方面的进步有可能颠覆人工智能的数据经济学;优步去年就收购了一家从事相关研究的公司。但现在,后者仍然有可能试着避开人工智能巨头公司已有的数据优势。
Fast.ai是一家致力于让机器学习变得更容易的公司,其联合创始人蕾切尔·托马斯(RachelThomas)表示,初创公司可以在由互联网巨头把持的领域之外找到应用机器学习技术的地方,就比如说农业。“我不确信这些巨头公司一定在所有领域占据着优势,在很多特定领域中,根本没有人在收集数据,”她如是说。即便是人工智能领域的巨头也有盲点。
肥寒,微信公众号:chanpingdog,人人都是产品经理专栏作家。九年产品经理。做过数字阅读,电商,社区,目前致力于在线教育。
本文翻译发布于人人都是产品经理。未经许可,禁止转载。
原文地址:https://www.wired.com/story/ai-and-enormous-data-could-make-tech-giants-harder-to-topple/