时间: 2021-08-03 10:08:39 人气: 12 评论: 0
2016 年 11 月 23 日,科大讯飞举行了年度发布**,董事长刘庆峰的做了主题演讲,总结人工智能的过去和未来,详细讲述了科大讯飞这几年的成果。
以下为刘庆峰演讲原文:
今年是人工智能正式提出来 60 周年。在几乎去年 12 月 21 号,就在这样一个同样的**场,科大讯飞举办了“AI 复始,万物更新”的年度发布**。在发布**上,我们给大家分享了人工智能第三次浪潮可能给我们带来的无比广阔的灿烂前景。同时,也跟大家分享了人工智能在当前阶段的阶段性成果。
那么一年下来,可以说 2016 年已经成了中国人工智能的历史元年。伴随 AlphaGo 和李世石的围棋对决,人工智能引起了社**各界的高度关注,不仅是科技界、产业界,包括所有的创业者、投资机构,也包括了媒体和普通百姓,都在津津乐道人工智能的话题。
这是一年来,人工智能在互联网搜索的热度指数,一年来高度居高不下,一直处于热点,处于风口浪尖之上。
到今天这个时间点,也**有人在讨论人工智能第三次浪潮究竟是什么?第三次浪潮是否也**像前两次一样,很快也**大潮退去?是不是今天我们对人工智能未来的预测过于乐观了?这是一个真正的产业大潮还是概念的泡沫?
在揭晓给大家看科大讯飞一系列令人激动的进展之前,这是我们想跟大家探讨的话题。
要解答这个话题,我想首先要有科学的精神:用理性的思维来真正看今天的技术,到底可以达到什么样一个阶段?而不是用预言家的角度,非常感性地来做武断的判断。
人工智能最早是在 1956 年的达特茅斯**上提出来的,一批数学家、计算机专家、通讯专家包括麦肯锡、明斯基、香农等获得图灵奖、诺贝尔奖的大科学家们,共同提出了人工智能的概念。所以这个概念的诞生,就有着非常严谨的科学基础。
人工智能提出来之后,在 1970 年第一次浪潮达到顶峰的时候,就已经可以通过第一代的神经网络算法,证明了《数学原理》这本书中的绝大部分的原理。第二次浪潮在 1984 年的霍普菲尔德网络推出来,让人工智能的神经网络具备了历史记忆的功能。
但是前两次的大潮,后来都破灭了,为什么?是因为神经网络本身算法的局限性,同时也受到当时整个运算能力的一些局限。今天第三次浪潮,以深度神经网络为基础,加上大数据、云计算后台的运算平台,和移动互联网源源不断地把各种训练数据收到后台。所以,今天我们认为,人工智能的第三次大潮,已经切实到来了,已经不再是一个概念,而是可以进入一个又一个的行业。
其实在今年 3 月 9 号 AlphaGo 跟李世石对决之前,两**期间(3 月 7 号)有几十个媒体采访科大讯飞。当时在业界、舆论、围棋界,绝大部分人都认为机器今年很难获胜,但是科大讯飞在接受采访时坚定认为机器一定大比分领先。
为什么?因为围棋后台的算法是基于深度神经网络的应用,而这个神经网络的应用,科大讯飞早在今年之前就已经在很多领域取得了很好的应用成效,全球的科技产业界也做了很好的探索。谷歌是把它用到了一个大家都很关注又喜闻乐见的围棋领域。
我们可以看一下这个表。2006 年,深度神经网络的基本**框架正式提出来,2011 年就开始在语音识别领域崭露头角。科大讯飞是中国第一个把深度神经网络用到语音识别领域的公司,并且在 2011年,我们在全球首次发布了云平台,宣告语音、手机的听写时代正式到来。在2012 年,在图像识别领域,深度神经网络开始异军突起,接着 2014 年机器翻译取得突破。
那么今年,我们即将给大家看到一个又一个行业的令人欣喜的成果,这些是从算法创新,到应用创新和持续数据迭代的一个结果。
在这个结果中,我们看到的首先是语音合成技术:让机器能听**说,给机器装上一个人工的嘴巴。
今年,在全球的语音合成大赛暴风雪竞赛中,科大讯飞再次获得全球第一名。今年的国际比赛比的是什么呢?比的是英语合成,而且是英语的故事级合成,也就是要求系统更加深情并茂,难度更大
。但是我非常高兴的告诉大家,在今年一堆的国际的顶尖研究机构和产业界全部参加的前提下(因为 IBM 在今年年初就认为人际交互接口**是 2016 年十大技术突破的前 3 名,所以语音合成也是受到了前所未有的关注),科大讯飞再次在英文领域获得全球第一名,而且我很高兴告诉大家,不仅是全球第一,而且是全世界唯一把英语合成做到了**过普通人说话水平的技术!
在国际比赛中,5 分是播音员的水平,4 分是普通人的说话水平,而科大讯飞是 4.2 分,第二名只有 3.9 分。也就是说,全世界,让计算机念小说风格、故事风格的语音合成,只有中国人做的**过了普通人的水平。而且,这已经不是第一年,科大讯飞已经连续 11 年蝉联了全球语音合成大赛的第一名。去年国际组织比的是印度的印地语,我们照样是全球第一,是 3.9 分。我非常高兴地告诉大家,今年的中文,我们已经做到了 4.5 分。这个我很自豪,因为,当前的中文、英文、印地语的第一名都是科大讯飞所代表的中国做出来的,这意味着我们中国用户享受了全球语音合成最高的成果。
在语音合成的进展上,我们再看一下语音识别。大家已经看到在我说话的时候,大屏幕两边同步转写出来的字幕。在去年 12 月 21 号发布**上,科大讯飞是全球第一次,敢于在几千人的演讲现场同步把语音自动转成文字,而且现场机器跟人的对比结果表明,机器在转写准确率上大大**过了专业速记人员。
在讯飞发布之后,今年 5 月份谷歌开始发布了英文转写,国内也有一些单位开始跟风。但是我想告诉大家,即便到今天为止,能够任意不用做任何训练,在不用联网的单机情况下(为应对保密和网络的各种不同异常环境),能够做到**过 90% 的准确率的企业,全行业迄今为止只有科大讯飞一家。
今天我还想告诉大家的是,伴随着语音转写,当时我们又发布了万物互联时代最重要的人机交互的几个关键的特征:我们可以在 3 到 5 米,5 到 8 米之外,用于语音跟机器人跟智能家居交流,可以多轮对话上下文可以随时随地打断。通过这些特征,我们定义了万物互联时代的语音交互标准,并且推出了 AIUI 人工智能的人机交互平台。该平台当时以叮咚音响为代表,不光可以听音乐,还可以控制所有家居。
今年 5 月份,谷歌发布**推出了谷歌家庭(Google Home),我想这这是万物互联时代,业界英雄所见略同。但是我想更进一步告诉大家,其实面对未来真正的万物互联时代,中国企业不再仅仅像前几次浪潮都是跟风,而是要引领和推动整个产业的到来。在交互过程中最重要的是远场识别、噪音环境下的语音识别,以及在多个人同时讲话时,语音识别能不能达到使用。
国际上有一个非常著名的语音识别竞赛 Chime,就是在噪音口音和多人情况下进行比赛。这个比赛今年是在谷歌举行的,我很高兴的告诉大家,几乎全球顶尖机构全部参加了,科大讯飞在所有 3 项指标中都是全球第一名。而且,我们可以看到这个数据指标网站,6 麦克风,这最难的这个麦克风场合下,我们的准确率已经可以做到 97% 以上。也就是我们亲爱的老罗同志在锤子发布**上说 97% 的准确率,这不是中文,而是英文的在谷歌做的国际比赛结果:在噪音环境下我们的错误率只有 2.24%。
这些的识别,都**真正的推动我们整个产业的革命和创新。今天我们也有长安汽车的董事长到场,其实到目前为止,根据宝马、奔驰这些国际大厂测试,在汽车时速 100 公里以上、空调打开的噪音环境下,只有科大讯飞的技术能够做到使用。
在机器翻译领域,2014 年基于深度神经网络的这些算法上的创新和突破,科大讯飞的机器翻译取得了突破性的历史进展。在 2014 年国际口语翻译大赛( IWSLT)中, 我们获得了全球第一,这是具有历史意义的。因为以前国际翻译大赛,汉英翻译项目都是日本研究机构全球第一,英汉翻译项目都是美国机构全球第一,2014 年 11 月的这次比赛,终结了这个历史:科大讯飞英汉和汉英都是全球第一名。
在这基础上,2015 年 2 月,美国国家标准技术研究院组织的机器翻译大赛中我们继续是全球第一。今年,我们又面对国家一带一路的重大战略,正式推出面向一带一路的多语种翻译。所以今天我一开场讲话时,大家就可以看到两边屏幕上不光有中文,对应的还有英语,而且不光是有英语,我们同步的有维语出来,还有藏语,同样的还有日语和韩语的同步翻译,这一切,我觉得都是真正的在践行科大讯飞创业之初的理念:我们要实现人类乃至人机信息沟通无障碍。在未来,我们要把世界所有主要语种全部放进去。
我想跟大家说,今天我们展示的成果,绝不仅仅是我们今天发布**上的这些。就在 4 天前,上海高级法院招待了来自 11 个国家的大法官和高层管理者。我们的翻译转写平台在专业领域训练之后,就用于这次**议,在上海高院如此高端的接待中做实时翻译,得到了所有参**的国际友人的高度评价。所以我想这已经不是一个概念,而是切切实实的用我们技术在一个又一个的行业和专业领域给我们带来更便捷的生活,带来更美好的沟通。
那么在去年发布**上,我们还告诉大家,人工智能有 3 个层次:计算智能(机器人能计算和存储)、感知智能(机器的视觉、听觉可以**过人工)和认知智能(未来的核心)。而以语音和语言为入口的认知计算,是人工智能的必由之路。在过去一年之中,科大讯飞在人工智能最核心的可以说是**上的明珠的认知计算领域,又取得了令全球瞩目成果,我们在今年参加国际非常知名的 Winogard 的认知智能的测试,这比赛是要用来替代图灵测试的,因为今天移动互联网传输到后台的对话数据越来越多,所以图灵测试已经越来越容易过关,这就是看机器真正的认知结果。
我在这里给大家看的一个例子,这是一个比赛的原题,当然是英文的。
(1)父亲举不起儿子,是因为他太重。
——这里要求机器判断到底是谁重?机器要知道这是因为儿子重。
(2)父亲举不起儿子,是因为他太虚弱。
——这里机器要判断出是因为父亲虚弱。
这些的基本推理对人类看起来是自然而然的,但是当机器具备了这样基本的认知判断能力,就可以真正的在一个又一个的领域来学习我们人类最顶尖专家的知识。
就在不久前,在 11 月 15 号,又一次传来喜讯,由美国国家标准技术研究院组织的国际非常知名 KBP 认知大赛中,在对于实体的发现,以及关联信息的关系的比赛项目中,包括了卡内基梅隆,包括 IBM 这些我们非常尊敬的企业和研究机构都参加了,科大讯飞是全世界第一名。
大家可以看到这是其中的一道题目。
美国大选期间,特朗普炮轰杰克·布什,说伊拉克战争就是你哥哥的错。
机器需要自动判断出所有的地名、国家和人名,还要知道“你哥哥”其实指的就是前美国总统乔治·布什。这个 KBP 比赛是英语,汉语和西班牙语 3 个语种同时上,科大讯飞是全世界第一名。所以这些在国际顶尖舞台上的认知成果,真正证明了我们中国人在人工智能领域已经不仅仅是一个科普、科幻或者带有所谓先知角度的感性判断,而是在踏踏实实做**创新。
在这些创新的基础上,我们在跟教育部考试中心合作,在事关国家教育未来的考试阅卷中(保证主观题的评分要达到公平公正性),机器已经在今年上海的四六级考试,在江苏、湖南等地的高考和研究生考试中对学生的语文和英语作文判分。机器学习了 500 份专家判分的卷子,就可以对其它几十万份卷子进行判分,其综合效能已经**过人工水平。
大家知道 Alpha Go 是学习了 3000 万份围棋的对弈,然后跟人类来下棋。而围棋还是有着相对清晰的规律可循,而考试阅卷是一个更加开放的领域,我们只要学习 500 份而不是几千万份,就能对剩下的几十万份卷子判分,**过人工水平,其实原理都是后台的学习训练。
那么这个技术的突破和进展,还可以应用在医疗行业,学习顶尖的医疗专家的知识和就诊案例,它就可以**过一线的全科医生,给我们的医疗带来巨大的福音。它用在法院系统,学习大量的法庭和司法数据,就可以给一线法官的判案,形成非常好的参考。甚至可以说,我们的机器,在 2 年内就可以通过国家的医学资格考试。
以上这些,就是在一个又一个领域,人工智能技术给我们带来的无比令人欣喜的突破。所以我们可以说,就是因为今天技术的进展,因为有着无线互联网,不断传输而来的数据,有着云计算无比强大不断迭代的运算平台,所以今天的人工智能在学习了顶尖专家的知识之后,将来就能达到一流专家的水平,从而**过 90% 的专业人士。
这就是我们面临的,这个时代的趋势。当然,在源头创新上,科大讯飞将继续在基于数理统计、神经网络基础上,做出算法的突破和创新。我们同样还跟一批顶尖医疗机构以及心理学、认知学的专业机构科学合作研究,希望在脑神经的传导机制上找到突破。但今天我想说的是,即便没有传统的数理统计、神经建模方式上的重大突破,即便没有脑神经科学的突破,就用科大讯飞已经达到的深度神经网络和我们的创新成果,结合移动互联网大数据,这一些已经配套成型的产业框架,我们已经可以改变一个又一个的行业,这时代已经到来了。
所以我想说的是,不仅仅是科大讯飞的判断,我们可以看看一些行业的各方面的趋势分析,去年 10 月份麦肯锡给出的报告认为,将来 45% 的当前的知识活动是可以被自动化的。
科学杂志,在今年年初给出的判断是,到了 2045 年,全球将有 50% 的工作岗位由人工智能的机器来替代,而在中国这个数据是 77%。大家可以想一想,也就是说鼎鼎有名的科学家**认为,未来的 30 年之内,在中国每 4 个工作**有 3 个由人工智能来替代。但是我想说的是,这是今年年初的预测,如果根据我们最新的进展,我认为这时间还**大幅度提前。所以今天,人工智能已经不仅仅是一个企业,一个行业的事情,而是关乎我们今天在座的每一位。
那么在这个过程中,其实“人工智能+”的时代已经正在到来了,因为机器学习一个又一个行业的知识达到一流专家水平,代替普通专业人士的工作,增强我们人类适应未来解决问题的能力。可以用在医疗,可以用在教育、智慧城市、智能汽车、智能机器人,所以“人工智能+”的时代正在到来,这是不可逆转的最大国际趋势。
那么在这个“人工智能+”的时代中,在各个不同行业,到底**有一些什么样的行业不同特点呢?显然人工智能不是能做一切的,也不是能够代替所有人的,所以我们科大讯飞的研究院经过分析,我们把它分成 3 种主要的状况:
从这三块来看,今天越来越多的可以说 80% 是集中在中间这一块的状态的,那这个状态中人和机器是一个什么样的耦合模式呢?对一个人来说,比如说我本人有一个助手机器人,当然未来人工智能不仅仅表现在那些阿凡达、玩具、大白这样的机器人,它可以是无所不在的一个后台,处处为我们服务,像水和电一样,这就是“人工智能+”的到来。
对于我们每个个体人工智能的服务,也许今天她只能做 10% 的服务,但是我每做一次,机器就可以学习。3 个月半年,它又可以做到 20% ,三年他就能做到 80% 甚至 90% ,这就是机器在后台的迭代学习。
今天我们的翻译为什么已经达到大学六级的水平,出国的衣食住行基本都没问题了,就是因为有几百万人不断的使用,机器后台不断地学习、迭代,所以人工智能和人类耦合是不断的学习你的知识,分担你的劳动。
在一个群体中也是这样的,可能机器先替代的是 10% 人群的工作,而未来到 50%,甚至到 90%。未来的世界应该是由顶尖专家和顶尖管理者协同管理人和机器的联合体的一个大的未来,这就是我们认为的人机协同的机制。人类今天的工作技能**越来越多地由后台的学习系统掌握,最终机器来代替我们,人类得以释放出来,想象更大的未来,去做更有创意的事情。这就是科大讯飞,认为今天的人机协同机制,而在这样一个人机协同机制下,人类智慧大爆炸时代正在到来。
传统说法认为 130 亿年这是宇宙爆炸以来整个宇宙经历的时间,而人类智慧大爆炸时代,正在到来。为什么呢?因为我们人类生命的起源和发展,是线性迭代的,所以很难有突破,而今天不同,每个专家智慧送到后台进行比对、碰撞和融合,就**拥有更大的智慧。
我曾经跟大家举例,以科大讯飞的玩具为例,我们第一代玩具是能听**说的,里面放了几百几千个故事,几百首诗歌,孩子可以对话、听故事。后来有家长说,能不能给我做一个智能的玩具,陪着我孩子一天天地长大?今天我的小孩,幼儿园小班,我教他 1+1 等于 2,明天教他“白日依山尽,**河入海流”,后天又教他一个科普知识,等我的孩子从小班到中班,这个陪他的玩具也到了中班,陪他一天天长大,这个用今天人工智能在后台是能做到的。
但是还有个更大的变化,因为你的孩子在用的时候,科大讯飞后台还有上千万的孩子也在用。所以你今天教它一个知识,其他的孩子能教给它1000万个知识。当你的孩子从幼儿园小班到中班的时候,他的玩具已经研究生毕业了。
这就是我们说的,人类智慧大爆炸的未来。各种专业知识在后台碰撞,有可能使得机器在后台**越我们顶尖专家知识,而且是以不可想象的数量级跃升,使得我们人类对未来的探索有更加宏大的能力,开拓更有史诗般的新未来。
正是因为有这样一个人类智慧大爆炸时代到来,所以**使得我们的人工智能可以在未来精准满足每一个人的个性化需求。
今天的手机,也许在未来的万物互联时代**变成眼镜、手表、纽扣、胸针和项链。因为任何设备都能连网,都能交互。那么它就**不再是统一的形状,**变得跟每个人的审美情趣和穿戴习惯有关。当我们把机器人带回家成为陪伴机器人时,每个人审美观都不一样——黑白俊丑、高矮胖瘦,要求各不相同。有人喜欢活泼的,有人喜欢温柔稳重的。
这个时候,各细分领域的创业英雄更容易成功。有自己的独特创意、品位、感觉,就能打动喜欢它的特定人群。不再像原来的 Wintel 时代,以及现在的安卓和 iOS,一两个产品品类可以一统天下。
新的人工智能时代的创业者,由于独特品位和创造力,**很难被其他的巨头,用资金、用数据和入口来血洗出去。所以在这个时代,我们更要强调打造人工智能的产业生态,每一个创业者也更拥有前所未有的历史机遇。
科大讯飞在去年发布**上把我们的平台开放给所有创业者以来,我们可以看到一些令人鼓舞的数据进展。
首先,我们人工智能云平台上的总用户数,今天已经达到8.9亿,比去年同期增长48%。8.9 亿是什么概念?——过去18个月,累计下载人工智能相关应用的独立终端数。如果一个手机装了3个跟讯飞人工智能相关的应用,我们只算一个。过去18个月,累计已经有8.9亿不同的终端。
那么第二个更重要的数据是,每天有多少人在用?
一个人用一次叫一人次,去年这个时候每天是10亿人次的使用量。今天,已经突破30亿人次。4月26号习近平总书记亲临视察科大讯飞的技术成果,当时他非常高兴的看到我们每天的数据量是15亿人次。短短半年已经到了30亿人次,并且我们认为很快**突破百亿人次。
再有一个是第三方围绕我们的创业团队,去年有7万家,现在已经达到21万家。
这就是人工智能的产业生态,我们希望与所有创业者共同成长、共同创造、共同分享人工智能的伟大未来。所以说,人工智能绝对是为各个细分行业的创业英雄提供了前所未有的创业舞台。只要你有创意,只要你有品位、有感觉,你再也不用担心被别人的数据入口和资金瞬间血洗出场。
所以我们在今天这时代,我觉得大家都更加的高兴,因为我们更有想象力和创新空间了。
另外,其实各国政府也在高度关注。
今年1月份日本就正式提出来**智能社**的发展规划。10月13号,美国正式出台了人工智能产业规划,而且专门出了一本教育美国民众如何面对人工智能未来生活的专门规划,两本产业规划:包括科技产业,人文和伦理。
在中国,习近平总书记在G20**议之前的工商20国峰**上,把科技创新提到了前所未有的高度。但是点名的产业,只有人工智能和虚拟现实,认为其**对未来的生产和生活带来革命性的变化。
其实在今年的4月8号,科大讯飞与华为等众多企业就已经在工信部的指导下一道发布了《人工智能深圳宣言》。这个宣言中,第一强调了人工智能首先必须强调源头技术创新,因为必须在核心技术上拥有话语权,你才**在未来的产业上有布局的优势;第二,必须要强调人工智能产业生态;第三,必须要有标准体系。
讯飞开放平台上已有21万家合作伙伴,这些合作伙伴渗透在各个领域。其中智能家居产品从音箱到台灯,再到电视到冰箱和空调,未来如何使这些设备互联互通,如何节约我们有效的社**投资,如何避免浪费,建立标准体系是解决这些问题的当务之急。
科大讯飞对人工智能标准的制定,从技术到训练,再到行业应用以及饮食安全测试,现已形成一套完整的体系,也给国家提交了一系列的标准和规范,我觉得这是对未来产业发展至关重要的工作,今天我们已经开始了行动。
当然,这个过程还**涉及到法律法规和道德伦理,我们在当下必须考虑这个问题。我们刚才提到:《科学杂志》说未来30年之内,中国每4个工作将有3个以上被机器替代,那么在旧的工作岗位被替代,新的岗位还没有创造出来之前,社**财富将很有可能在相当一段时间内由少数顶尖人工智能公司集中创造。在这种情况下,社**的财富分配体系、社**的救助体系和法律保障是什么样的,就属于我们今天应该考虑的范畴。
作为全国人大代表,在今年两**上,我给张德江委员长当面汇报并提交的人大议案核心就是与上述那个问题有关。因为这个问题**比我们今天在坐很多人想象的还要来的更快,我们每个人都要为此做好法律上的准备。
道德伦理大家都能理解,将来人工智能是服务我们人类的,而不是颠覆和主宰人类。因此我们的伦理、人文上有一系列需要研究的地方。这就是人工智能宣言的几个核心的层面。我想说的是,今天人工智能绝对跟每一位社**民众,每一个企业,每一个从中央到地方的政府都是密不可分的,因为它已经不仅是一门科学和一个产业,更是一个伟大的历史进程,涉及到了社**问题的方方面面,从技术、产业、法律到伦理和人文。
与此同时,今天全球产业都面临着转型升级压力,这既是动力,也是机遇,所以在去年年初,中国专门提出了《中国制造2025》,它是未来中国制造业以及中国产业发展非常重要的指南。但是一年后的今天,我们认为《中国制造2025》一定要跟人工智能匹配在一起,如果只有中国制造,未来产业的效率以及产业的水平将远远跟不上时代的需要。在过去30年里,我们创造了经济上的奇迹,但是在全球产业链上我们仍处于价值链的低端。
新双创时代到来之际,如果我们抓住了人工智能产业的机遇,我们将**在全球的价值链中掌握更大的话语权和影响力。如果我们丢掉人工智能话语权,我们将继续给全世界打工,这就是我们面临的现状。所以一定要把人工智能和中国制造,提升到“双能驱动、并驾齐驱”的战略高度,要让人工智能上升为真正的国家战略。
这绝不是一个企业或是一个行业的事情,它事关国家和民族全局。我今天特别高兴站在这里,而且有这么多的伙伴来参加分享。今天人工智能在中国拥有前所未有的良好机遇,社**各界高度关注和认同。我们以科大讯飞和众多合作伙伴为代表,在源头核心技术上处于全球的顶尖水平,我们还有众多的产业伙伴共同形成产业生态。
所以,我相信在人工智能第三次大潮到来之际,我们大家是能够共同携手努力,能够在第三次浪潮到来的时候,不仅通过人工智能为中国产业的未来,为社**的进步作出贡献,也可以为全世界的未来做出更大的历史功绩。因此,希望我们能够齐心协力,精诚合作,让我们共同在中国用人工智能改变世界,谢谢大家。
作者:亚萌
来源:http://www.leiphone.com/news/201611/tGzhRwFYBt1earg8.html
本文来源于人人都是产品经理合作媒体@雷锋网,作者@亚萌