行业新闻

中美AI差距有多大 看看这些NIPS数据就知道了

  中国与美国的AI差距有多大?真相比你想的更恐惧:根据AI领域顶会NIPS两年论文统计结果,无论是学术、产业,还是产学结合,美国至少领先中国10倍。是时候给国内浮躁的AI圈,浇一盆清醒的凉水了。西方在AI研究方面仍然遥遥领先,中国并没有展现出要取代西方地位的迫在眉睫的威胁。

  这是美国风险投资公司Thundermark的执行合伙人 、MIT计算机科学和AI实验室硕士和宾夕法尼亚大学沃顿商学院的金融与战略管理MBA Gleb Chuvpilo通过深入研究最负盛名的国际AI研究会议——神经信息处理系统会议(NIPS)得出的结论。

  NIPS 2017在加州长滩举行,吸引了8000多位注册参会者,比前一年增加了2000人。3240篇投稿论文中有679篇被接收,录取率为21%。其中,华人(第一)作者占了不小的比例,但是,换一个角度看,你就能发现完全不一样的事实。

  中国论文数量并没有想象的多,先进AI研究方面美国领先中国10倍

  通过这些会议会议论文集,我们查阅了 679 篇被接受的论文,并编制了一个完整的列表,列出了 2497 名作者和他们的所属机构(当然,很多都是重复的),然后计算出一个发表指数(Publication Index)。

  下面是生成的图表,大致遵循了因子为3的幂律分布:美国处于明显领先的地位,发表指数为414;其次是西欧,指数为136;中国第三,但较美国和西欧的距离很大,发表指数只有39。(需要提一下的是,西欧的定义为欧洲经济区EEA+瑞士,EEA包括欧盟、挪威和卢森堡;我们认为将这些欧洲国家作为一个整体是合理的,因为它们在研究资金协调和跨国合作方面十分紧密。)



  发表指数(Publication Index)的机制是这样的:每发表一篇文章得一分,然后在它的N个作者之间平均分配,每个作者的得分就是1/N(我们假设每个作者贡献相等)。然后,我们将这些得分分配给每个作者的主要所属机构(有些作者所属多个机构,这些在本研究中被忽略)。

  例如,如果一篇论文有5位作者——3位来自麻省理工学院,1位来自牛津大学,1位来自谷歌——每个作者将得到1/5分,即0.2分。因此,仅从这篇论文来看,MIT的发表指数增加3*0.2=0.6,牛津大学的发表指数增加0.2,谷歌也是增加0.2。由于MIT是美国大学,所以MIT的隶属关系将使美国的发表指数增加0.6。同样,由于牛津大学是英国的大学,EEA + 瑞士这一项的发表指数将增加0.2。最后,谷歌是一家总部位于美国的跨国公司,因此美国的发表指数再增加0.2,总增加0.8。

  某篇NIPS论文:五位作者(3位来自MIT,1位来自牛津大学,1位来自Google)

  MIT:+0.6

  牛津大学:+0.2

  Google:+0.2

  美国:+0.8

  EEA+瑞士:+0.2

  这里的想法是建立一种一致的方法论,即根据发表论文中作者数量的反比来分配分数,从而得出一套公平的综合统计数据。

  具体国家/地区的排名如下图:



  具体国家的排名结果更加引人注目,美国以414的发表指数(一如既往地)主导着AI领域的研究;接下来的三个国家的发表指数都比美国要小一个数量级,中国为39,法国为37,英国为34。换句话说,在发表先进的AI研究方面,美国领先中国10倍。

  这些数据还显示了什么呢?猜猜看,学术界和工业界的全球AI研究领导者Top 5分别是哪些呢?



  这个类别也是美国领先。毫无疑问,谷歌凭借DeepMind、Google Brain和Google Research等研究部门,以及可获取PB级的消费者数据和商业数据,位列第一。接下来是任何AI和机器人学PhD学生梦想进入的四大强校——卡内基梅隆大学(CMU)、麻省理工学院(MIT)、斯坦福大学和加州大学伯克利分校(UC Berkeley),分别排名第二,第三,第四和第五。

  接下来,让我们看看在AI人才争夺战中学术界和产业界的竞争态势:



  有意思的的是,近五分之一的AI研究来自产业界。即将毕业的博士生、博士后和主要研究人员在进入企业工作时,不得不放弃公开发表研究成果的日子一去不复返了。

  这是一件大事,AI研究社区坚持保持研究结果开放,这令人鼓舞。这场战斗尚未取得胜利,因为我们没有看到苹果公司在NIPS 2017上发表任何研究,而苹果是AI领域的关键参与者之一,凭借其Siri应用程序和HomePod产品。

  接下来,让我们看看企业之间的竞争情况:



  当然,我们已经预料到谷歌是第一。微软以其精英研究部门Microsoft Research unit位居第二,而Facebook以其FAIR位居第三。IBM Watson排在第四。得益于丰田研究院,丰田排名第五。

  最后一个问题是,如果你想要与顶尖的AI研究人员一起工作,你应该去哪里读研究生(仅参考从NIPS 2017得到的了解)?从美国的学校开始:



  如果将范围扩大到全世界,以下是排名前25的大学:



  仅从在NIPS 2017发表AI研究的数量来看,全球Top 25大学中,中国仅清华大学入榜,排名第19。

  在此基础上,我们总结了对NIPS 2017的分析。当然,仍有许多悬而未决的问题。例如,你可能会问,中国是否对最新的AI研究保密,这是中国的大学和企业没有发表更多论文的原因。虽然存在这种可能性,但我们倾向于认为这不太可能。毕竟,在NIPS发表论文对任何中国的AI研究人员来说,都是在全球获得就业机会的一个敲门砖(假设这是有价值的)。

  更有可能的解释是,中国落后了,他们的AI策略很大程度上是从其他地方复制研究结果,然后应用到国内数据集。用Peter Thiel《从0到1》一书的观点来说:“中国已经直接复制了发达国家的有用之物:19 世纪的铁路、20 世纪的空调,甚至整个城市。也许这种复制可以使中国在建设道路上少走几步—比如,不用安装陆上线路,直接实现无线通信,但是,这依然是在复制。”

  美国新安全中心的一份人工智能报告也倾向于认为:“在奥巴马执政的最后一年,白宫发布了几份旨在使美国走向更加连贯的人工智能策略的白皮书。这些报告涵盖了从监管到创新再到偏见的各种问题,推动了科学家与政府官员之间的一系列对话。该报告的一些作者认为,中国的人工智能战略反映了奥巴马政府报告中的关键原则 ——现在是中国采纳了这些原则,而不是美国。”

  NIPS 2018:美国依旧是老大哥,高校和产业论文数量质量均占优

  再来看看今年 NIPS 2018的论文接收情况。

  产业界论文入选,谷歌加上 DeepMind,一共入选了 152(107+45)篇,几乎占了所有论文的 15%。腾讯 AI Lab的表现也算抢眼,以 17 篇论文接收排在第 8。但不要忘记,根据此前腾讯 AI Lab 负责人张潼在接受采访时表示,腾讯 AI Lab 的考核指标之一,就是发顶会论文的数量。不仅如此,看第一作者,谷歌研究院也是产业机构里数量最多的,其次是 DeepMind。这说明,谷歌和 DeepMind 不仅参与/资助了大量研究,不少原创性的新想法或者新技术也源自这里。在产学结合方面,根据高校与企业合作的被接收论文数量,可以看出谷歌与许多高校有着密切合作关系,排名前17的名单中,谷歌就与7所顶尖高校有着合作。

  不仅如此,谷歌共与其他企业/院校合作并入选了85篇论文!

  学术机构方面,今年排在NIPS入选论文数量前十名的依次为:MIT、斯坦福、CMU、伯克利、佐治亚理工、普林斯顿、牛津、UIUC、康奈尔和清华。其中,清华大学以 21 篇论文被接收排在第 10 名,这个成果单独看实际上已经很优秀,只是美国的高校占据了前十名中的 8 个位置,并且前 6 名都是美国。



  而根据学术界论文的第一作者,可以看到,斯坦福、MIT、CMU、伯克利在附上“第一作者”这项约束条件下,论文接收数量依然排名前四(虽然具体位置有所变化),势头强劲。不过,清华在这里排名有所上升,超过了康奈尔和UIUC,位列第 8。香港中文大学排在第14位。

  进步中的东方古国:中国学者越来越多担任顶会领域主席和程序主席

  从 NIPS 论文接收当中,可以看出中美之间的学术实力差距还有很大的距离。不过,这也是国内很多学者不断在强调,并且已经意识到且开始采取行动的。中国确实是在进步。

  今年7月的 IJCAI,中国学者获多篇接触论文奖,华人一作论文占总接收论文的 65.5%。南京大学教授周志华还当选 IJCAI 2021年 程序主席,成为 IJCAI 史上第二位华人大会程序主席。今年,南大也有多篇论文被 NIPS 接收,周志华教授本人署名参与的也有 5 篇。

  此外,除了论文接收数量,我们更应该看中国学者在各个顶会中担任领域主席和各种主席的占比,特别是在大会报告上何时能有所突破。这些,是比论文(包括最佳论文奖)更重要的影响力的体现。

  8 月 25 日,国际模式识别会议 ICPR 2018 历经 40 年首次在中国大陆举办。作为模式识别领域的旗舰学术会议,ICPR 自1972年起,每两年召开一次。在2014年国际模式识别大会的理事会全体会议上,中国和澳大利亚围绕2018年国际模式识别大会举办权展开了激烈角逐。中国科学院自动化所模式识别国家重点实验室学术委员会主任、中科院院士谭铁牛和实验室主任刘成林代表中国作申办报告并回答了理事会的质询,最终赢得理事会青睐。

  AAAI 2019,两位程序主席之一,是南京大学的周志华教授,这也是AAAI大会自 1980 年创办以来,欧美之外国家的学者首次担任AAAI大会程序主席。

  计算机视觉领域的顶会,2019年的CVPR,微软资深研究员华刚博士将担任大会程序主席,华刚博士也是CVPR 2017、ICCV 2017的领域主席。

  2020年多媒体领域顶会 ACM Multimedia(ACM MM),阿里巴巴副总裁华先胜博士将担任大会主席,本届大会也将由阿里巴巴与意大利佩鲁贾大学和香港中文大学共同举办。

  CVPR 2021 主办团队也归属中国,中科院谭铁牛院士担任大会主席,上海科技大学的虞晶怡教授担任程序主席之一。虞晶怡教授也是 CVPR 2017 的领域主席,他当时接收新智元采访时表示:“CVPR 2017的大会主席张正友老师、程序主席吴郢和刘燕西老师,以及其他各个委员会近 40 名华人学者功不可没!”

  此外,京东副总裁的裴健博士,是现任的 ACM SIGKDD 主席(任期为 2017.07.01—2019.06.30)。ACL 2018 宣布成立国际计算语言学协会亚太地区分会(AACL,The Asia-Pacific Chapter of the ACL),百度高级副总裁、ACL前任主席王海峰将出任 AACL 创始主席,2020 年 AACL 的会议地点也将设置在亚太地区。更早一点,微软亚洲研究院副院长周明博士在 2016 年当选为ACL 候任主席。

  如今,中国的AI实力距离美国仍然有很大的差距。但是,我们也在追赶,我们也在进步。客观看待事实,并且不懈努力,没有捷径,通往第一的路都是一步一步走出来的。


Copyright © 2012-2015 亘明安防 版权所有 豫ICP备18029105号