近日,斯坦福大学发布了《人工智能指数 2022》(Artificial Intelligence Index Report 2022)报告,这是斯坦福大学连续第五年发布该类型的报告,该报告旨在成为世界上最可信、最权威的 AI 数据和洞察来源。今年的报告分为五个章节,包括最新的研究进展、技术、AI 伦理、投资与教育、AI 政策。
本期的智能内参,我们带来《人工智能指数 2022》的要点翻译总结,从权威机构角度分析全球人工智能行业的最新进展。
研发是推动人工智能 (AI) 快速发展的不可或缺的力量。每年学术界、工业界、政府和⺠间组织通过⼤量论⽂、期刊⽂章、人工智能会议等为 AI 研发做出贡献。从 2010 年到 2021 年,人工智能出版物的总数翻了⼀番,从 2010 年的 162,444 篇增长到 2021 年的 334,497 篇。
▲ 2010-21 年全球 AI 出版物数量
其中,2021 年这些出版物的 51.5% 是期刊⽂章,21.5% 是会议论⽂,17.0% 来自存储库。细分领域方面,自 2015 年以来,模式识别和机器学习方⾯的出版物增加了⼀倍多。其他受深度学习影响较⼤的领域,如计算机视觉、数据挖掘和自然语言处理,增幅较小。
▲ 2010-21 年按研究领域的 AI 出版物数量
按论文来源的部门来分,教育机构仍是 AI 研究的主力,而美国和欧盟的公司参与研发的程度也很高。值得一提的是,中国是唯一一个教育比重不断上升的国家(地区)。而且,迄今为止,过去 12 年中美国和中国之间的合作数量最多,自 2010 年以来增加了五倍。其次是英国与美国和中国之间的合作,增加了自 2010 年以来增长了 3 倍多。2021 年,美国和中国之间的合作数量是英国和中国之间的 2.7 倍。
▲ 2010-21 年按⾏业分列的 AI 出版物(占总数的百分比)
▲ 美国和中国在⼈工智能出版物方面的合作,2010-21
按地区来看,2021 年,东亚和太平洋地区以 42.9% 的期刊发文量领先,其次是欧洲和中亚(22.7%)和北美(15.6%)。此外,南亚、中东和北非的增⻓最为显着,在过去 12 年中,它们的 AI 期刊出版物数量分别增 长了约 12 倍和 7 倍。
▲ 2010-21 年按地区分列的 AI 期刊出版物(占世界总数的百分比)
按地理区域来分,中国保持领先地位,2021 年为 31.0%,其次是欧盟和英国,为 19.1%,美国为 13.7%。
▲ 2010-21 年按地理区域划分的 AI 期刊出版物(占世界总数的百分比)
在论⽂的被引次数上,中国的份额逐渐增加,⽽欧盟以及英国和美国的被引次数减少。这三个地理区域的总引⽤量占全球总引⽤量的 66% 以上。
▲ 2010-21 年按地理区域划分的 AI 期刊引⽤次数(占世界总数的百分比)
在专利方面,2021 年提交的专利数量是 2015 年的 30 倍以上,复合年增⻓率为 76.9%。中国的专利数已经占了世界⼀半,并获得约 6% 的授权。
▲ AI 专利申请数量,2010‒21 年
▲ 2010-21 年按地理区域划分的⼈⼯智能专利申请(占世界总数的百分⽐)
AI 开源软件库方面,TensorFlow 仍最受欢迎的,GitHub 累计星数约为 161,000,⽐ 2020 年略有增加,远高于排名第二的 OpenCV。
▲ AI LIBRARY 的 GITHUB STARS 数量(超过 40K STARS),2014‒21
今年技术性能这⼀章节对 AI 各个⼦领域的技术进步进⾏了⽐以往更多的分析,包括计算机视觉、语⾔、强化学习等技术的趋势。
1、计算机视觉
图像分类:图像分类是指机器对图像中看到的内容进行分类的能力。 过去⼗年图像识别系统技术取得了巨⼤的进步,特别是研究⼈员已经采⽤了更多的机器学习技术。截⾄ 2021 年底,顶级图像分类系统在 Top-1 准确度上每 10 次分类尝试平均产⽣ 1 个错误,相比之下,2012 年底 每 10 次尝试平均 4 次 错误 。2021 年,最顶级的预训练系统是 CoAtNets,由⾕歌研究⼈员制作。
图像生成:图像⽣成是⽣成与真实图像⽆法区分的图像的任务。如下图所示,2021 年,AI 已经可以合成非常难以区分的人脸照片。
▲ GAN 在⼈脸⽣成⽅⾯的进展
深度伪造检测:许多人工智能系统现在可以⽣成与真实图像⽆法区分的假图像,例如通过换脸来实现所谓的“深度伪造”。近几年,研究人员一直试图通过制作更强大的深度伪造检测算法来跟上伪造步伐。FaceForensics++ 是⼀个深度伪造检测基准测试,。2012 年,最强的 AI 技术可以在四个 FaceForenics++ 数据集中正确识别 69.9% 的深度伪造。2021 年,该数字增加到 97.7% 。
医学图像分割:医学图像分割是指 AI 系统在医学图像中分割感兴趣对象(例如器官、病变或肿瘤)的能⼒。目前,AI 能够在 CVC-ClinicDB 数据集上以 94.2% 的正确率识别结肠镜检查息⾁,相比 2015 年提⾼了 11.9 个百分点。
人脸检测:虽然目前的一些面部识别算法的成功率接近 100%,但因为疫情的影响,戴口罩面部识别成为了 AI 技术新的挑战。2021 年,北京邮电⼤学的研究⼈员发布 了 6000 张蒙⾯⼈脸的⼈脸识别数据集,以应对⼤规模戴⼝罩带来的新识别挑战。研究⼈员在各种⾯部识别数据集上运⾏了⼀系列现有的最先进的检测算法,结果表明,与未蒙⾯相⽐,顶级⽅法在蒙⾯⾯孔上的表现要差 5 到 16 个百分点。
▲ 北邮 MLFW 数据库
▲ 最新 AI MLFW 数据库检测准确性
2、语言理解
目前的英文语言理解用的最新基准测试为 SuperGLUE,于 2019 年 5 月发布。在测试中,AI 系统在八种不同的任务上进行测试。截至目前最先进的系统为 SS-MoE 模型,在 SuperGLUE 上的得分为 91.0,已经超过了人类。
▲ SuperGLUE 得分
在另一项斯坦福问答数据集(SQuAD)中,AI 最新得分为 95.7 和 93.2,也超过了人类的表现。
▲ SQUAD 1.1 和 SQUAD 2.0 得分
但是,对于需要逻辑推理的问题上 AI 貌似仍力不从心。在由新加坡国立大学科学家创建的数据集 ReClor 中,困难问题的最好表现只有 69.3% 的准确率。
▲ 需要逻辑推理的阅读理解数据集(RECLOR):准确性
自然语言推理方面,目前斯坦福⾃然语⾔推理 (SNLI) 数据集表现最好的模型是 FacebookAIUSA 的 EFL,其在 2021 年 4 ⽉的得分为 93.1%。
3、强化学习
强化学习的测试标准是 2013 年推出的 Arcade Learning Environment(Atari-57),2019 年末,DeepMind 的 MuZero 算法在 Atari-57 上 实现了最先进的性能。到了 2021 年,来⾃清华⼤学和字节跳动的研究⼈员开发出了 GDI-H3 模型,该模型在 Atari 上的性能超过了 MuZero -57 的近一倍。
▲ ATARI-57 得分
4、机器人
调查结果显⽰在过去七年中,机器⼈⼿臂的价格有明显的下降趋势。2017 年,价格中位数机器人手臂的价格是 42,000 美元。从那时起,价格已经下降了 46.2%,⼤致达到了 2021 年的 22,600 美元。
▲ 2017-21 年机器人⼿臂的平均价格
并且,现在机器人相关的 AI 技术的普及率也出现了大幅提升。
▲ 机器人教授使⽤的人工智能技能比例
1、工作
新西兰的人工智能招聘增⻓最快 ——2021 年是 2016 年的 2.42 倍,其次 是⾹港(1.56)、爱尔兰(1.28)、卢森堡(1.26)和瑞典(1.24)。此外,从 2020 年到 2021 年,许多国家或地 区的 AI 招聘增⻓率有所下降
▲ 2021 年按地理区域划分的相对⼈⼯智能招聘指数
在 2021 年所有职位发布中,⼈⼯智能职 位发布的份额最⼤的是机器学习技能(占所有职位发布的 0.6%),其次是人⼯智能(0.33%)、神经⽹络(0.16%)和⾃然语⾔处理(0.13%) )。
美国信息部⻔的所有职位发布中有 3.30% 与 AI 相关,其次是科学和技术服务(占所有列表的 2.59%)、制造(2.02%)和⾦融和保险(1.81%)。
▲ 2021 年按⾏业分列的美国 AI 职位发布(占所有职位发布的百分⽐)
AI 的渗透率方面,印度在⼈⼯智能技能渗透率⽅⾯领先世界 ——2015 年⾄ 2021 年全球平均⽔平的 3.09 倍 —— 紧随其后的是美国(2.24)和德国(1.7)。之后是中国(1.56)、以⾊列(1.52)和加拿⼤(1.41)。
▲ 2015-21 年按地理区域划分的相对 AI 技能渗透率
2、投资
目前,私人投资仍是 AI 投融资的主流,其次是并购、公开发行和少数股权。2021 年,全球对⼈⼯智能的私⼈投资总额约为 935 亿 美元,是 2020 年私⼈投资总额的两倍多。
▲ 按投资活动划分的全球企业对⼈⼯智能的投资,2013-21 年
在披露融资⾦额的公司中,与 2020 年相⽐,2021 年 1 亿 美元⾄ 5 亿美元的 AI 融资轮数增加了⼀倍多,⽽ 5000 万 美元⾄ 1 亿美元的融资轮数也增加了⼀倍多。
▲ 2013-21 年⼈⼯智能领域的私⼈投资
2021 年,美国在获得资助的 AI 公司的总体私⼈投资⽅⾯居世界⾸位,约为 529 亿美元,是排名第⼆的国家中国(172 亿美元)的三倍。排在第三位的是英国(46.5 亿美元),其次是以⾊列(24 亿美元)和德国
(19.8 亿美元)。2021 年,美国有 299 家新投资的 AI 公司,其次是中国,有 119 家,英国有 49 家,以⾊列有 28 家。
▲ 2021 年按地理区域划分的 AI 私⼈投资
行业领域方面,2021 年⼈⼯智能领域最⼤的私⼈投资是数据管理、处理和云(约 122 亿美元)。在过去五年中,医疗和保健 类别获得了全球最⼤的私⼈投资(289 亿美元);其次是 数据管理、处理和云计算(269 亿美元);⾦融科技(249 亿美元);和零售(219.5 亿美元)。
3、教育
在北美,⼤多数与⼈⼯智能相关的课程都是作为本科阶段 CS 课程的⼀部分提供的。从 2010 年到 2020 年,北美博⼠机构的新 CS 本科毕业⽣ 数量增⻓了 3.5 倍。2020 年,超过 31,000 名 本科⽣完成了计算机科学学位,⽐ 2019 年增加了 11.60%。并且,2020 年每 5 名 CS 学⽣中就有 1 名获得了 AI / ML 博⼠学位。
▲ 2010-20 年北美博⼠机构的新 CS 本科⽣⼈数
▲ 2020 年按专业划分的美国新 CS 博⼠(占总数的百分⽐)
从 2016 年到 2021 年, 共有 25 个国家通过了 55 项与⼈⼯智能相关的法案,其中美国以 13 项法案占据榜首,其次是俄罗斯、⽐利时、西班⽛和英国。2021 年颁布的法律数量上,西班⽛、英国和美国领先,各超过三项。
▲ 2021 年与 AI 相关的法案数量国家排名
美国 2015 年只有一项联邦法案与人工智能相关,2021 年提升到了 130 项。
▲ 2016 年以来典型的国家人工智能相关立法
在 2021 财年 (FY),⾮国防美国政府机构共为 AI 研发⽀出分配了 15.3 亿美元,约为 2018 财年⽀出的 2.7 倍。预计 2022 财年这⼀数字将增⻓ 8.8%,申请总额为 16.7 亿美元。
▲ 美国联邦⾮国防⼈⼯智能研发预算,2018-22 财年
而美国国防部 2021 年在 500 个⼈⼯智能研发项⽬中拨款 92.6 亿美元,⽐ 2020 年的 86.8 亿美元增加 6.68%。国防部在人工智能上的支出也是最多的,2021 年,它在与⼈⼯智能相关的合同上花费了 11.4 亿 美元,大约是第⼆⾼的部⻔卫⽣与公众服务部(2.34 亿美元)花费的五倍。
▲ 国防部前五名资⾦最多的项⽬
▲ 2021 年美国政府部⻔和机构在 AI 上的最高合同⽀出
智东西认为,虽然 2021 年是个多事之秋,但人工智能的发展仍然一路高歌猛进,私人投资翻一番,新技术不断突破都给这个行业的发展打了强心剂。尤其值得欣慰的是,在中美国家关系日趋复杂的现在,AI 行业的中美合作仍很紧密,这是人类科学技术在冲突与斗争大环境下的一丝慰藉。