HOME/ AINOW編集部 /2020年のAI研究は誰が先導しているか?国際機械学習会議(ICML 2020)の考察から
2020.07.30

2020年のAI研究は誰が先導しているか?国際機械学習会議(ICML 2020)の考察から

最終更新日:

著者のGleb Chuvpilo氏はAIとロボットのスタートアップに投資するベンチャーキャピタルThundermark Capitalでマネージングパートナーを務めており、AINOW翻訳記事『AI研究ランキング2019:世界を主導するAIカンファレンスであるNeurIPSとICMLの考察から【前編】』と後編の著者でもあります。同氏が最近Mediumに投稿した記事『2020年のAI研究は誰が先導しているか?国際機械学習会議(ICML 2020)の考察から』では、ICML 2020の動向が独自指標にもとづいて分析されています。
世界的なAI研究学会であるICML 2020で採択された1,088本の論文に対して、同氏はNature Indexにインスパイアされて考案した独自指標「パブリケーション・インデックス(Publication Index:略してPI)」にもとづいて、採択論文を提出した機関、大学、そして企業の動向を考察しました。そうした考察の要点は、以下のようにまとめることができます。
  • グーグルは、機関ランキングおよび企業ランキングにおいて圧倒的な1位を堅守
  • アメリカは、機関、大学、企業のそれぞれのランキングにおいて圧倒的シェア1位に君臨
  • 機関別トップ50ランキングにおいて、理化学研究所が33位にランクイン
  • 企業別トップ20ランキングにおいて、NECが18位にランクイン
  • 機関別トップ50の上位機関は、ICML 2019と比較して採択論文数を増やしている

以上のような同氏が考察した範囲で言えるのは、グーグルを筆頭とするアメリカの機関と大学がAI研究を強力にリードしている、ということです。そして、日本の機関と大学が現状通りの研究活動を続けていると、AI研究で先行している機関と大学との差が広がる、ということも言えます。日本が世界との差を縮めるためには、現状以上の努力が必要なのです。

なお、以下の記事本文はGleb Chuvpilo氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならび組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。

注記:読者諸氏はNeurIPS 2019とICML 2019の考察を組み合わせた「AIリサーチランキング2019」にも興味を持たれるかも知れません。

・・・

序論

国際機械学習会議(ICML)は、最も権威のあるAI研究会議のひとつである(もうひとつはNeural Information Processing Systems(NeurIPS))。2020年のICMLの論文採択率は21.8%で(2019年は22.6%)、4,990件の応募のうち、合計1,088件の論文が採択された。同会議の議事録(ICML 2020)を使用して、受理された論文のそれぞれに入り込み、著者とその所属機関のリストを編纂し、各機関のパブリケーション・インデックスを計算した(下記の「方法論」のセクションを参照のこと)。この指標を最も直観的に考える方法は、フルサイズの論文に相当するという観点から考えることだ。グーグルのパブリケーション・インデックスである92.2は、グーグルがICML 2020で92.2本の論文を発表したと解釈することができる。

方法論の詳述からこの分析を始め、ICML 2020でのAI研究ランキングへと続き、さらに興味深い記述統計を示し、ICML 2019とICML 2020の間の変化について議論し、最後にデータセットへのリンクで締めくくる。

方法論

私たちのパブリケーション・インデックスに関する方法論は、Nature Indexにインスパイアされている。

・・・

ある論文に対する国、地域、機関の貢献度を把握し、それらが複数回カウントされないようにするために、Nature Indexでは、各論文の著者のシェアを考慮に入れた分数カウント(fractional count:FC)を使用している。論文ごとに利用可能なFCの合計は1であり、共著した著者が等しく貢献したと仮定して、すべての著者の間で共有される。例えば、10人の著者がいる論文は、各著者が0.1のFCを受け取ることを意味する。複数の機関に所属している著者の場合、著者のFCは各機関で均等に分配される。1 機関の合計FCは、個々の所属著者のFCを合計して計算される。このプロセスは国や地域についても同様であるが、海外に研究室を持っている機関もあるという複雑な事情を鑑みて、ある機関の海外ラボに付されたFCは研究を主導した国/地域に加算される。

(※訳註1)以上の引用文は、Nature誌電子版で公開されている記事「Nature Indexのガイド」から引用されている。

パブリケーション・インデックスとNature Indexのあいあの唯一の違いは、パブリケーション・インデックスでは、海外の研究室を(研究を主導した国/地域ではなく)本社のある国/地域としてカウントするところだ。こうしたアプローチは議論の余地のある論点だが、知的財産権と研究から生じる実際の利益の割り当てを本社に反映させるのは、研究が行われた現地の研究室に帰するより望ましいと信じている。

以下にパブリケーション・インデックスの計算例を示す。ある論文の著者がMITから3人、オックスフォード大学から1人、グーグルから1人の計5人の場合、各著者は1ポイントの5分の1、つまり0.2ポイントを得ることになる。その結果、この論文だけでMITには3*0.2=0.6ポイント、オックスフォード大学には0.2ポイント、グーグルには0.2ポイントを加算されることになる。MITはアメリカに拠点を置いているので同大学がアメリカに帰属していることによって、同国のパブリケーション・インデックスが0.6増加する。同様に、オックスフォード大学はイギリスに拠点を置いているので、EEA+スイス(※訳註2)のカテゴリーは0.2増加する。最後に、グーグルはアメリカに本社を置く多国籍企業であるため、アメリカのパブリケーション・インデックスはさらに0.2増加し、MITとの合計で0.8増加する。著者が複数の所属機関に所属している場合には、その所属機関ごとに著者のFCを分割する。例えば、上記のケースでは、最後の著者が グーグルとスタンフォード大学の 2 つの所属機関を挙げていた場合、グーグル とスタンフォード大学の両方に 0.2/2=0.1 ポイントが加算されることになる。

(※訳註2)EEA(The European Economic Area)とは、EU加盟国にアイスランド、リヒテンシュタイン、そしてノルウェーを加えた欧州経済圏のこと。スイスはEUおよびEEAのメンバーではないが、EEA所属諸国と単一の経済圏を形成している。

ICML 2020でAI研究を先導しているのは誰か?

ICML 2020でAI研究をリードする世界の(産官学)機関トップ50(パブリケーション・インデックス付き)

ICML 2020でAI研究をリードする世界の(産官学)機関トップ50

(※訳註3)以下の各種ランキングにおいて、日本が関係する項目は太字とする(原文では太字ではない)

1.グーグル(アメリカ) – 92.2(※訳註4)
2.スタンフォード大学(アメリカ) – 39.2
3.MIT(アメリカ) – 38.5
4.UCバークレー(アメリカ) – 34.2
5.カーネギーメロン大学(アメリカ) – 24.0
6.マイクロソフト(アメリカ) – 22.6
7.フェイスブック(アメリカ) – 17.1
8.プリンストン大学(アメリカ) – 17.0
9.オックスフォード大学(イギリス) – 16.3
10.UTオースティン(アメリカ) – 14.3
11.UCLA(アメリカ) – 14.3
12.デューク大学(アメリカ) – 14.1
13.EPFL(スイス) – 13.9
14.ハーバード大学(アメリカ) – 13.7
15.コーネル大学(アメリカ) – 12.6
16.ETH(スイス) – 12.4
17.清華大学(中国)-12.3
18.シンガポール国立大学(シンガポール) – 12.2
19.ペンシルバニア大学(アメリカ) – 12.1
20.テクニオン(イスラエル) – 12.1
21.IBM(アメリカ) – 10.7
22.ワシントン大学(アメリカ) – 9.7
23.UCサンディエゴ(アメリカ) – 9.5
24.メリーランド大学(アメリカ) – 9.0
25.北京大学(中国) – 8.9
26.ジョージア工科大学(アメリカ) – 8.8
27.イリノイ大学アーバナ・シャンペーン校(アメリカ) – 8.7
28.ウィスコンシン大学マディソン校(アメリカ) – 8.7
29.トロント大学(カナダ) – 8.3
30.MILA(カナダ) – 8.0
31.KAIST(韓国) – 8.0
32.テキサスA&M大学(アメリカ) – 7.9
33.理化学研究所(日本) – 7.8
34.ケンブリッジ大学(イギリス) – 7.8
35.コロンビア大学(アメリカ) – 7.8
36.マサチューセッツ大学アマースト校(アメリカ) – 7.5
37. INRIA(フランス) – 7.5
38.ニューヨーク大学(アメリカ) – 7.1
39.ユニバーシティ・カレッジ・ロンドン(イギリス) – 6.8
40.南カリフォルニア大学(アメリカ) – 6.8
41.エール大学(アメリカ) – 6.6
42.ヤンデックス(ロシア) – 6.0
43.上海交通大学(中国) – 5.7
44.ミネソタ大学(アメリカ) – 5.6
45.シカゴ大学(アメリカ) – 5.6
46.マギル大学(カナダ) – 5.5
47.ソウル大学(韓国) – 5.5
48.テュービンゲン大学(ドイツ) – 5.5
49.アルバータ大学(カナダ) – 5.4
50.ライス大学(アメリカ) – 5.3

(※訳註4)グーグルがICML 2020で発表した論文と開催したワークショップは、Google AIブログ記事『ICML 2020におけるGoogle』にまとめられている。
(※訳註5)以上のICML 2020におけるパブリケーション・インデックスのトップ50機関を国籍別に分類して各国のシェアを算出すると、以下のグラフのようになる。北米とイギリスだけで、74%のシェアとなる。

また、トップ50機関に関して国籍を親構造としてツリーマップを作成すると、以下のようになる。グーグルは、1企業だけでランキング下位の国のパブリケーション・インデックスを凌駕する。


ICML 2020でAI研究をリードするアメリカの大学トップ20(パブリケーション・インデックス付き)

ICML 2020でAI研究をリードするアメリカの大学トップ20

1.スタンフォード大学 – 39.2
2.MIT – 38.5
3.UCバークレー – 34.2
4.カーネギーメロン大学 – 24.0
5.プリンストン大学 – 17.0
6.UTオースティン – 14.3
7.UCLA – 14.3
8.デューク大学 – 14.1
9.ハーバード大学 – 13.7
10.コーネル大学 – 12.6
11.ペンシルバニア大学 – 12.1
12.ワシントン大学 – 9.7
13.UCサンディエゴ – 9.5
14.メリーランド大学 – 9.0
15.ジョージア工科大学 – 8.8
16.イリノイ大学アーバナ・シャンペーン校 – 8.7
17.ウィスコンシン大学マディソン校 – 8.7
18.テキサスA&M大学 – 7.9
19.コロンビア大学 – 7.8
20.マサチューセッツ大学アマースト校 – 7.5

ICML2020でAI研究をリードする世界の大学トップ20(パブリケーション・インデックス付き)

ICML2020でAI研究をリードする世界の大学トップ20

1.スタンフォード大学(アメリカ) – 39.2
2.MIT(アメリカ) – 38.5
3.UCバークレー(アメリカ) – 34.2
4.カーネギーメロン大学(アメリカ) – 24.0
5.プリンストン大学(アメリカ) – 17.0
6.オックスフォード大学(イギリス) – 16.3
7.UTオースティン(アメリカ) – 14.3
8.UCLA(アメリカ) – 14.3
9.デューク大学(アメリカ) – 14.1
10.EPFL(スイス) – 13.9
11.ハーバード大学(アメリカ) – 13.7
12.コーネル大学(アメリカ) – 12.6
13.ETH(スイス) – 12.4
14.清華大学(中国) – 12.3
15.シンガポール国立大学(シンガポール) – 12.2
16.ペンシルバニア大学(アメリカ) – 12.1
17.テクニオン(イスラエル) – 12.1
18.ワシントン大学(アメリカ) – 9.7
19.UCサンディエゴ(アメリカ) – 9.5
20.メリーランド大学(アメリカ) – 9.0

(※訳註6)以上のICML 2020におけるパブリケーション・インデックスのトップ20大学を国籍別に分類して各国のシェアを算出すると、以下のグラフのようになる。

また、トップ20大学に関して国籍を親構造としてツリーマップを作成すると、以下のようになる。


ICML 2020でのAI研究をリードする企業トップ20(パブリケーション・インデックス付き)

ICML 2020でのAI研究をリードする企業トップ20

1.グーグル(アメリカ) – 92.2
2.マイクロソフト(アメリカ) – 22.6
3.フェイスブック(アメリカ) – 17.1
4.IBM (アメリカ) – 10.7
5.ヤンデックス(ロシア) – 6.0
6.アマゾン(アメリカ) – 5.2
7.OpenAI(アメリカ) – 4.4
8.クリテオ(フランス) – 4.4
9.Uber(アメリカ) – 4.3
10.サムスン(韓国) – 4.2
11.百度(中国) – 3.9
12.アップル(アメリカ) – 3.7
13.アリババ(中国) – 2.8
14.華為(中国) – 2.6
15.インテル(アメリカ) – 2.1
16.NVIDIA(アメリカ) – 2.0
17.クアルコム(アメリカ) – 2.0
18.NEC(日本) – 1.8
19.セールスフォース(アメリカ) – 1.7
20.ボッシュ(ドイツ) – 1.6

(※訳註7)以上のICML 2020におけるパブリケーション・インデックスのトップ20企業を国籍別に分類して各国のシェアを算出すると、以下のグラフのようになる。

また、トップ20企業に関して国籍を親構造としてツリーマップを作成すると、以下のようになる。グーグルの圧倒的1位が視覚的に理解できる。


さらなる分析

ICML 2020 とICML 2019における世界の(産官学)機関トップ50(パブリケーション・インデックス付き)

ICML 2020 とICML 2019における世界の(産官学)機関トップ50

ICML 2020とICML 2019における世界の上位50機関のパブリケーション・インデックスの変化(プラスの変化はICML 2020の方がICML 2019よりも採択論文が多いことを意味する)

1.グーグル:+19.4
2.スタンフォード大学:+14.7
3.MIT:+15.4
4.UCバークレー:+10.0
5.カーネギーメロン大学:+4.8
6.マイクロソフト:+5.9
7.フェイスブック:+7.6
8.プリンストン大学:+6.3
9.オックスフォード大学:+2.7
10.UTオースティン:+3.4
11.UCLA:+5.9
12.デューク大学:+6.9
13.EPFL:+4.3
14.ハーバード大学:+6.7
15.コーネル大学:+2.0
16.ETH:+0.3
17.清華大学:+2.8
18.シンガポール国立大学:+9.7
19.ペンシルバニア大学:+8.1
20.テクニオン:+3.9
21.IBM:+0.3
22.ワシントン大学:+0.6
23.UCサンディエゴ:+7.2
24.メリーランド大学:+4.7
25.北京大学:+3.1
26.ジョージア工科大学:-5.7
27.イリノイ大学アーバナ・シャンペーン校:-0.8
28.ウィスコンシン大学マディソン校:+4.7
29.トロント大学:+1.8
30.MILA: +4.3
31.KAIST:-3.1
32.テキサスA&M大学:+5.1
33.理化学研究所:+2.2
34.ケンブリッジ大学:+1.7
35.コロンビア大学:+1.9
36.マサチューセッツ大学アマースト校:+3.3
37. INRIA :+1.0
38.ニューヨーク大学:+3.4
39.ユニバーシティ・カレッジ・ロンドン:+2.6
40.南カリフォルニア大学:+2.4
41.エール大学:+3.0
42.ヤンデックス:+4.3
43.上海交通大学:+3.5
44.ミネソタ大学:+2.2
45.シカゴ大学:+3.0
46.マギル大学:+1.7
47.ソウル大学:-1.8
48.テュービンゲン大学:+4.5
49.アルバータ大学:+3.2
50.ライス大学:+3.9

(※訳註8)ICML2020とICML 2019における世界の上位50機関のパブリケーション・インデックスの変化をグラス化すると、以下のようになる。


ICML 2020における論文タイトルにもとづいて作成したワードクラウド

ICML 2020における論文タイトルにもとづいて作成したワードクラウド

議論

ICML 2019とICML 2020のあいだに何が変わったのかを見てみよう(2019年のデータについては、NeurIPS 2019とICML 2019の考察を組み合わせたAI研究ランキング2019を参照のこと)。ご覧のように、AI研究をリードする世界のトップ5の機関は、やはりグーグル、スタンフォード大学、MIT、UCバークレー、カーネギーメロン大学である。それぞれがICML 2020でのパブリケーション・インデックスを大幅に上げている。グーグルはICML 2020でICML 2019より19.4本多くの論文を発表し、スタンフォード大学は14.7本、MITは15.4本、UC バークレーは10.0本、カーネギーメロン大学は4.8本多く論文を発表している。ルイス・キャロルの『赤の女王のレース』のように、トップ研究者がそのリードを維持するためには、毎年より多くの論文を発表する必要があるのだ。

この場所に留まるためには、全力で走らなければならない。そして、どこか他所に行きたいならば、今の2倍速く走らなければならない(ルイス・キャロル)

データセット

なお、データサイエンスの学会でも、いまだに論文データをPythonフレンドリーな形で公開していないので🤷‍♂️、今回の分析はかなりマニュアル的なものになってしまった(すなわち、最初にHTMLを解析してから、機関名の誤字を修正したり、標準化したり、複数の機関で行を分割したり、ピボットテーブルでまとめたりなど)ことについて、ご注意頂きたい。もしバグを発見した場合は、メールでご連絡いただければ、喜んで修正します。データセットをダウンロードして弄りたい方向けに、データセットをこちらに投稿しました。楽しんでください!

・・・

私について:私の名前はGleb Chuvpiloで、AIやロボット工学のスタートアップに投資するベンチャーキャピタル、Thundermark Capitalのマネージングパートナーを務めている。MITコンピュータサイエンス・人工知能研究所で修士号を取得し、ペンシルバニア大学ウォートンスクールでファイナンスと戦略的経営のMBAを取得した。私についての詳細はこちらをご覧ください。AI、ロボット工学、イノベーション全般、あるいはスタートアップのアイデアについてお話したい方は、gleb@thundermark.comまでご連絡ください🤖。


原文
『Who’s Ahead in AI Research in 2020? Insights from the International Conference on Machine Learning (ICML 2020)』

著者
Gleb Chuvpilo

翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)

編集
おざけん

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

トップセールスが語るAIを売るために必要な3つのスキル ーAIの発展に必要なのはエンジニアだけではない!

AINOW 読者アンケートを実施中!- 編集部からのお知らせも

エッジAI専用ブースが登場!「AI・人工知能EXPO」が10/28から開催

データサイエンスのキャリアにおいてあなたを不可欠な人材にする4つのスーパーパワー

あなたのポートフォリオを目立たせる8つの機械学習/AIプロジェクト

ELYZAが人間を超える国内最大の日本語AIエンジン「ELYZA Brain」を発表 ー事業パートナーも募集

少数データから本質を抽出するスパースモデリング

機械学習におけるデータの重要性とは?基礎から実用化まで徹底解説!

DXにおける「設計図」の重要性 -データ蓄積から始めた英会話イーオンのDX

先週のAI関連人気ツイートTOP20!【2020/09/14更新】