HOME/ AINOW編集部 /心配しないで、エクセルは意外と効果的
2020.04.27

心配しないで、エクセルは意外と効果的

最終更新日:

著者のTyler Folkman氏はコンテンツマーケティング会社Branded Entertainment NetworkでAI技術部門のリーダーを務めており、AINOW翻訳記事『小さいデータにもとづいてディープラーニングを使う方法』の著者でもあります(Folkman氏の公式サイトはこちら。過去の投稿記事リンクページはこちら)。同氏が最近Mediumに投稿した記事では、Excelをデータ分析に使う是非が論じられています。

 

同氏によると、データサイエンス専用には設計されていないExcelをデータ分析に使うことに否定的なデータサイエンティストが少なからずいます。Excelを使うことを「恥」と考えるデータサイエンティストもいるほどです。
しかしながら、以下のような状況ではExcelは非常に有用なデータ分析ツールとなります。

  • 表形式に整理された少量のデータを使って、簡単な計算をしたい場合
  • データをデータサイエンティストではない人も分析可能なようにシェアしたい場合
  • 整理されたデータを素早くグラフ化したい場合

以上のようにExcelは多くのデータサイエンスにおける問題に対応していないものも、有用なユースケースが依然としてある以上、この伝統的なソフトウェアを恥じることなく使うべき、と同氏は主張しています。

ExcelはRやPythonと比べると極めて原始的なツールであることは否めませんが、その使い勝手の良さから、データサイエンティストではない人がデータ分析を手っ取り早く実行できるツールとして生き残り続けるのではないでしょうか。

なお、以下の記事本文はTyler Folkman氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。

データサイエンティストとしてExcelを使っても恥じるべきではない理由

画像出典:UnsplashMika Baumeister

データサイエンティストがMicrosoft Excelを見下すのはよくあることだ。Pythonのようなプログラミング言語と比較すると、Excelは石器時代のツールのように思われる。。拡張性がなく、結果を再現するのも難しく、VBAマクロを書き始めると、Pythonを使っているのと変わらなくなる。

以上のような風潮があっても、Excelは生き残っている。データ分析を助けるために何らかの表計算ソフトを使わないビジネスなど考えられない。Joe Reis氏(※訳註1)は、以下のように言った。

Excelは今でもビジネスの世界の主力である。第三次世界大戦後でも、ゴキブリとExcelは生き残るだろう。

(※訳註1)Joe Reis氏は、データサイエンスを活用したコンサルティング会社Ternary Dataの共同設立者。Mediumに『2019年におけるデータエンジニアリングの大きなテーマ』等を投稿している。

生き残り

ビッグデータとSparkやSnowflakeのようなセクシーなツールがある世界で、なぜExcelは生き残ってきたのだろうかと疑問に思うことだろう。地味なスプレッドシートが完全に廃れていないのはなぜなのだろうか?

私が思うに、Excelがデータを見たり分析したりするための最もユーザフレンドリーな方法のひとつだからだ。Excelは、What You See Is What You Get(WYSIWYG)(※訳註2)タイプの製品である。データを表形式で表示した状態でExcelを始めると、編集や数式の追加、ピボットテーブルの作成などを心ゆくまで行える。これらの変更を行うと、表示される内容が自動的に更新される。こうしたExcelの仕様は信じられないほど強力で、より親しみやすいものにしてくれる。

また、Excelは基本的な分析を非常に簡単かつ直観的に実行可能にしてくれる。列の平均がほしい?AVERAGE式を使えばいい。データの散布図を作成したい?データをハイライトして、「散布図」をクリックするだけでいい。このような使い勝手の良さは、信じられないほどのメリットとなっている。Excelこそ、企業がプログラミング言語を知らないスタッフにデータ分析とデータの可視化をうながすことを可能とするツールなのだ。私の考えでは、Excelは企業がデータ駆動型の文化を持つために役立つ、現存する最高のツールのひとつでなのである。

(※訳註2)「WYSIWYG」はソフトウェアのインターフェース設計における概念のひとつ。’ What You See Is What You Get ’(見たものが得られるもの)の頭文字をとっている。ディスプレイ上に表示されたものが、そのまま印刷されるソフトウェアのインタフェースを指している。ディスプレイ上の表示を変更すると、印刷結果も変わる。この概念は、GUI(Graphical User Interface:グラフィカル・ユーザ・インターフェース)における基本原則となっている。
ちなみにGUI以前に主流であったインターフェースであるCUI(character user interface)では、WYSIWYGの原則は成立していない。CUIでは、ユーザが入力した文字コマンドとその結果がコマンドラインで表示され、印刷結果の表示時にもコマンド入力が必要であった。
(※訳註3)画像には「Rユーザ」と「Pythonユーザ」が「Excel憎し」という思いで団結している様子が描かれている。

データサイエンティストはExcelを使うべきか?

前節で述べた論点については、誰もが同意できると思われる。Excelは、基本的なデータ処理や分析を簡単かつ直観的に行うための便利なツールなのだ。

しかし ― Excelは、データサイエンティストのためのツールでもあるべきなのだろうか?

それとも ―データサイエンティストは、Excelよりも高度になり過ぎているのだろうか?データサイエンスは、Excelのようなソフトウェアにとっては洗練され過ぎているのだろうか?すべての問題はPythonやRで実行されるべきなのだろうか?

私が主張したいのは、すべてのデータサイエンティストがExcelを基本的に使いこなすべきであり、ツールとして使うことを恥じるべきでもない、ということだ。

私が「恥」と言葉を使ったのは、データサイエンティストがExcelを嫌うのはあまりにも簡単だからだ。Excelは、明らかにすべての問題に対応できるツールではない。おそらくほとんどのデータサイエンスの問題にも対応していないだろう。しかし、だからといって、Excelが必要ないということにはならない。私は以下のような状況でExcelが非常に有用だと感じている。

  • 少量の表形式のデータを持っていて、簡単な計算をしたい場合。例えば、数百本のYouTube動画の再生回数をスプレッドシートにまとめているとしよう。この場合、Excelを開いて基本的な統計を計算した方がはるかに簡単で速いのだ。
  • データサイエンティストではない人たちが簡単に分析できるような状態で、結果を共有する必要がある場合。
  • きれいな表形式のデータをとても速くグラフ化したい場合。

注記:上記のすべての例では、繰り返しが予想されない一時的なリクエストであるものとする。再現可能な処理を作成する必要が出てきたら、分析が単純なものであってもプログラミング言語に移行することを推奨する。そうすることで、必要に応じた分析プロセスの再現性とスケーリングが格段に容易になる。再現性とスケーリングが容易でないことは、Excelにあるふたつの大きな欠点だ。

学習して先に進もう

この短い記事を読んで、Excelがデータサイエンスのツールボックスの中にあることを納得して頂ければ幸いである。もしあなたがExcelをあまり使ったことがないのであれば、ぜひExcelでCSVを開いてその機能を試してみよう。始めるのはとても簡単だ。

Excelの使い始め方についてのヘルプが必要な場合は、Microsoft社の無料チュートリアルを参照しよう。

最後に、Excelは多くのデータサイエンスプロジェクトには適したツールではないことも覚えておこう。大規模なデータセット、より高度な分析/機械学習、あるいは再現性のある処理の作成が必要である場合は、Excelは使用しないこと。そんな時は、お好みのプログラミング言語に戻ろう。

分析と可視化をPythonで始めるのを助けてくれるリソースが必要な場合は、私が作成したオンライン講座をチェックしてみてください。

そんなわけで、(まだExcelを使っていないならば)データサイエンスのツールボックスにこのもうひとつのツールを追加して先に進もう!


原文
『Don’t Worry, Excel is Surprisingly Effective』

Tyler Folkman氏公式サイト『Learning With Data』

Tyler Folkman氏の投稿記事リンクページ

著者
Tyler Folkman

翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)

編集
おざけん

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

【AINOWロゴがリニューアル】生成数は2000以上! AIでロゴ生成した裏側を全公開

野球もデータドリブンの時代に ー野球特化の姿勢推定AI「Deep Nine」がリリース 【プロ球団で試験導入】

先週のAI関連人気ツイートTOP20!【2020/06/01更新】

2020年6月のAI関連イベントまとめ

AI-OCRとBPOを組み合わせ一括した文書の電子化をサポートする「Documentation One」がリリース

中外製薬とFRONTEOがライセンス契約、創薬プロセスにAIを活用

ニュースは新型コロナウイルスに過剰反応しているのか?

東大・松尾氏とABEJA・岡田氏がDXをテーマに対談【6/5に無料開催】

スターバックスはコーヒー事業者ではない ― データテック企業なのだ

フォトラクションが5.7億の資金調達、AIを活用した建設特化BPOサービスの開発に着手