レコメンデーションシステムの驚くべき世界【前編】

『レコメンデーションシステムの驚くべき世界』の著者であるParul Pandey氏は、インドの電力業界で働いているデータサイエンティストで、過去に停電に関する問題を機械学習を用いて解決した実績があります。同氏がMediumに投稿した記事では、機械学習を応用する代表的な分野であるレコメンデーションシステムに関するドメイン知識がまとめられています。

一般に優秀なデータサイエンティストは数学・統計学に関する専門知識、データを操作するエンジニア的なスキル、そして取り組む問題に関するドメイン知識を持っていると言われています。レコメンデーションシステムに機械学習を応用することを検討する場合にはそもそもこのシステムは何を解決しようとしているのか、そしてどのような仕組みで動作するのか、といったシステム原理を知っている必要があります。

同氏はレコメンデーションシステムについてその誕生した歴史的経緯、同システムに求められる要件、そして同システムに採用されているアルゴリズムを順を追って分かりやすく解説します。こうした解説からわかることは、機械学習はレコメンデーションシステムが対処すべき問題を解決する手法のひとつに過ぎず、もっとも優れた手法であるわけではない、ということです。また、レコメンデーションシステムに実装するアルゴリズムを選定する際には推奨するアイテムと処理できるデータを考慮すべき、とも述べられています。

以上のようなドメイン知識をふまえたうえで機械学習を解決手法のひとつとして検討する姿勢は、レコメンデーションシステムに限らず全ての機械学習の応用分野について当てはまるものでしょう。

前半に当たる以下の記事ではレコメンデーションシステムの応用事例、誕生した歴史的経緯、そしてこのシステムが満たすべき要件を解説します。

なお、以下の記事本文はParul Pandey氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。

レコメンデーションシステムの概要とそれらがターゲットマーケティングの効率的な類型を提供する方法について

PixabayからPatternPicturesの画像を引用

多くの場合、ヒトは自分が欲しいモノを見せられるまではそれを知らない：スティーブ・ジョブズ

まずクリス・アンダーソン（※訳注1）が著した著書『ロングテール』からの一節を引用する。「1988年、Joe Simpsonという名のあるイギリス人の登山家が『空虚に触れて』という題名の本を著した（※訳注2）。その本はペルーのアンデス山脈で九死に一生を得た恐るべき顛末を語っていた。批評家からは高評価を得たが、そこそこの商業的成功しか得られず、その本はすぐに忘れ去られた。それから10年後、奇妙なことが起こった。Jon Krakauerは『薄い大気に入って』を著したのだが（※訳注3）、この本も登山における悲劇を扱っており、出版されるとセンセーションを巻き起こした。すると突然、『空虚に触れて』もまた売れ始めたのだ。」

『空虚に触れて』の需要があまりに高かったので、この本がまた売れ始めてしばらくしてから『薄い大気に入って』も売り切れた。それにしても、一体何が起こったのか。両方の著作とも同じテーマにもとづいているのは明白なので、Amazonは『薄い大気に入って』が好きな読者は『空虚に触れて』も好きではないかと提案した。ヒトはこうした提案を受けた時、実際に提案された本が好きになり、好きになった結果として好意的なレビューを書く。するとその本はさらに売れて最終的にはより多くのヒトに本をレコメンデーションすることになり、ポジティブなフィードバックループが動き始める。こうした動きこそがレコメンデーションシステムのちからだ。

（※訳注1）クリス・アンダーソンは大手テック系メディアWIREDの編集長を務めたこともある著述家・起業家。同氏は「ロングテール」をはじめ「フリーミアム」「メイカーズムーブメント」といった現代テック業界における重要なビジネスモデルを提唱した。

（※訳注2）Joe Simpsonは、イギリス出身の登山家。1988年、自身のアンデス山脈での登山体験を題材にしたノンフィクション『Touching the void』を発表。日本語にも翻訳された（邦題は『死のクレバス』）。2003年、『運命を分けたザイル』というタイトルで映画化され、英国アカデミー賞の作品賞を受賞した。

（※訳注3）Jon Krakauerは、アメリカ出身の作家・登山家。1996年、エベレストの登山チームに同伴したものも遭難事故に遭い、奇跡的に生還した。1997年、この体験をノンフィクション『Into the Thin Air』としてまとめ出版。同年、同著は『空へ　エヴェレストの悲劇はなぜ起きたか』と邦題で翻訳された。

・・・

レコメンデーションシステム
なぜレコメンデーションするのか
レコメンデーション問題の定式化
- 予測バージョン
- ランキングバージョン
レコメンデーションシステムの目的

レコメンデーションシステム

レコメンデーションエンジンはヒトに対して製品あるいはサービスのレコメンドを生成しようと試みる。レコメンダーは、ヒトがもっとも買いそうなあるいは使いそうな提案を見せることによって、選択肢を狭めているとも言える。レコメンデーションシステムはAmazonからNetflix、FacebookからLinkedInまでのほとんどいたるところにある。実際、Amazonの収益の大きな部分（※訳注4）はレコメンデーションだけによって作られている。YouTubeやNetflixのような企業は、ユーザが新しいコンテンツを見つけることを手助けすることに関してレコメンデーションエンジンに頼っている。わたしたちが日々の生活で使っているレコメンデーションには、以下のようなものがある。

（※訳注4）2013年10月にマッキンゼー・アメリカ法人が発表したレポート「小売業者はどのようにして消費者に追随できるか」によると、消費者がAmazonから購入する商品の35%、Netflixで視聴される動画の75%がレコメンデーションシステムがすすめるものでった。

Amazon

Amazonは、どんな商品がいっしょに購入されているか特定するために数百万の顧客のデータを使い、そのデータにもとづいてレコメンデーションを作成している。Amazon.comのレコメンデーションはユーザによって明示的に付けられたカスタマーレビューのレーティング、購買活動、そしてブラウジングの履歴にもとづいて提供される。

私は『Show Dog』を買おうとしたが、結局『The Compound effect』も買った！

LinkedInはユーザの職歴と現在の職種名、そして推薦状から得たデータを使って、ふさわしそうな職種を提案する。

Netflix

Netflixでユーザが映画を評価したりお気に入りを設定すると、映画やテレビ番組をおすすめするためにそうしたユーザデータと何百ものほかのユーザから得た似たようなデータが使われる。評価やお気に入りの設定はNetflixがレコメンデーションを作成するのに使われているのだ。

Facebook

Facebookが使っているレコメンデーションシステムは、直接的に製品を推奨しないがユーザどうしのつながりをおすすめする。

以上の事例とは別にSpotify、YouTube、IMDB、トリップアドバイザー、Google News、そしてその他の多くのプラットフォームはレコメンデーションとユーザのニーズにぴったりな提案を継続的に提供している。

・・・

なぜレコメンデーションするのか

今日オンラインストアは隆盛を誇っているので、わたしたちはほとんどの商品をマウスのクリックひとつでゲットできてしまう。しかし、レンガとモーターの時代においては店舗に商品を保存するには物理的に限界があったので、店舗のオーナーはもっとも人気のある商品だけ陳列していた。こうした事態は、たとえオーナーが優れた書籍やCDを持っていたとしても、たくさんの商品が陳列されてなかったことを意味している。手短に言えば、店舗運営者がコンテンツを事前にフィルタリングしなければならなかったのだ。

しかし、オンラインショッピング産業は以上のような状況を一変させた。陳列スペースに限界はなくなったので、事前にフィルタリングすることはなくなった。反対に、この新たな事態はロングテール効果として知られることになった現象を引き起こした。

ロングテール現象

ロングテールとは、人気のある製品はほんの一握りでオンラインとオフラインの両方の店舗で見つけられることを意味する。それほど人気のない製品はあふれており、そうしたものはオンラインストアでのみ見つけられる。こうした商品がロングテールを構成している。しかしながら人気のない製品がよいものである可能性があり、それをウェブサイトから探すのは非常に骨の折れる作業であり、探すにはいくつかの種類のフィルターが必要になってくる。ロングテール商品を探すための現実的なフィルターのひとつとなっているのが、レコメンデーションシステムだ。

・・・

レコメンデーション問題の定式化

レコメンデーションシステムは、第一義的には以下に挙げるふたつの問題のうちの少なくともひとつに答えるように作られている。

予測バージョン

このバージョンは、ユーザと商品の結びつきに関する評価値を予測することを扱う。この場合には、ユーザによって与えられた評価値から構成されたデータを訓練することになる。訓練の目的は、評価値に関するデータを使ってユーザが相互作用しないアイテムの評価値を予測することにある。

レコメンデーションシステムの目的

レコメンデーションは、それらが関連している時にのみ価値がある

レコメンデーションシステムの最終的な目的は、企業の売上を増やすことにある。こうした目的のためにシステムがやるべきことはユーザにとって意味のある商品を見せるあるいは提供するだけである。『レコメンデーションシステム』の著者Charu C Aggarwalは著作において、レコメンデーションエンジンに望ましい目標として以下のような4項目を挙げている：

新規性

関連性とともに、新規性はもうひとつの重要な要因である。もし推奨された商品がユーザが以前に見たことのない、あるいは消費したことのないモノであるならば、より意味があるだろう。

セレンディピティ

時には何か予期していない商品を推奨するこことも売上を増やす。しかしながら、セレンディピティは新規性とは異なる。Aggarwalは以下のように述べている。

もし近所に新しいインド料理店が開店したならば、普段からインド料理を食べているユーザにこの店をおすすめすることは新規的ではあるが、必ずしもセレンディピティ的とは言えない。反対に同じユーザがエチオピアの食べ物をおすすめされた時、その食べ物がユーザに知られていなくてなおかつそれがユーザにアピールするものであるならば、そのおすすめはセレンディピティ的である。