最終更新日:
一般に優秀なデータサイエンティストは数学・統計学に関する専門知識、データを操作するエンジニア的なスキル、そして取り組む問題に関するドメイン知識を持っていると言われています。レコメンデーションシステムに機械学習を応用することを検討する場合にはそもそもこのシステムは何を解決しようとしているのか、そしてどのような仕組みで動作するのか、といったシステム原理を知っている必要があります。
同氏はレコメンデーションシステムについてその誕生した歴史的経緯、同システムに求められる要件、そして同システムに採用されているアルゴリズムを順を追って分かりやすく解説します。こうした解説からわかることは、機械学習はレコメンデーションシステムが対処すべき問題を解決する手法のひとつに過ぎず、もっとも優れた手法であるわけではない、ということです。また、レコメンデーションシステムに実装するアルゴリズムを選定する際には推奨するアイテムと処理できるデータを考慮すべき、とも述べられています。
以上のようなドメイン知識をふまえたうえで機械学習を解決手法のひとつとして検討する姿勢は、レコメンデーションシステムに限らず全ての機械学習の応用分野について当てはまるものでしょう。
前半に当たる以下の記事ではレコメンデーションシステムの応用事例、誕生した歴史的経緯、そしてこのシステムが満たすべき要件を解説します。
なお、以下の記事本文はParul Pandey氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。
レコメンデーションシステムの概要とそれらがターゲットマーケティングの効率的な類型を提供する方法について
多くの場合、ヒトは自分が欲しいモノを見せられるまではそれを知らない:スティーブ・ジョブズ
まずクリス・アンダーソン(※訳注1)が著した著書『ロングテール』からの一節を引用する。「1988年、Joe Simpsonという名のあるイギリス人の登山家が『空虚に触れて』という題名の本を著した(※訳注2)。その本はペルーのアンデス山脈で九死に一生を得た恐るべき顛末を語っていた。批評家からは高評価を得たが、そこそこの商業的成功しか得られず、その本はすぐに忘れ去られた。それから10年後、奇妙なことが起こった。Jon Krakauerは『薄い大気に入って』を著したのだが(※訳注3)、この本も登山における悲劇を扱っており、出版されるとセンセーションを巻き起こした。すると突然、『空虚に触れて』もまた売れ始めたのだ。」
『空虚に触れて』の需要があまりに高かったので、この本がまた売れ始めてしばらくしてから『薄い大気に入って』も売り切れた。それにしても、一体何が起こったのか。両方の著作とも同じテーマにもとづいているのは明白なので、Amazonは『薄い大気に入って』が好きな読者は『空虚に触れて』も好きではないかと提案した。ヒトはこうした提案を受けた時、実際に提案された本が好きになり、好きになった結果として好意的なレビューを書く。するとその本はさらに売れて最終的にはより多くのヒトに本をレコメンデーションすることになり、ポジティブなフィードバックループが動き始める。こうした動きこそがレコメンデーションシステムのちからだ。
・・・
目次
レコメンデーションシステム
レコメンデーションエンジンはヒトに対して製品あるいはサービスのレコメンドを生成しようと試みる。レコメンダーは、ヒトがもっとも買いそうなあるいは使いそうな提案を見せることによって、選択肢を狭めているとも言える。レコメンデーションシステムはAmazonからNetflix、FacebookからLinkedInまでのほとんどいたるところにある。実際、Amazonの収益の大きな部分(※訳注4)はレコメンデーションだけによって作られている。YouTubeやNetflixのような企業は、ユーザが新しいコンテンツを見つけることを手助けすることに関してレコメンデーションエンジンに頼っている。わたしたちが日々の生活で使っているレコメンデーションには、以下のようなものがある。
Amazon
Amazonは、どんな商品がいっしょに購入されているか特定するために数百万の顧客のデータを使い、そのデータにもとづいてレコメンデーションを作成している。Amazon.comのレコメンデーションはユーザによって明示的に付けられたカスタマーレビューのレーティング、購買活動、そしてブラウジングの履歴にもとづいて提供される。
LinkedInはユーザの職歴と現在の職種名、そして推薦状から得たデータを使って、ふさわしそうな職種を提案する。
Netflix
Netflixでユーザが映画を評価したりお気に入りを設定すると、映画やテレビ番組をおすすめするためにそうしたユーザデータと何百ものほかのユーザから得た似たようなデータが使われる。評価やお気に入りの設定はNetflixがレコメンデーションを作成するのに使われているのだ。
Facebookが使っているレコメンデーションシステムは、直接的に製品を推奨しないがユーザどうしのつながりをおすすめする。
以上の事例とは別にSpotify、YouTube、IMDB、トリップアドバイザー、Google News、そしてその他の多くのプラットフォームはレコメンデーションとユーザのニーズにぴったりな提案を継続的に提供している。
・・・
なぜレコメンデーションするのか
今日オンラインストアは隆盛を誇っているので、わたしたちはほとんどの商品をマウスのクリックひとつでゲットできてしまう。しかし、レンガとモーターの時代においては店舗に商品を保存するには物理的に限界があったので、店舗のオーナーはもっとも人気のある商品だけ陳列していた。こうした事態は、たとえオーナーが優れた書籍やCDを持っていたとしても、たくさんの商品が陳列されてなかったことを意味している。手短に言えば、店舗運営者がコンテンツを事前にフィルタリングしなければならなかったのだ。
しかし、オンラインショッピング産業は以上のような状況を一変させた。陳列スペースに限界はなくなったので、事前にフィルタリングすることはなくなった。反対に、この新たな事態はロングテール効果として知られることになった現象を引き起こした。
ロングテールとは、人気のある製品はほんの一握りでオンラインとオフラインの両方の店舗で見つけられることを意味する。それほど人気のない製品はあふれており、そうしたものはオンラインストアでのみ見つけられる。こうした商品がロングテールを構成している。しかしながら人気のない製品がよいものである可能性があり、それをウェブサイトから探すのは非常に骨の折れる作業であり、探すにはいくつかの種類のフィルターが必要になってくる。ロングテール商品を探すための現実的なフィルターのひとつとなっているのが、レコメンデーションシステムだ。
・・・
レコメンデーション問題の定式化
レコメンデーションシステムは、第一義的には以下に挙げるふたつの問題のうちの少なくともひとつに答えるように作られている。
予測バージョン
このバージョンは、ユーザと商品の結びつきに関する評価値を予測することを扱う。この場合には、ユーザによって与えられた評価値から構成されたデータを訓練することになる。訓練の目的は、評価値に関するデータを使ってユーザが相互作用しないアイテムの評価値を予測することにある。
ランキングバージョン
率直に言えば、レコメンデーションを行うために特定の商品に対するユーザの評価値を予測することは必要不可欠ではない。ユーザの振舞いを予測することにあまり関心をもたない小売業者やEコマース企業もある。こうした業者や企業は、ヒトに見せられるベストなモノに関する限定的なリストを作成することにより多くの興味がある。同様に、顧客は自分たちが商品にくだす評価を予測する能力のあるシステムを見たいとは思っておらず、自分たちが好きになりそうなモノを見たいだけなのである。
レコメンデーションエンジンの成功はヒトに対してベストな推奨を見つける能力があるかどうかに依存しているのあって、ヒトが好きになりそうなものを見つけることに焦点を合わせることには意味があるが、ヒトが嫌いになりそうな商品を予測することには意味がない。
・・・
レコメンデーションシステムの目的
レコメンデーションシステムの最終的な目的は、企業の売上を増やすことにある。こうした目的のためにシステムがやるべきことはユーザにとって意味のある商品を見せるあるいは提供するだけである。『レコメンデーションシステム』の著者Charu C Aggarwalは著作において、レコメンデーションエンジンに望ましい目標として以下のような4項目を挙げている:
関連性
推奨される商品は、もしそれらがユーザと関連しているならば、その時にのみ意味がある。ユーザは興味を覚えた商品をより多く購入したり、消費したりするだろう。
新規性
関連性とともに、新規性はもうひとつの重要な要因である。もし推奨された商品がユーザが以前に見たことのない、あるいは消費したことのないモノであるならば、より意味があるだろう。
セレンディピティ
時には何か予期していない商品を推奨するこことも売上を増やす。しかしながら、セレンディピティは新規性とは異なる。Aggarwalは以下のように述べている。
もし近所に新しいインド料理店が開店したならば、普段からインド料理を食べているユーザにこの店をおすすめすることは新規的ではあるが、必ずしもセレンディピティ的とは言えない。反対に同じユーザがエチオピアの食べ物をおすすめされた時、その食べ物がユーザに知られていなくてなおかつそれがユーザにアピールするものであるならば、そのおすすめはセレンディピティ的である。
多様性
レコメンデーションにおける多様性が増えることも同様に重要である。ほかのモノと似たような商品を単純におすすめしても、その商品の使用は増えない。
▼後編はこちらから
原文
『The Remarkable world of Recommender Systems』
著者
Parul Pandey
翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)
編集
おざけん