TikTokはなぜユーザを虜にしたのか？その理由はユーザを夢中にしたAIアルゴリズム【後編】

著者のCatherine Wang氏はオーストラリア在住のAIエンジニアであり、未来に対する「ブラックボックス的な」思考を避けるという信条から、AI技術の解説記事をMediumに投稿しています（詳しい経歴は同氏のLinkedInを参照）。同氏がMediumに投稿した記事のひとつ『TikTokはなぜユーザを虜にしたのか？その理由はユーザを夢中にしたAIアルゴリズム』では、TikTokのレコメンデーションsが数式やソースコードを使わずに平易な言葉で解説されています。
現在では世界的なシュートビデオアプリの代表と見なされているTikTokの魅力は、ユーザを虜にするコンテンツのレコメンデーションシステムにあります。Wang氏は公表されている技術ブログ記事やリバースエンジニアリングを試みたギークたちの知見に基づいて、同アプリのレコメンデーションアルゴリズムの仕組みを以下のように推測しました。

学習データの生成と学習に関しては、その要点を以下のようにまとめることができます（翻訳記事前編で詳述）。

TikTokの学習データの素材となるのは、日々投稿されるコンテンツ、生年月日や職業といったユーザ情報、そしてユーザの行動履歴の3つ。この3つの素材から様々な特徴量を抽出して、学習データを生成している。
学習データの生成とレコメンデーションAIモデルへの投入は、リアルタイムに実行されている。それゆえ、ひとつの動画の閲覧が即座にレコメンデーションに影響する。
有害コンテンツの検出のようなAIモデルの学習だけでは対応するのが困難なタスクに関しては、AIと人間が協働する体制を採用して遂行している。

レコメンデーションのワークフローに関しては、以下のようにまとめることができます（翻訳記事後編で詳述）。

有害コンテンツ審査を通過したコンテンツは、200～300人のアクティブユーザに閲覧される初期トラフィックプールに投入される。この段階では、新規クリエイターの動画とインフルエンサーのそれが区別されることなく平等に処理される。
初期トラフィックプールにおける閲覧にもとづいて、動画が評価される。評価が高い上位1%はあらゆるユーザが閲覧できるトレンディプールに投入される。また、動画を評価する過程で、ユーザの嗜好と動画の内容が合致するようにユーザ情報が更新される。
平均的なクリエイターの動画が、突然バズることがある。こうしたことが起こるのは、古くても高品質な動画を発掘したり、トレンド入りした動画に類似した動画の露出を増やしたりするアルゴリズムが働いているからである。
投稿された動画が各種トラフィックループに投入される期間は、せいぜい1週間以内である。1週間後には、バズった動画とその関連動画の露出は急激に低下する

以上のような仕組みを構築したことにより、TikTokは特定のジャンルに偏ることなく多様な動画をレコメンドするのと同時に、新規クリエイターとインフルエンサーに平等にバズる機会を提供しているのです。こうした巧妙に設計されたアルゴリズムこそが、TikTokが世界的なアプリに成長した原動力なのでしょう。

後編にあたる以下の記事本文では、TikTokのレコメンデーションのワークフローについて解説します。

なお、以下の記事本文はCatherine Wang氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならび組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。

tenorのJaySanProductionより

3.　TikTokのレコメンデーションのワークフロー

3.　TikTokのレコメンデーションのワークフロー

TikTokは、そのコアとなるアルゴリズムを一般の人々やテックコミュニティに対して決して公開していない。しかし、同社を経由して投稿された断片的な情報や、リバースエンジニアリング技術を使ってギークたちが発見した痕跡に基づいて、私は以下のような結論を導き出した。

(免責事項 – これは私の解釈と推定であり、TikTokが実際に実行していることから逸脱しているかも知れません)

ステップ0：ユーザ生成コンテンツ（UGC）に関するデュオ監査システム

TikTokでは、ユーザが毎日何百万ものコンテンツをアップロードしている。悪意のあるコンテンツは、機械のみによる審査システムの抜け穴を容易に見つけることができ、すべて手動で行う審査は現実的ではない。それゆえ、機械と人間が協働して審査するデュオレビューは、TikTokの動画コンテンツをスクリーニングするための主要なアルゴリズムとなっている。

マシンレビュー：一般的に言えば、（コンピュータビジョンに基づいた）デュオ監視モデルは、動画の画像やキーワードを識別することができる。このモデルには、主に2つの主要な機能がある。1) クリップに違反があるかどうかをレビューし、著作権もチェックする。違反が疑われる場合は、コンテンツはモデルによって差し止められ、人間によるレビューのために黄色または赤としてタグ付けされる。2) TikTokのデュオ監査アルゴリズムは、動画から画像とキーフレームを抽出して、抽出された情報を膨大にアーカイブされたコンテンツベースと照合する。重複箇所はピックアップされ、より低いトラフィックルートに送られ、レコメンデーションエンジンの負荷を軽減している。

マニュアルレビュー：このレビューでは、主に動画タイトル、カバーサムネイル、動画キーフレームという3つの領域に焦点を当てている。デュオ監視モデルで不審なコンテンツとしてタグ付けされたものについては、専任担当者が手動でレビューを行う。規制に違反していると判断された場合は、動画を削除し、アカウントを停止する。

ステップ1：コールドスタート

TikTokがレコメンドする仕組みのコアとなるのは、情報フローファンネル（Information Flow Funnel：”funnnel”は「漏斗（じょうご）」を意味する英単語）だ。コンテンツがデュオ監視モデルの審査を通過すると、コールドスタートのトラフィックプールに入れられる。例えば、新しい動画が審査を通過した後、TikTokはその動画に対して200～300人のアクティブユーザがいる初期トラフィックを割り当て、そこから動画は最大数千人の視聴者に対して露出することができる。

以上のメカニズムにおいては、新しいクリエイターが（数万人のフォロワーがいるかも知れない）ソーシャルインフルエンサーと競い合うことができる。というのも、両者のスタート地点が同じだからだ。

ステップ2：指標に基づいた評価

初期のトラフィックプールを通じて、動画は何千回もの閲覧数が得られ、そんな閲覧に関するデータが収集され、分析される。分析で考慮すべき指標には、いいね、閲覧数、完全な閲覧、コメント、フォロワー、リポスト、共有などがある。

そして、レコメンデーションエンジンは、これらの初期指標と（高品質なクリエイターであるかどうかを判断する）ユーザのアカウントスコアに基づいて、ユーザのコンテンツを評価する。

エンジンがあなたのコンテンツを重要であると判断した場合、とくに上位10％と判断した場合は、追加的に10,000〜100,000のトラフィックに対して露出が見込めるようにフィードされる。

ステップ3：ユーザプロファイルの増幅器

ステップ２のトラフィックプールから得られるフィードバックは、ユーザプロファイル増幅器の使用に際する決定のためにさらに分析される。このステップでは、特定のユーザグループ（例えば、スポーツファン、ファッション愛好家）において優れていると判断されたコンテンツは強化され、増幅される。

コンテンツの強化および増幅のプロセスは、「こんなものも好きかも」機能のコンセプトに似ている。レコメンデーションエンジンは、コンテンツとユーザグループの間で最適なマッチングを見つけることができるようにするために、ユーザのプロフィールベースを構築する。

ステップ4：ブティックトレンドプール

コンテンツの1%未満が最終的にトレンディングプールに入る。このプールに入ったコンテンツが得られる露出量は、他のものよりも桁違いに多い。なぜなら、トレンディングコンテンツは、すべてのユーザに無差別にレコメンドされるからだ。(あくまで仮定の話だが、誰であろうと「Black lives matter」の最新の抗議動画を見たいと思うかも知れない)

その他のステップ：遅延発火

一部のTiktokersは平均的なパフォーマンスで投稿していたら、数週間後に突然、自分たちのコンテンツが大きくバズることがあるのに気づいているだろう。

以上の現象が生じるのは、主に2つの理由がある。

- 第一に、TikTokは古いコンテンツを再発見したり、露出する候補となる高品質なコンテンツを発掘したりするアルゴリズム（通称「gravedigger（墓掘り人）」）を持っている。あなたのコンテンツがこのアルゴリズムによってピックされた場合、それはあなたのアカウントがこのアルゴリズから新規なラベルを得るのに十分なほど目立つ動画を持っていることを意味している。このラベルがあることで、gravediggerアルゴリズムはますますあなたのコンテンツを見つけられるようになる。
- 第二に、「トレンディ効果」がある。この効果は、あなたのコンテンツのひとつが何百万回もの閲覧数を得た場合、あなたのメインページへトラフィックが誘導され、その結果としてTikTokユーザがあなたの古いコンテンツを閲覧する機会が増えることを意味している。この効果は、卓越したクリエイター（例：かわいい猫の動画のクリエイター）でよく発生する。ひとつのトレンディな動画が、他のすべての高品質な動画に火をつけるのだ（人々はあなたのかわいくて好奇心旺盛な猫をもっと見たいと思っている）。

wiflegif.com

制限：トラフィックピーキング

あるひとつのコンテンツ群が、以上で解説した情報の流れを濾すファンネル（デュオ監視モデル、評価の反復、そして増幅器）を通過すると、クリエイターのアカウントは過剰なまでに露出し、ユーザと相互作用し、そしてファンを獲得する。

しかし、この高露出時間の窓が開いている時間は、研究によると短いものだ。通常、この窓は1週間前後で終了する。この時間枠を過ぎると、高露出したコンテンツやアカウントが持っていた熱が冷めていき、バズった動画に続く動画ですらほとんどバズらなくなる。

なぜこんなレコメンデーションシステムを作ったのか

その主な理由は、TikTokが多様性を導入し、アルゴリズムの意図しないバイアスを取り除きたいと考えているからである。以上に解説した設計により、レコメンデーションエンジンは特定のタイプのコンテンツに傾くことがなく、それゆえ新しいコンテンツがトレンドのプールに入る機会を平等に得ることができるようになるのだ。

参考URL：

https://www.businessofapps.com/data/tik-tok-statistics/
https://mediakix.com/blog/top-tik-tok-statistics-demographics/
https://en.wikipedia.org/wiki/TikTok
http://shop.oreilly.com/product/9780596529321.do
https://sensortower.com/
https://www.nytimes.com/2020/06/03/technology/tiktok-is-the-future.html

・・・

私について：私はオーストラリアのメルボルンに住んでいます👧🏻。コンピュータサイエンスと応用統計学を勉強しました。汎用技術に情熱を注いでいます。世界的なコンサルティング会社でAIエンジニアのリード👩🏻‍🔬として働き、組織がAIソリューションを統合し、AIの革新的なパワーを活用するのを支援しています。さらなる私の詳細についてはLinkedInを閲覧のこと。