【インタビュー】弊社呉の機械学習の論文が、計量・数理政治学会(JSQPS)2024 Winter Meetingのポスター発表で採択
はじめに
ディップのデータサイエンティスト呉の機械学習の論文が、計量・数理政治学会(JSQPS)2024 Winter Meetingのポスター発表で採択されました。
ディリクレ過程とガウス過程で民主主義の発展を分類してみた
計量・数理政治学会(JSQPS)Webサイトより引用
本学会の目的は,会員による計量的数理的な政治学及びその関連領域における論文の執筆と学術誌への投稿支援にあります。
今回は、採択記念として、呉に計量政治学の魅力やディップでの経験について語ってもらいました。
彼がどのように計量政治学の手法をビジネスに活用し、新しい価値を生み出しているのか、興味深い話をたくさん聞けました。ぜひ、お楽しみください!
プロフィール
呉 東文
商品開発本部dip data design. Lab Data Brain課所属
ディップ株式会社商品開発本部データサイエンティスト。国際・行政修士(専門職)。一橋大 学国際・公共政策教育部国際・公共政策専攻(国際・行政コース)専門職学位課程修了後、ディップのデータサイエンティストとして就職し、現在に至る。専門はテキストアズデータ、因 果推論、大規模ベイズ機械学習をはじめとする計量政治学と計量経済学。
ブログ
インタビュー
自己紹介をお願いします。
こんにちは。
商品開発本部dip data design. Lab Data Brain課所属のデータサイエンティストの呉 東文(ご とうぶん)です。
計量・数理政治学会(JSQPS)でのポスター発表について教えてください。
この度計量・数理政治学会(JSQPS)の2024 Winter Meetingのポスター発表で採択されました。
ベイズ機械学習の手法で民主主義の発展を分類する手法を紹介する論文です。
どんな内容の論文ですか?
草稿はこちらです:
ディリクレ過程とガウス過程で民主主義の発展を分類してみた – Qiita
簡単に申し上げますと、vdemという各国各地域の各年度の民主主義スコアがあって、それをディリクレ過程とガウス過程の組み合わせのモデルで分類した結果を紹介する内容です。
このモデルでは、分類のグループの数も、グループ分けも、グループ内のトレンドの形も全部自動でやってくれます。これは別に民主主義スコアだけでなく、株価や企業の各地域のKPIの値の分類にも使えます。さらに、各国の民主主義の発展の類似度も可視化できるため、色々深掘りできます。
詳細はこちらの記事をご覧ください:
計量政治学モデルをデプロイせよ!RでモデルAPIを作成する方法 – Qiita
計量政治学とは何ですか?
計量政治学とは、国際関係論や比較政治学などの学問で使われるデータ分析の手法の総称だと勝手に思います。人によってスキルセットが違う場合もあります。
計量経済学、情報工学で開発された機械学習、医学、教育学などから知識を輸入しながら、独自の改善を加えて進化させるイメージです。
計量経済学との違いは、計量政治学はテキストデータの分析手法を比較的積極的に開発しているところにあります。
また、計量経済学でお馴染みのGMM(一般化モーメント法)やDSGE(動的確率的一般均衡)モデルはあまり使いません。さらに、独自の因果推論の手法も開発しています。
CausalImpactと合成統制法の進化:最近の計量政治学の発展 – Qiita
情報工学の機械学習と比べて、計量政治学は理論上重要な数値(quantities of interest, QOI)の抽出に重点を置きます。
例えば、情報工学だと決められた精度指標の良し悪しでモデルの質を機械的に判断しますが、計量政治学の場合、この記事のように、精度は参考にしながら、「時間と共に変化していく言葉の意味」のようなQOIの抽出と可視化が最優先目標になります。
Stanで実装されたベイズ動的word2vecで衆議院の議事録を分析してみた – Qiita
ディップで得たスキルと知識について教えてください。
ディップでは、アカデミア(学会)の世界ではおそらく得られないであろう知識をたくさん手に入れました。
この三年間で得た知識と技術はもはや文字だけで書ききれません。
まず1点目、弊社CEOの冨田社長の素晴らしいアイデアのもとで誕生したAIエージェントで、その根幹となるレコメンドシステムを開発する機会に恵まれて、計量政治学をプロダクトに組み込む一連の流れを経験することができました。
2点目は、ディップが運営する『ナースではたらこ』のレコメンドモデルのPOCをやっていますが、計量政治学の世界で開発され、より柔軟な調整が効くトピックモデルの価値を感じました。
理由は言えないですが、Rのテキスト処理パッケージquantedaと関数型プログラミングパッケージpurrrはやはりすごいなと改めて思いました。
3点目、営業部と協力して弊社が運営するバイトルの応募予測モデルを作っています。特に弊社新橋営業部(旧)1課の皆さんのPOCへの協力に感謝しています。皆さんへの恩返しとしても早めにリリースできるように頑張っていきます。
応募予測モデルでは、求人ドメインの状況をいかにモデルに落とし込むのかを考えるきっかけになった他に、ベイズ機械学習言語のStanで複雑なモデルの記述、Rのdplyrやtidyrなどのパッケージでのデータ整形、そしてRのShinyやbslibなどのパッケージでベイズモデルをアプリに組み込む素晴らしい経験が得られました。
4点目は、マーケティング部とメディアプロデュース部の効果検証では、因果推論を深く考える機会に恵まれました。特に改めて、社会の複雑な状況に柔軟に対応することを強調する計量政治学の因果推論のアプローチの強みを改めて認識しました。
▼関連記事(呉の過去のインタビューです)
因果推論を使えば既存のデータから新たな知見が手に入る
また、ディップのフィロソフィーに共感する素晴らしい仲間たちと一緒に働けること自体が、自分の成長につながりました。
データサイエンティストの仲間たちとモデル選定や最新の手法の話をするのは、自分のデータサイエンティストとしての視野を大きく広げました。
エンジニアの仲間たちからは、モデルの実装やアプリのUIUXデザインについて多くの知識・知見を学びました。
営業部の仲間たちとの会話の中で、現場で求めている分析とは何かを考えたり、いかに自分が提供できる価値をわかりやすく、かつ理論的に正しく説明するかを考えたりする素晴らしいきっかけになりました。
メディアプロデュース部の仲間たちからは、プロジェクトの目標設定や、いかにいいプロダクトを作るかについてたくさん学べました。
最後に、今回のポスター報告がきっかけで、あたらめてディップの仲間たちは専門性が高いだけでなく、非常に人情に厚いと思いました。
今回の件を社内でアナウンスした後、すでに数人の社員から対面で「おめでとうございます」を言ってくれました。このような環境で働けることはどれほど幸せなんだろうと思いました。
皆さんへの恩返として、今後もどんどんアカデミアの最先端の知識をディップのデータサイエンスプロダクトとしてリリースして、価値を提供していきたいと思います。
成果が大きかったことはなんですか。
大学院修了後になってしまいますが、人生で初めての学会でのポスター報告は大きな成果かと思います。
また、計量政治学の知識は、ビジネスでもアカデミアでも活用できる素晴らしい技術というのを証明できたと思います。
これからやりたいことを教えてください。
これからは引き続き最先端の計量政治学、計量経済学、または機械学習の知識をつけて、新しい価値をプロダクトと論文の形式で世の中にリリースできるようにしていきたいです。
ありがとうございました!
終わりに
呉が計量政治学の手法をビジネスに活用し、新しい価値を生み出すことは、他のデータサイエンティストにも大きな示唆を与えます。
理論と実践が結びついたときの可能性ははかりしれません。これからも活躍に期待しています!