#タグから探す

HOME/ AINOW編集部 /「差別を植え付けるデータ」MITが大規模データセットを削除 -問われるデータの公平性

2020.07.03

「差別を植え付けるデータ」MITが大規模データセットを削除 -問われるデータの公平性

MIT（マサチューセッツ工科大学）は、人種差別用語や女性差別を助長するとして、大規模なデータセットを削除しました。

このデータセットは、高度な物体検出技術を開発するために2008年に作成されたもので、8000万枚の画像が使われた「Tiny Images」という画像ライブラリです。機械学習モデルに静止画中の人物や物体を識別するための学習モデルを教えるために使用されてきました。

8000万枚のTiny Imagesの欠点を発見したのは、プライバシーに特化したスタートアップ「UnifyID」のチーフサイエンティストであるVinay Prabhu氏と、ユニバーシティ・カレッジ・ダブリンの博士号候補であるAbeba Birhane氏です。「Tiny Images」にはアジア系や黒人、女性の差別につながるラベル付けがされていたといいます。

ディープラーニングでは、ラベルつけされた画像を大量に学習することで、画像とラベル（言葉）の関連付けをしています。「Tiny Images」の画像をディープラーニングで学習することで、ラベルに含まれた差別的な表現を学習してしまい、結果として偏ったモデルが構築されてしまうおそれがあります。

データセットには、売春婦や水着姿の女性など、不必要に日常の画像を差別的な言葉にリンクさせ、将来的にAIモデルに偏見を植え付ける可能性があります。

MITは「TinyImages」のデータセットを削除し、研究者や開発者にライブラリの使用を中止しています。また、そのコピーをすべて削除するよう促しています。また、公式声明と謝罪文をサイト上で発表しました。

Tiny Imagesのデータセットには、カテゴリや攻撃的な画像などの軽蔑的な用語が含まれていることが判明しました。
（中略）
このことを大変心配しており、影響を受けた可能性のある方々にお詫び申し上げます。

AIが人種や性別の偏見や差別を示す例は数多くあり、学習させるデータをいかに公平公正な品質に保つのがが大きな課題となっています。特にディープラーニングでは、膨大なデータを学習するため、わずかな偏見でも差別表現を助長して誇張してしまう可能性があります。

過去にもGoogle Photo上で、黒人を「ゴリラ」と認識してしまったり、米アマゾンに導入された採用システムが、女性差別を行うなど倫理的な問題に問われるケースが多くあります。

国内では人工知能学会に「倫理委員会」が設けられるなど、AIの倫理性を向上させる取り組みが行われていますが、AIの発展に伴い、社全体で議論が行わていくことが望まれます。

■AI専門メディア AINOW編集長 ■カメラマン ■Twitterでも発信しています。@ozaken_AI ■AINOWのTwitterもぜひ！ @ainow_AI ┃

AIが人間と共存していく社会を作りたい。活用の視点でAIの情報を発信します。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

お名前

メールアドレス

職業任意

職種任意

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

AI議事録取れるくん他社AI議事録10選比較【機能×料金】

#生成AI 2025.05.08

議事録AIアプリ-時短×高精度を叶える最新9選2025

#生成AI 2025.05.08

【AI議事録】ChatGPT初心者向けに精度を上げる実践3ポイント

2025.04.25

AI議事録要約-失敗しない活用テクニック徹底解説5選大全

2025.04.24

文字起こしができるAI議事録比較2025年版-人気サービス5社徹底紹介

2025.04.24

【2025年最新】おすすめのコード生成AIツール6選！仕組みや利用するメリットを解説

2025.03.19

【2025最新】無料のおすすめAI議事録作成ツール7選を徹底比較！種類や選び方のコツも解説

2025.03.10

【2025年】無料AIイラスト作成アプリ・サイト6種を徹底比較！画像から生成するツールやアニメ風ツールもご紹介！

#ChatGPT#OpenAI#pickup#ロゴ制作・イラスト作成#生成AI 2025.01.30

【最新版】生成AIノーコードツール全6種を徹底比較！特徴や失敗しない選び方を解説

#ChatGPT#LLM#pickup#ノーコード#生成AI 2024.12.23

【無料ツールあり】生成AIチャットボット全14個のおすすめランキング！仕組みから違いまで徹底比較！

#ChatGPT#LLM#pickup#チャットボット#生成AI 2024.12.17

あなたにおすすめの記事

AI議事録取れるくん他社AI議事録10選比較【機能×料金】

#生成AI 2025.05.08

議事録AIアプリ-時短×高精度を叶える最新9選2025

#生成AI 2025.05.08

【AI議事録】ChatGPT初心者向けに精度を上げる実践3ポイント

2025.04.25

AI議事録要約-失敗しない活用テクニック徹底解説5選大全

2025.04.24

文字起こしができるAI議事録比較2025年版-人気サービス5社徹底紹介

2025.04.24

【2025年最新】おすすめのコード生成AIツール6選！仕組みや利用するメリットを解説

2025.03.19

【2025最新】無料のおすすめAI議事録作成ツール7選を徹底比較！種類や選び方のコツも解説

2025.03.10

【2025年】無料AIイラスト作成アプリ・サイト6種を徹底比較！画像から生成するツールやアニメ風ツールもご紹介！

#ChatGPT#OpenAI#pickup#ロゴ制作・イラスト作成#生成AI 2025.01.30

【最新版】生成AIノーコードツール全6種を徹底比較！特徴や失敗しない選び方を解説

#ChatGPT#LLM#pickup#ノーコード#生成AI 2024.12.23

【無料ツールあり】生成AIチャットボット全14個のおすすめランキング！仕組みから違いまで徹底比較！

#ChatGPT#LLM#pickup#チャットボット#生成AI 2024.12.17