2019年10月20日日曜日

選別

データをマネタイズ
何だか煙に巻くような文言ですが、膨大なデータを収集、加工、分析し、そこから新たな情報を作成、編集して販売する事業と理解しています。用途は採用、販促、製品開発、需要予測あたりでしょうか。選挙活動や、政策立案、世論誘導向けの情報もあるのだろうと。

いわゆる名簿屋も該当するのでしょうか。新小学生へのランドセル、新中学生への学生服や学習塾、新大学生への賃貸住宅、新成人へのスーツや晴れ着、そういったDMや電話セールスの対象となる属性情報の提供も情報の収益事業ではあります。個人情報保護法の施行以降は殆ど見聞しなくなりました。これは当に個人情報の売買です。データのマネタイズではありますが、今関心が寄せられているマネタイズ事業とは異なるものです。

単純には、例えば、購入したい自動車の色について非常に大規模なアンケートを行い、赤、白、グレーの回答比率が利用できれば各色の生産計画立案を支援できます。個人情報レベルまで踏み込まず、特定の回答をした個人の集合、或いは、特定集合の回答のレベルから動向を分析し、それを加工して顧客に有用な情報として販売する、そんなイメージで捉えています。

で、今衆目を集めているリクルートキャリアによる就活生の内定辞退率予測データの販売について考えてみます。

内定辞退率予測データは、ある企業に内定した就活生の個人情報とサイトの行動履歴から算出されるようです。この二つのデータを、昨年度(2018年度)の内定者辞退動向から構築したモデルと突き合わせ、AIでムニャムニャすると、当年度の内定者が辞退する確率を求められるとのこと。内定者辞退率の予測値を考慮して採用企業が内定者数を増減すれば、採用予定数達成の精度向上が見込めるわけです。
リクナビ問題「同意があれば万能」論を見直すべき…鈴木正朝教授が「思考停止の議論」に危機感
この時、リクナビに登録する際、プライバシーポリシーに同意した就活生の個人情報だけでなく、約8000名の該ポリシーに同意しなかった就活生のデータも内定辞退率予測データの算出に利用されていることが問題となっています。加えて、プライバシーポリシーの内容自体にそもそも不備があるという指摘や、就職活動に不利に働く事業への個人情報の利用は同意の有無に関わらず不適切との批判あります。

こういった個人情報の取扱い、これはこれで十分問題ですが、個人情報をAIでムニャムニャして内定辞退率を予測する、事業そのものに胡散臭さを禁じ得ません。

予測のアルゴリズムは当然非公開ですから、このブラックボックス部分にAIを充てていますが、
”そんな大した予測やってんの?人力でテキトーに予測した数値で商売してんじゃないの?”
という疑念が生じるのは間違いない処です。

例えば、A大学の就活生が、B業種の会社B1社と、C業種のC1社、C2社から内定を貰ったとします。すると、この就活生は、業種BとCや、同業C1、C2を比較し、各社におけるA大学の位置付け、自身の希望を考慮して志望を序列化します。この序列化が合理的になされるならそこそこ妥当性のある内定辞退率が予測可能ではないかと。AI導入で予測値の信頼性を向上させるのが狙いなんでしょうか。

例えば、トヨタと日産、日立と東芝なら各々後者の内定辞退率が高いであろうことは容易に推測できます。では、トヨタと日立では?これは異業種の比較ですから、当人の希望や専攻に依って序列は変動します。が、それらの情報を鑑みれば合理的な序列化は可能ではないかと。果たしてAIを利用するほどの話なのか、甚だ疑問です。

まぁ、”AIが出した解です”として予測値を権威付ける一方、問題が起これば責任はAIに帰せることができますから、その辺にやたらAI利用を喧伝する理由があるのではないかと。勿論、憶測の域を出ませんけど。

そこから更に勘ぐると、この内定辞退率予測データの算出には、各個人の具体的な個人情報も利用していたのではないか、という疑義が生じます。これが、就職活動を支援する目的で就活生から収集した個人情報の目的外利用であることは明らかです。AIで予測”は、リクルートキャリヤによるこの目的外利用を表面化させない恰好の方便になっているのでは、という見方もできるわけです。

以下、少し詳細に予断を持って推量します。

新卒の学生は就活するに当たり、就職ポータルサイトであるリクナビへの登録がほぼ必須となっています。日本の就職情報分野において、リクナビはトップクラスのガリバー企業であり、換言すればほぼ独占状態にあるとみて間違いありません。日本の新卒就活生の就職に関わる個人情報、採用企業の採用に関わる情報のほぼ全てがリクナビに収集されているわけです。

就活生がリクナビに登録する際、どこまでの個人情報を提供するのかはよく解りません。ただ、
リクナビに会員登録するとできること
で、使える機能を利用しようとすれば、必要となる個人情報の登録を求められるのは当然です。住所、氏名、メールアドレスはもとより、OpenESを使えばエントリーシートや履歴書に記載する個人情報を登録することになります。加えて、入社志望企業の検索履歴、説明会やイベントの申し込み、参加状況、志望企業の優先順位、志望動機、内定状況といった情報があれば、内定辞退率の予測はそれほど難しい話ではなく、AI技術など使わずとも可能と考えます。

ただ、こういったパラメータから内定辞退率を予測することは、個人情報に手を突っ込むことを意味しますから、そこで、AI技術を活用したという体にしておくと。そんな処ではないでしょうか。

つまり、各個人の情報をプロファイリング、スコアリングすることで算出した内定辞退率を、恰もアルゴリズムを使って機械的に予測したかのように装っているのではないか、ということです。それは、いちいち記すまでもない個人情報の目的外利用です。

更に疑えば、特定就活生の内定辞退の可能性について、当該企業の採用担当者からリクナビへの照会すらあったかもしれません。採用予定枠を埋めると共に、できるだけ優秀な内定者を採りたい、人事の採用担当者からすれば、辞退予測は願ってもない情報です。

そのような照会が実際に行われていたか否か、知る由はありませんが、あったとしても驚きません。新卒者の就活支援より先行して拡大した転職支援の分野では、ヘッドハンティング、スカウト、引き抜き等と称される中途採用では、特定個人に焦点を当てた転職が主です。少なくとも転職支援会社には、転職希望者の意向や動きは筒抜けではないでしょうか。

転職支援の拡大を受けて巨大化した新卒者の就活支援事業ですから、個人情報は果たして適正に保護されていたのか、或いは、情報を取り扱うリクナビ自身の意識がどうだったのか、不信感は払拭できません。

さて、就活〜就職という、狭い年齢層に属する、極めて大量の人員がほぼ同時期に入社するというイベントに既視感を抱きました。その後の人生や生活に大きな影響を及ぼす、就職という目的に向かう際、膨大な個人情報が収集される点も同じです。

それは、大学受験の際の志望校決定の仕組みです。大学入試センター試験では、ほぼ全ての受験者の自己採点結果を大手予備校が集約します。受験生は予備校の示す判定結果を鑑みながら志望校を決定しています。大手予備校とは駿台、河合塾、代ゼミといった三大備校に東進を加えた辺りでしょうか。こちらも人生に大きな影響を及ぼす大学入学という目的に向かう際センター試験の自己採点結果という明らかな個人情報が収集されているわけです。

大手予備校が運営する、この大学入試の合格可能性判定システムと対比しながら、リクナビが手掛ける就職支援事業について記してみます。


次のエントリに続けます)

0 件のコメント:

コメントを投稿