インターンシップ参加レポート_阿部さん
インターンシップ参加レポート 阿部剛大
はじめに
「モノタロウTech Summer Internship 2022」データサイエンスコースに参加させていただきました阿部と申します。
9/5から9/9までの5日間、データサイエンス グループの一員として業務に取り組ませていただきました。モノタロウさんが実際に保有しているデータを扱ったことで、データサイエンスを会社の中でどう役立てているかイメージを掴むことができ、大変有意義な時間を過ごすことができました。
今回のインターンシップではメンターの方々を始めとして、社員の方々から手厚いバックアップをたくさんいただいたので、インターンに不慣れな私でも不具合なく作業を進めることができました。この場をお借りして、本インターンシップの準備や進行に携わっていただいたモノタロウの皆さんに感謝申し上げたいと思います。
インターンで取り組んだ課題
今回のインターンでは推薦アルゴリズムの改善に取り組みました。具体的にはポジションバイアスの推定と推定したポジションバイアスに基づくモデルの補正です。ランキングアルゴリズムの学習では推薦リスト中のどの商品がクリックされたのかというクリックデータを用いる場合が多いですが、推薦リストの上位と下位ではそもそもユーザーが商品を目にする確率が異なるので、単純にクリックされた商品=最も関心が高かった商品としてしまうとバイアスが生じてしまいます。本インターンでは、ECサイトのログデータからこのようなバイアス(ポジションバイアスと呼ばれています)を推定し、モデルの改善に使用しました。
インターンの流れ
1、2日目は主に会社紹介とテーマ周辺の基礎的な知識を勉強しました。スタートとして今回のテーマであるポジションバイアスの推定に関する論文を複数読み、メンターの方とディスカッションをしました。論文中の疑問点や気になる点についてフランクに議論をすることができたのがとても楽しかったです。その後、ECサイトの仕様や顧客企業の種類などドメイン知識について説明を受け、簡単なランキングシステムの実装をPythonで行いました。データはBigQuery上に保管されている実際のログを利用しました。モノタロウさんは社内のデータ基盤が整理されていて、機械学習でバリューを生みやすい体制を維持していることが体感できました。