Why5

巷にあふれる情報(データ)をもとに"なぜ”、"なぜ”、"なぜ”、、、と掘り下げるブログです。現在は主にAIによる予測スキルの向上に励んでいます。

免責に関して:本サイトの情報により生じた如何なる損害についても、当方は責任を負いません。

SIGNATE オプト レコメンドエンジン作成 (SOTA Challenge)

今回はSINATE SOTA CHallengeのオプトレコメンドエンジン作成です。

SOTA CHallengeとは以前実施したコンペを練習課題として解放しています。データの提供だけでなく、作業期間も実際のコンペ時と同じように設定されており、最終順位もわかります。

練習問題ではないので、データ量もそれなりの量があり実際のコンペに近い状況が味わえます。

この課題の内容は、日頃Webを見ていると当たり前のように目にするレコメンドを作成するエンジンを作ることです。

この分野は今大変ホットのようで、いろいろな手法やノウハウがあるようです。結果がダイレクトに売上に直結するのでマネタイズしやすいサービスなんだろうと思われます。

ただ、これを実用的なレベルのシステムを構築するには大変なノウハウがあるだと思いました。だって、Webの閲覧ログなんてとてつのない量のデータを高速に処理する必要があるから。ある意味、今回の作業時間のほとんどがデータの加工のための時間でした。

 

この手のお題もまったく土地勘がないのでSIGNATE ECサイトにおける購買率の最適化でお勉強。lightGBMを使用したランク学習で予測。特徴量作成も独特の処理等で日頃からやっていないとなかなかランク上位にいくのは難しいと思います。

このお題の面白かったところはtrainデータだけでなくtestデータも作成しないとダメなところでした。Webの閲覧ログを効率よく使えるように変換するのに苦労しました。何にも考えずに実行すると速攻でメモリーオーバーで1からやり直し結構時間を無駄にしました。この辺も重要なノウハウなんでしょうね。

 

結果は35位/333人中、Bronzeメダルのおまけ付き。

これは素直にうれしい。

 

sig_ec rank,sig ec tool,EDA sig ec rank 20220513