SIGNATE ブルーカーボン・ダイナミクスを可視化せよ!
久しぶりのSIGNATEコンペ ブルーカーボン・ダイナミクスを可視化せよ! に参加しました。沖縄の過去時点の藻場状況を予測する内容です。扱えるデータの種類は多く人工衛星の数値データをメインに人工衛星の画像データまであります。私は画像データは使用しませんでした。数値データ(約1万4千項目)だけでお腹いっぱいでしたから。
進め方:まずはシンプルに目的変数の平均値を予測値として、第一次ベースライン(public LB:0.2004988)を設定、次に追加の特徴量なし、ほぼ全項目を使用してlightgbmで予測した第二次ベースライン(public LB:0.1987353)を本当のスタートラインとして旅の始まり。掛けたり割ったり、アンサンブルしたりと最終値(public LB:0.1767497 private LB:0.1829975)で72位/357人中でBronzeを獲得できました。めでたし、めでたし。
上位の人はしっかりと特徴量を追加して入賞してる人もあれば、シンプルに複数モデルを作成してLinear Quiz Blendingを活用しSilverを獲得している人(これはこれですごい。)もいました。どちらも参考になります。でも上位入賞の秘訣はやっぱりNever give upですかね。