Why5

巷にあふれる情報(データ)をもとに"なぜ”、"なぜ”、"なぜ”、、、と掘り下げるブログです。現在は主にAIによる予測スキルの向上に励んでいます。

免責に関して:本サイトの情報により生じた如何なる損害についても、当方は責任を負いません。

SIGNATE ブルーカーボン・ダイナミクスを可視化せよ!

久しぶりのSIGNATEコンペ ブルーカーボン・ダイナミクスを可視化せよ! に参加しました。沖縄の過去時点の藻場状況を予測する内容です。扱えるデータの種類は多く人工衛星の数値データをメインに人工衛星の画像データまであります。私は画像データは使用しませんでした。数値データ(約1万4千項目)だけでお腹いっぱいでしたから。

進め方:まずはシンプルに目的変数の平均値を予測値として、第一次ベースライン(public LB:0.2004988)を設定、次に追加の特徴量なし、ほぼ全項目を使用してlightgbmで予測した第二次ベースライン(public LB:0.1987353)を本当のスタートラインとして旅の始まり。掛けたり割ったり、アンサンブルしたりと最終値(public LB:0.1767497 private LB:0.1829975)で72位/357人中でBronzeを獲得できました。めでたし、めでたし。

上位の人はしっかりと特徴量を追加して入賞してる人もあれば、シンプルに複数モデルを作成してLinear Quiz Blendingを活用しSilverを獲得している人(これはこれですごい。)もいました。どちらも参考になります。でも上位入賞の秘訣はやっぱりNever give upですかね。