AIエンジニアを目指す文系未経験者@転職中

日々の出来事や勉強、転職など日記のような形で書いたブログです

Signate コンペ13,14日目 LGBMの脅威

えぇ10日目が2つあってびっくりしました……

 

 

昨日やっと特徴量もなんとか追加して早速機械学習させてsubmitしようと思ったのですが、、、、

 

Light GBMが私の行く手を阻むのでした。

 

One hotエンコーディングだと容量も時間もとてもかかるし、悩んでいました。そんな時

スタートブックを読むとLight GBMというものを使えばラベルエンコードして特徴量を入れたら私がやっていた方法より早く計算処理が終わると書いてあって、使うしかない!そう思ったんです……

 

現実は甘くありませんでした……とりあえず写経してそれっぽいコードができたので、いざ学習させてみると、特徴量がint型じゃないとダメと書いてあり、調べてとりあえず変換したのですが、the best booster cannot be found とでて、何が起こっているのかもうわかりませんでした(;_;)

 

色々悪戦苦闘した末コンソールのログをみる限りLGBMは多ラベルで表示できないのにそういう処理をしていると書かれていました(。-`ω´-)ンー

 

どうやって解決すればいいのだろうか……

 

明日はこれが解決することを願います(๑ーㅅー๑)