伸び悩む( ˘•ω•˘ ).。oஇ
特徴量を追加すればどれくらい上がるのか?
私はそんなことを考えながらコンペに参加したことがなくて、スコアが伸びない原因は特徴量にあるとずっと思ってて、モデルやハイパーパラメータチューニング、アンサンブル学習はほんのわずかしか上がらないため、あまり頑張らなくてもいいと勝手に考えていました。
正直 現段階で思いつく特徴量を追加してはみたものの、スコアは全然変わらなかった。
まだEDAを初めて1日目だというのに、なぜかとても焦っている。期限までに1ヶ月以上はあるからゆっくり考えればいいのだが、はやく次の課題をこなしたり、色々なことを学びたいという気持ちが先行してしまって、どうにもコンペに力が入っていない。
土日は少しリフレッシュして、次の月曜日には万全の状態で過ごしたいと思います( ´. .̫ . `)
簡易モデルを作ったはずなのに
今日は簡易モデルを完成させて、EDAを頑張るつもりだったのですが、簡易モデルが非常に高いスコアを出してしまいまして、おそらく特徴量を少し増やすか、パラメータの調整を行うだけで目標に到達しそうで焦っています。
なぜ焦っているのかと言うと、なにも考えずにとりあえず前のコンペでやった前処理をこっちで流用して、適当に特徴量を作成したのが原因なんです。
つまりなにも考えていないのにいいスコアが出ちゃったんです……
ビギナー向けコンペなので、データ量は40程度しかなく欠損もないため簡単な処理で取り組めるところがこのコンペの魅力なんですが、それにしても私が2ヶ月苦労してちまちまスコアを上げていってたあの努力がなんだか馬鹿らしくなってしまいました( ´. .̫ . `)
とはいえ、まだ昇級するには全然程遠いスコアなのでこれから頑張っていきます(`・ω・´)フンスッ!
結局何が足りてない???
色々なブログ記事やkaggleのディスカッションなどを読んでいたのですが、検索の仕方や知識不足のせいで、あまり成果が出ませんでした(´・ω・`)
機械学習でなぜスコアが伸びないのかを考えた結果
- EDAがまず足りない
- 考察するフェーズが完全に欠けている
- 正しい特徴量のエンジニアリング方法が分かっていない
これらが抜けているにも関わらず勝手にモデルがどうこう、アンサンブルがどうこうなど考えているからだと思います。
元々足りてないとは思いつつ焦って結果を求めて、過去にも同じ失敗を記事に書き起こしたのですが、まだ学んでいなかったのだと、少し失望しています。
機械学習においてEDAと特徴量の作成が1番他人との差をつけるのに有効なものはないというのを、何度も記事で見たのですが落とし込み方や、考察の方法がわからず逃げていました。
明日から始まるSIGNATEのBeginner向けのコンペでなんとしてでもBeginnerを抜け次のステップに進もうと思います!
E資格の機械学習やディープラーニングについては何を書けばいいのか分からず断念してしまいました 勉強も同時に頑張ります(´・ω・`)
エラーと修正の日々
昨日のエラーの究明作業だったり、違うモデル作りをしていたのですが、まだLGBMに振り回されていたり、惰性でとりあえずコードを書いたりしているんですが、そろそろしっかり勉強しないといけないとは思いながらも中々上手くいかないものです(´・ω・`)
とりあえず今はkaggleのノートブックや論文を見漁って勉強あるのみかなぁ( ಠωಠ)
久しぶりの更新
体調不良やらなんやらが重なり、勉強できなくて、更新出来ませんでした(。ー_ー。)
今日から勉強をまたはじめました!
とりあえずSIGNATEのビギナーコンペがまだやってたので、リハビリにやったんですが、前使ってたモデルを使ってトライしたところ、知らないエラーが出てしまいました( ´ཫ` )
今月までにsubmitできるか怪しいぞぉ
Qiitaに質問を投げたのでどうにかなることを願いながら頑張ります:( ;´꒳`;):