<実践>HomeCredit作業記録(5) - FeatureEngineering続き
Kaggle挑戦中です!
債務不履行になる人を予想するタスクです。
Home Credit Default Risk | Kaggle
やったこと
- FeatureEngineering
FeatureEngineering
前回の記事では、一つ一つの特徴量をじっくり見ていました
kurupical.hatenablog.com
ですが、やっぱりキリがないので、機械的に全部のデータをいろいろな形で集計しました。
参考にしたKernelは以下などです。
Good_fun_with_LigthGBM | Kaggle
LightGBM - all tables included [0.778] | Kaggle
結果
score: 0.735 -> 0.782
順位: 214位/1642 (上位15%)
今後やっていきたいこと
いったんFeatureEngineeringはやめて他のタスクを。
パラメタチューニング
RandomisedSearch, GridSearch以外もいろいろ試したいです。- BayesianOptimization
github.com
- BayesianOptimization
別のアルゴリズムも使う
今はLightGBMを使っているのですが、XGBoostやDeepLearningも試してみたいです。アンサンブル学習
複数の学習器でStackingをやりたいです。
その他
参考になったDiscussion
この特徴量生成は正直引きました。え、そこまでやるの?みたいな
Hybrid Jeepy and LGB | Kaggle
いろんな特徴量を足したり引いたりミニマム取ったりtanh取ったり・・・
そこまでやるならDeepLearningでやればよいのでは?なんて思ったり。
でも、こういうアプローチもあるのかと勉強になりました。
Home Credit Default Risk | Kaggle
書き込んでみました。笑 質問した後、自分の凡ミスに気づくという・・・