Wednesday, July 17, 2019

大神的共同点

不急不燥 constant speed
对每一个细节(default是什么,每一个function 有什么用途) 了如指掌 (我是急急燥燥,细节都不太注意)

大师解决data science 题目时都是老
我的问题

1. 不先build 一个base model,直接用别人的model
2. hyperparameter tuning, overfit on train data. Leaderboard, overfit on test data
3. 不看问题解决从根本
4. 没有很好的cross validation

大神
1. EDA->Base line ->feature engineering ->HPO-> ensembling 一步一步来
2. 每天半小时一个submission
3. HPO不要太强调,避免overfit on training data
4. cross validation 很重要,不要太care test data

总结来说我发现,大神的方法都是很惬意的,怪不得sustainable.

No comments:

Post a Comment