Friday, February 24, 2017

Practionist vs Idealist


刚刚把data science的流程都走了一遍,于是意会到真正的问题在于feature.

现在 (Practionist - 经历了一个月吧):
1. features - 但是又有无数多种可能来做feature engineering, tranform (log transform), binning (把类似的feature combine 一起), extract (从一个feature中抽取更细化的,更predictive的features),
搭个testing framework做指标还是挺重要的。
2. Speed - 还有machine learning 的training速度,这才一会到GPU的重要性。

从前 (Idealist - 经历了一、两年年吧):
1. 想要了解ML algorithm希望能帮着增强ML能力;
2. 各种新知识的学 (后来发现要能用得上,用起来,不是件容易的是)

---
另外,听了一个关于opencv的talk,发现一个作者对于各种算法都听懂得运用,但是它就只是自己做个assignment来学习,遇到难点才寻找必要的tool。
他就只用了断断续续一个月的时间,就学了我好久以来才学清的。
追根究底,我是Idealist形的, 懂的东西局限在textbook, 学了大部分没用, 需要时有用的部分也用不上手。
他是Practionist形的,不懂的去找,可以是textbook内,可以是textbook外,懂的用,学的也有用。我感觉他很懒,但是work smart。

--

我发现我有两个地方是practionist,一个是latex的运用,一个是genetic algorithm的运用
两者都是看了一下简短的example,然后一直在用。遇到问题就去请教问问。
如果你问我深一点的latex,或者genetic algorithm的各种theoretical 问题,我可能不在行。

但是,所有的papers都是用latex弄出来的,而且genetic algorithm也发了好多的papers.
会用才是王道。


总结
----
1. 不需要把课程看完 (less idealist),但是需要把project搞起来 (more practionist)。
- 了解什么是重要的
- 了解怎么用各种theoretical tools
2. project要有一定目标,争取iterative实现,不要完美主义。
3. 专注在几个点上,争取变成expert, 从practionist上。


No comments:

Post a Comment