Saturday, August 31, 2019

注意细节

我觉得我喜欢往某个大方向打一圈
然后呢细节上的实施 就不太行
细节是魔鬼
我就是个忽略魔鬼得人。
要注意细节!

没有什么成功是不需要细节的,
以后这方面要多多训练自己


1. time series - 看完了kaggle arimax, 要看
    - lstm with external
    - prasad recommend
    - 细节搞懂

发现自己很多assumption是对的
  - one hot encoding
  - residual analysis

基本 time series analysis 过程
 - break date into day, month, year
 - line plot to see trend
- do seasonable decompose to see seasonal
- test stationary
- test the right thing for I
- ACF, PACF
- Arima, Sarimax
- Residual Test
- Draw both forecast and actual
- Use Mape and SMape


Question
1. How to do cross validation?
2. Arimax how to take the x into consideration
3. VArimax how the code looks like
4. The DCMM
5. Template code
    a. transform the fields into general format so following code can be reused
    b. general EDA (ACF, PACF, stationary, seasonal, residual test, plot (forecast/actual, line, normality)
    c. VArimax code
    d. LSTM code (handling to get the right dimension)
    e. DCMM code
    f. XGBoost code
    h. other known good model
    i.  Putting external information
    j. accuracy metrics - can they diffentiable, which one is good, do/how they used in algorithms.


2. nlu - 0 


3. algo - 0 

4. expvis - 看了survey, 
几种方法
1. prototype
2. Approximation as trees
3. rules extraction
4. Reverse engineering
5. saliency masks
6. Activation maximizatoin
7. sensitivity
---

目前感觉 approximation最简单
其次activation maximization
其实我是靠猜的
下一步要看看里面的代表作更进一步了解。



Thursday, August 29, 2019

Default is powerful

今天的课老师基本是在说明如何产生idea,

1. Default is powerful
2. Survey can use sequential logic to identify whether it is consistent
3. Survey sometimes not credible, we can use ethnology to observe people, like Facebook observe our behavior
4. Try to think of something without boundary, restrict the option, implement it
5. human has cognitive bias (difficult for judgement - see the link), starting from cognitive bias

今发现最容易让自己有进展依旧是timed youself, or timed every two minutes.


1. time series - 刚开始arima
2. nlu - 0 
3. algo - 0 
4. expvis - 看了survey

Wednesday, August 28, 2019

又飞上天

今天想了下msd的presentation, 有了outline; 看了下expvis,有了些想法; 整理了data, 有了可以处理的data;买了leetcode, 有了可以做的习题。

明天
1. time series - 搞完
2. nlu - 把slide模板弄好
3. algo
4. expvis - 放到ipad里


下面全靠execution
1. 简化
2. 分担
3. 专一
4. 热情

distant from tech

今天去参加一堂nus的课,研究企业business model,
从market, competitors, revenue model, mvp, funding, etc. 这种business角度来看一家公司,挺有意思。
中间教授提到一个business model 太复杂,简单点最好。这个建议挺好。
另外大家提了各种idea
1. 厕所evolution
2. iot 全套
3. 智能billboard - 通过computer vision 来调动广告,或者people counting
4. hot desk - 名贵参观无用时间来作为hot desk, 类wework
5. 放遗失贴纸
6. 老人social media
7. cloud luggage - 一家公司帮你弄好所有luggage该有的东西
8. 机器人 - 帮老人,类boston dynamic
9. hyper personalized speech recognition, nlu etc.
10. sensor for 老人

现在看expvis, 忽然有了不同的角度。
看来distant自己from tech 有时还是有帮助的。

---
另,今天在参加bidding是碰到自己的高中朋友,也在ibm,这是巧合
---

另,发现马云鸡汤到处飞, 没创业过得口里说的都是马云鸡汤。固然道理很对,做到不容易。好的VC都看团队,看执行力。

---

明天,

time series, nlu slides, tech sales slides

Monday, August 26, 2019

Rule-based

我感觉虽然发散性思维很重要但是需要配合的是高度专注 rule-based 的行为和执行力。

感觉自己最大的问题是比较随性,发散思维无时不刻。
其实每天晚上发散一下,早中晚rule-based 生活。1.

首先
1. 高度专注 - 也意味着放弃或者延迟各种其他活动
2. rule-based - 也意味着你要放弃你心里想做的事
3. 发散/feedback-directed - 意味着这时候你要从资源的分配和创新上来进行下一轮的分配

另,
发现mba还挺有意思的,撇开技术只谈商业道理。
但是光有道理,没有实践,也是空谈。

来给明天计划一下
1. time-series 履行


Sunday, August 25, 2019

机遇

刚和一个学弟聊了下,有几种新加坡博士生最后会升上教授
1. 机遇来时
     - 当机遇来时,你会发现你好多朋友同时都能上,和能力无关 - 和机遇有关。像queenland university, melbourne university这种算机遇。
2. 老板牛时
     - 这个比较predictable, 当你和老板处的好,可以用资源来帮你
3. 经历牛时
     - 当你到国外倘金水回来时


===

今天的话把slide做完了,算urgent task.

important+urgent
1. time series
2. nlu
3. schedule talk with Derek

为啥最重点进行慢

1. 最重点进行时各种看,因为重要,但不紧急
2. 最重点进行时各种活动。
3. 总想把时间让给好像挺重要,实际不重要;或者紧急,单不重要的事情。

明天
1. 把visualization
2. feature extraction
3. cross validation
4. stationary testing/acf/pacf for arima
5. xgb 和 lstm 和 arima 搞懂

Saturday, August 24, 2019

exponential growth and (persistent+reward) process

1. exponential growth - when build something, rather than building something with linear grow, or worse logarithmic grow (very attractive) - try exponential grow.
2. reward as motivation - you need to be persistent until your first reward, after the reward is constant, the motivation will kick in automatically to replace persistent
3. time time and time -
today, morning, discussing the visa and handle visa
afternoon - discussing the tp
afternoon after 4pm -9pm accupuncture and out.
>9pm handling the email, listen to talk

Tomorrow
1. handson for state-of-the-art time series (ibm, m3, kaggle)
2. understand the normal data extraction process (for CV, XGBoost - xreg, LSTM-external)
3. fast template for code

Friday, August 23, 2019

不是不是不是

继续洞上努力 -

终于了解有些教授把方向说的那么明白的好处 - 变成一个城墙口。
就算教授们把他说成一个墙,你自己还是要找到一个城墙口,aim准发射。


很多看上去有意义的,但是他们都只是墙的一部分,不是不是不是城墙口,但是他们可能可以帮你看清城墙口:
1. 开会
2. 回答email,问题
3. 整理文件
4. 学习知识


冲城墙口:
1. 为你的目标写code, 犯错误,修改错误
2. 和别人了解城墙口怎么去冲破

Thursday, August 22, 2019

洞上努力

忽然间多了件杂事
纵观今天 其实在end-to-end上的投入不太够
虽然有了很踏实的time series bird eye view
再加上今天听了个免费的data fun关于文章理解的talk


Lack:
1. handson for state of the art model
2. handson on your own model
3. expvis - starting (reading on explainable AI paper)
4. algorithm - handling the high frequence question

纵观今天
- 早上准备talk
- 中午整理talk 休闲一下
- 晚上听datafun talk 和 ibm talk | 寻找问题答案

其实
- 休闲一下
- 晚上听datafun talk 和 ibm talk
这两个没什么关系。

我感觉其实看起来有学习意义的东西,
看起来有意义的东西,
其实换个角度想不一定有意义。
必须确保自己在一个城墙口冲锋,用足炮药冲锋
而不是随便一个城墙口随便叫一下
城墙口都是好东西
但是力量不专注,目标不专注是个极坏的东西。

Wednesday, August 21, 2019

搞了leetcode

终于看到time series 的边界了
感觉这个题目不容易,各种方法
我觉得提早看到尽头 很大的原因是我有个deliver deadline
逼着自己不能走遍所有胡同 但是确有必要看到其他胡同的存在
这个deadline还是很有用的。


但是我感觉更主要的又回到了时间利用
你必须maximize你的effective output
明天要定好需要的effective output
然后分时间段来deliver个别 effective output
所有的non-related input 都要pending到晚上一小时弄。

接着要增加expvis的部分和algorithm 的部分

今天有人来问algorithm
折日不如撞日
直接买了leetcode。

Plan 一下
1. 早上 - 搞懂OWA, 和把实体上最好的方法加进去,然后加点别的东西到个别的栏目里。
然后计划讲稿。

2. after 2pm - 把lstm 了解 和 state-of-the-art end-to-end 搭上来跑一遍。

3. 晚上和周末 - expvis 和 algorithm。

Tuesday, August 20, 2019

井里飞向天空

明天要和老板开会,瞬间从井里飞向天空,有了比较完整的bird eye view。
lstm 和 xgboost 还没有看完, 明天继续看。
看完了,做个bird eye view 的整理就完了。

Monday, August 19, 2019

time series 整理

今天把那些问的问题都有几本答案了
只是感觉还有点not down to the earth
明天打算好好地down to earth

今天走去red hill market 拿了吃的
又走去bukit merah 买灯泡

CW - 明天down to earth
exvis - 新开这个栏目,目前没进展。

Sunday, August 18, 2019

Time series

今天看了一天的time series感觉内容太多
明天主要focus on
1. 把重要问题解决找出来
2. 把end-to-end solution 弄出来

人生呢
觉得有种自觉安静,但是却在静中没有达到寂静的情况。
就是大方向上,是宁静的。
但是专注于心里,却依旧是波澜四处。
需要小处着眼。

网球

今天学习了网球,太阳太大,打得汗流雨下。
另,time series 的话基本搞懂了acf 和 pacf
pacf for ar
acf for ma

明天要
1. 把time series 的入门知识看完
2. 把template code搞起来。

Saturday, August 17, 2019

从 82 到75,瘦下来了,估计到高原缺氧环境爬山有关。
去的时候缺氧,回来的时候醉氧,感觉生活在梦里。

明天呢要继续time-series
1. arima series method
2. xgboost
3. derek's questions
4. end-to-end model training
5. external data

Friday, August 16, 2019

开会

今天做了什么呢?
1. 整理了解
2. 开会
3. 休闲

明天应该做什么呢
1. 整理注意事项
2. Time Series
3. Data seek
4. 训练自己的说话

今天嘛 - 其实一整天都在为CW准备,其实进度还可以。
但是只要有个会,会前就over prepare,  会后under prepare
应该来个,会前just prepare, 会后 continue prepare。

明天主要把2,3 搞一搞。

Wednesday, August 14, 2019

旅行

到稻城亚丁去旅行,也到成都去。
发现这两处人们, 和江浙沪不太一样,对生活更懂得享受,也不太懂得攒钱。
所以说虽然中国人民有很大的相似性,但是还是有地区的差异性。

另,藏人的生活,基本是全依赖信仰,他们在高原生活着,过着养牦牛,打工的生活。
1/3 信仰,1/3生活,1/3买七宝。
他们的生活很有启发性。

对于人生的看法呢
1. 要更懂得享受生活,追求行而上的成就。追求平衡的人生。

对于中国的看法呢
1. 川西真特别,刷新我的中国风景观念,和生活价值观。
工作方面呢
1. 两大重点
a. 把大方向弄清楚,把问题搞清楚
b. 弄sample code

Wednesday, August 7, 2019

不竞争

今天和一个加拿大老师聊了下,感觉加拿大的治国和众北欧国家很像。
医药全免费,学费全免,大学贷款,工作换。
另外,他们的没有竞争意识,大家就应该把事情做好,爱干什么工作就干什么,教授和货车司机同等,他们很可能是邻居,因为工资差不多。
加拿大领导人地位不会太高,就是帮大家工作而已。
但是加拿大消费高,大家还是要好好工作。
这是一个很厉害的社会发明。

但是加拿大没有太厉害的科技公司,北欧国家貌似也没有。
有可能他们没有适当的KPI来鼓吹这个事。

今天搞了一点time series,
主要和CW接壤上了。

明天:
1. VPN
2. 准备好汇报
3. 把机上Time Series 学习 和 CW的material都准备好。

Tuesday, August 6, 2019

生活中的想法

1. 落地来想,换方位来想 - 李光耀,制定国家政策,凡夫俗子该怎么去思考这种大问题?就必须把这些政策放到你的日常生活推演一遍。

用英文做国家语言 (李光耀):
a. 老百姓 - 会带来大家第一时间讨论最新知识,最新娱乐,最新新闻 (西方来的),因为不需要翻译。
b. 金主 - 还能给西方投资带来良好的环境(大家会说英文)。
c. 李光耀 - 能用自己熟悉的语言和大家沟通

精英政策(李光耀):
a. 老百姓 - 平穷的奋斗把自己变成精英,为了出路。富有的需要继续奋斗。
b. 金主 - 优秀的人才供给。
c. 李光耀 - 自己也是精英,起了模范作用。

2. 学习成功模式 and 用相关事件,或小范围实验来做决定- 邓小平

1. 学习成功模式 - 参访了各个国家,学习了新加坡的经济模式,改革开放,因为他迅速获利。
2. 用相关事件决定 - 当时苏联连阿富汗都没拿下,断定不会出兵援救越南。
3. 小范围实验决定 - 在深圳等地区小范围试验了改革开放,成功后扩张全国。
4. Context Aware - 只改经济,不改政治。

3. 迅速测试-
   先email 后说话 - 从email 的回答来判断一个人的知识,然后再决定和他说话与否。

4. You want to be the best
只有一下群做的最好的人能分市场一杯羹,其他的就准备从市场走出去,现实要求 - 你必须在某个领域做到最好。

Monday, August 5, 2019

The Projector

- 今天去了The Projector 看了Parasite, 很特殊的一个电影院,好地方,好电影。
- 了解了:time-distributed, 各种不一样的network 需要的data shape, lstm(hidden state!=cell state), return sequences/states, cnn (kernel/filter, stride, same/valid)

明天要了解 cnn-lstm, convlstm, sarima, optimization

Sunday, August 4, 2019

合作

- 找人合作是们学问,而且是们大学问。
- Time Series MLP了解了下,对于各种use cases 和需要了解的部分,有了飞跃的了解。
   MLP是[samples, time steps] (one feature)或 [samples, time steps*features] (multiple feature) 
   LSTM/CNN 是[samples, times steps, features]
   另MLP的学习能力出乎我意料之外,学个两数相加学的挺好的。 
- 今天从china town 走回去 3.x 公里
- 明天呢?
   LSTM - SARIMA - Exponential 这个方向学习
- 大智大勇很重要。

Saturday, August 3, 2019

Time Series

0. 一早把所有的东西都搞完了。

1. 把明天的toastmasters推了 为了更多时间来了解time series;
今天看了下,感觉能做time series 的方法基本你能想到的model都能做 - 基本是跨model的。

2. 今天和PS 一起开会,他竟然拉了一堆人来帮忙,太尴尬了。拉了一个人,他起初同意,然后要拉上一帮人,那人开始不愿意了。真晕。不过他厉害的地方就是把很简单的东西说的很厉害的样子,主要借助形容词和语音语调变化,需要学习。适当的拿资源也该学习。


明天
1. 一早直击time series
2. 问问题

Friday, August 2, 2019

记录

明天得记录
1. onenlp
2. bayesian network
3. ai verification and smart contract

明天得先看
1. telco
2. spectra engagement, 熟悉他们用的方法
3. 接着看time series (arima and deep)

今天呢
1. 了解了onenlp
2. 看完了fss
3. 搞了点time series

明天要有什么改变呢
1. 起来奔电脑搞记录
2. 专心干活
3. 专心娱乐


Thursday, August 1, 2019

找人讨论

今天又恢复参加talk听科研的阶段了。
挺有意思的,听jingyi和sun老板说了一整天,对于AI Verification 有了一些了解。

基本就是
1. 用program analysis 的方法for smart contract
2. 用neuron coverage 的方法for testing neural network
3. Testing - adversarial attack (add impercetible noice noise) detection - imperceptible noise (using pnorm and threshold it)
4. Verification - condition under a constraint will yield same output
5. Mutation - change network (ensure 90% accuracy)and change image