Monday, December 16, 2019

新计划

今天实现了一天的cv+eng+algo+工作
感觉是天天有进步,但是这个进步有没有趋向性 会不会导向成功?会不会太慢?
这就是我现在的问题,但是总好过没有进步。
而且一直练习比没有一直练习好太多。

英文
===
1. 早上开场,和自我更正(写),大点怎么转换?
2. Steve jobs 学习

CV
===
1. 抓到对的资源
2. 开始装和学

Algo
===
1. 无理数的decimal 表示 - 需要考虑boundary case (分母0 和负数)

CW
===
1. Script 写好了 明天联系

to 进步
=====
1. CW没有思考变通
2.  

Good Data Science model

https://towardsdatascience.com/10-best-practices-for-data-science-with-impact-d5f4e0525d9f

Sunday, December 15, 2019

English And Algorithm And CV

English
1. Process - Enunciation, Body Languages/Vocal Variety (conviction, not robotics), Outline,  Sound
2. Evaluation - Content-wise how can it be structured better?
3. Spaced Evaluation - Would you understand what you are saying?

Algorithm
1. If you use long time to understand, record as Youtube
2. if you use short time to understand, record as words

CV
1. Look through the Videos

Sustainability 是最重要的

Algorithm (1 hour)
fa, leetcode
Do it once and record it using youtube with live coding session

English (5 mins - rest)
steve jobs recording
老师学习
Enunciation, outline, conviction, sound, no preposition

CV (5 hour) 
learn and 把一个平台搭起来

---
我觉得论长期的任务
sustainability 是最重要的

几个重点
1. sustainability比快重要
2. 选针对性,effectiveness强的
3. 晚上睡觉的时间,和不专心的时间可以优化


跑步
我开始是选择每周两次健身房运动 - 持续了两年
后来跟伙伴们跑7公里,于是健身房转变为跑步
开始觉得挺好的,后来发现不sustainable
1. 伙伴们有时候没空,mm不太稳定的时间 - 这种不可控使得跑步时间不固定
2. 跑步7km耗时可长可短,主要看伙伴跑步快慢,这个针对性就比较小
相对于健身房跑步
1. 时间可控,跑步时间固定
是好太多了


Feedback of DSE Greeting

https://www.youtube.com/watch?v=b4wCtetwxF4&feature=youtu.be

1. Too near (should see half body and the hand is too big too annoying)
2. Lighting not good
3. Enunciation - good
4. Camera should be from above

印度人高管

https://www.zhihu.com/question/359226521

For myself:
1. Team - 重视大家一起努力  团队activity (team and not self)
2. Business - 重视跨商业概括, 把高层关系说清楚, 跨领域介绍及建议 (business and not tech)

印度人是一个比较差的学校的博士,一上来极其自信,先自报家门,把自己的论文,和我们招聘岗位契合的实习经历,不等我问就详细概括地介绍了一遍,侃侃而谈,声音宏亮,英语标准,对我们这个工作岗位已经极为熟悉了,听起来不需要培训就能干活。


但是,不得不承认,如果进来的是这个印度人,他一定比这个中国人升得快。中国人往往非常擅长完成任务并了解技术细节,会上一发言就是项目细节,但是不擅长概括,更不擅长把自己做的事情和商业目的结合起来描述并从跨部门的角度提出新的建议。所以很容易被别人当成一个工具或者计算机用,一到决策性的东西就靠边站。
印度人虽然技术细节差,但对大公司来说,很多技术已经流程化,模块化,标准化,用就行了,不需要搞清楚技术细节,但向市场部门商业部门把自己项目的重要性和市场关联性解释清楚,却是更重要的。印度人的概括能力很强并且很快能把技术和商业目的结合起来,他们跨领域的综合能力和理解能力比中国人强。更何况印度的技术牛人也有非常牛的,尤其是IIT的毕业生。

此外还有很重要的一点,管理风格上印度人比中国人更重视人的发展。在美国,印度老板爱招印度人,中国老板爱招中国人,但是印度老板其实很重视发展印度下属的个人能力,给他们创造各种展示机会。中国老板更重视派的活完成了没有。所以印度人在印度老板下做事情,很快他的提升之路已经规划好了。而中国人在中国老板手下做事情,事情做了一大堆,但是个人能力没有提高,也没有人帮他规划前途。
我见过印度老板为了给下属攒经验,把一个人做的项目分成三块给三个人做。这个做法见仁见智,我们中国人会觉得这样人浮于事,但事实上这三个人都得到了做重大项目的经验和与高层打交道的机会,因为这个经验以后他们再分插到别的组,三个人都独当一面了。结果这个印度人的下属就成为了多个项目的骨干,一下子关系网就形成了。印度人用这个办法可以把手下的印度下属分插到公司各个平行部门,占据了别的部门的头以后再跳到别的公司做头头,形成关系网以后互相介绍工作和高层职位,一下子多个公司的高层就都出自同门了。
中国老板往往害怕下属抢了自己的风头,把人都闷在自己的锅里不放,他的位置是没威胁了,但是关系网和资源也建立不起来。为什么中国老板不会培养人?正是因为他们还是读理工科时候的思维惯性,以为抓住几个好项目和熟练掌握一门技术就能独霸吃一辈子。事实上做得越大,商业前瞻性人际关系网和网罗资源的能力越重要,做项目管理或者技术熟练工的替代性太强了,你不干有的是人干。

Work Hard and Fun

我感觉 work hard 虽然好
没有fun是不容易sustainable 的
所以除了work hard, 还要fun
work hard -> 这个从optimization下手
fun -> 问自己快不快乐

work hard
1. 明天 一早 继续弄
2. 晚上继续弄

Fun
1. Eat and chat

Friday, December 13, 2019

CY

这个东西开始觉得一定要去做。
现在觉得必须全身心投入去弄,才有成功可能。
在最短的时间把一个MVP弄起来
然后迭代。

现在主要做的事情是把基本的东西学会。
先给下面两个星期做好策划:
两个星期-打基本功和装好App
两个星期-弄好第一个model
Eng - half an hour
algo - one hour

Thursday, December 12, 2019

Jiu Jitsu II

1.占据 和 defense dominant position
2. 把choke hide起来 所以对手够不着
3. 对于自己的动作做思考 - 对手可以挣脱吗,这样对手能够反制吗 - 不要intuition,要分析自己能做到选出最好的
4. pass the guard of your opponent, 然后呢就是占据dominant position

Saturday, December 7, 2019

Tech Review

优点
声音好听
速度可以
有强调

缺点
1. 有些概念听了之后,感觉没讲清楚
2. 没有对着麦克风说

Wednesday, December 4, 2019

Presenting findings of our data science work is a critical part of our DSE engagements. Crisp and concise messaging is as important as the technical content we are pretty good at producing. The objective of Stand-and-Deliver exercise is to provide presentation practice to DSE team members, in a controlled and non-hostile setting. You will be given context of the content and the type of audience about 1 week before for preparation. The duration of the pitch is 10 minutes. You are free to create your own slides to support your presentation.

Tuesday, December 3, 2019

new year resolution

新年快到了,许下一些new year resolution
CV, Algo and English

Sunday, December 1, 2019

阿三 setting the stage for himself

Lets stay rooted to the basics/foundation.. Anyway, as discussed, lets keep these sessions biweekly.. enough time to digest and prepare and not too much overwhelming too...

Also, no need for fancy slides.. a white discussion is also perfectly welcome.. Lets go with whatever is convenient w/o too much trouble...

thanks once again folks.. have a great weekend.

主动的写

感觉我刚刚写博客的时候是一气呵成的。
但是写paper和写报告什么的,都是写着写着有点boring了。

我在写博客的时候 - 只想把想法输出,作为自己学习点,非常专注,心无旁骛。开始就是一个想法,一个点,然后通过文字把它expand开来。


但是在写报告什么的 - 我想的是怎么写的好看,到底写了多长了。这个部分主要需要memory,我一般比较喜欢memoryless, 所以一个比较好的方法就是看下过程,恢复下自己的memory,然后才开始。

一个是主动,一个是被动。

写的方式不同,感觉也不同,速度/灵感涌现的层次也产生了大大的差别。

lowest effort principle 和自己的OKR

想想为啥马来西亚政局都是你说一个我说一个骂来骂去没有成果
新加坡又是另一种风格,说到你得几乎做到

想着想着 首先这当然关乎风气
但是如果新加坡没有强势领导人当官,估计会像马来西亚那样。
因为lowest effort principle prevails.
只说不做,其实符合lowest effort, 而且也有希望抹黑对手。
大家这样,我也这样。
但是一个领导人如果enforce 说了必须做到,而且以身作则,
那lowest effort的门槛往上一提,
形成一股风气,
良性循环从此开始。

lowest effort 并不是不好,
但是门栏必须提到一定practical标准,
这样才能带动国家发展。

----

有点像发论文的方式
大部分人incremental improvement
小部分人fundamental improvement

如果你把你的团体卡在fundamental improvement,大家就得往这个方向上靠,
短暂来说发的慢,
长远来说是比较好的,
因为你在做impactful work.


就好比无数的不致命的拳击,和一招致命的拳击。

----

回到自己,
自己身处马来西亚,
大家並沒有那么optimized,
我有疑虑,但是感觉这是人类共同决定,
于是也从了

后来接触了世界各地文化,
发现了中国人optimized的思维
israel的persistent,世界观,和innovation
发现这比较符合我原来的思维
于是我发现,
别去管周围的集体风气,
那肯定不是最优的,
你要用你觉得最优的方式生活。

比如我现在所处公司,
大家并不把technical advanced当成一回事,
说成这是academic exercise,
只有identify 客户痛点,upsell成功,客户满意,买了产品才是一回事。

这个在我们的当前的OKR无可厚非,
但是对于以个想要有technological breakthrough的人来说,
你心里需要有个OKR,
然后用自己心里的OKR来衡量目前的工作。
想一想,毕竟revenue和自己是半毛钱关系都没有,
但是心里的OKR确实和自己息息相关的。

当然identify 客户痛点,upsell成功,客户满意,买了产品,
这是另一个很重要的学习点,自己的弱点,
需要去加强,
需要多学习,多了解。

另外一个极端就是学术界,
只注重technical advanced,
完全忽略了实际功能,更谈不上客户满意,
我在这种氛围下七年多,
也多多少少被adapt了,
甚至有点感性的想说这是对的,
其实只是在这样的环境比较开心而已。

正确的路径- 其实应该在这两者中间寻找,
你得要有novelty,
但是也得要让别人感觉到value,愿意去购买。
----



聊天

今天早上和一群朋友吃饭:
https://xalogic.com/
智能眼镜 - 这个挺有意思

今天傍晚和一群朋友聊天:
cnn 也是一种heuristic - 帮你更有效得到有用的information
Jiang Kan
Lin Yun

自己:
我应该了解transformer, cnn, 了解各种architecture的insight
autoai - 用来找正确的architecture




Saturday, November 30, 2019

感性和理性

我感觉社会舆论一般趋于感性,
而实际的最优当然是理性的。

作为理性的人,两个部分都要重视,
如果完全忽视感性,会被舆论淹没,
如果忽视理性,那你就被牵着鼻子绕圈。

所以必须找个择衷的方法,
感性是有时间性的,所以先给感性短期的重视,
理性,可以在感性平息后继续,
运动的部分,当然是随着理性的轨迹来运行。



Friday, November 29, 2019

大纲

最重要
Tech talk

CV
把Yolo和其他的跑起来

Eng
如何活跃气氛
如何表述清楚
扩大词汇量

Algo
练练

Thursday, November 28, 2019

jiu jitsu

jiu jitsu在博弈上有着极大的实践
1. 占领优势位置,如果位置不对再大的发力也没用,需要重新调整位置
2. 需要不停锻炼,掌握技巧,迅速调控- 速度很重要,这样对手才没有反击机会
3. 攻击时也要注意防守
4. 攻击时也要注意你的攻击方式对手能容易逃脱不
5. 没有绝对优势的位置,只有不停的调控


实际意义
1. 当方向错误时,再大的努力也没用,需要掌握好重要方向,向bill gates 那样
2. 商业对手 - 你要攻击 也要防守,也盘算对手会怎么攻击和防守,做相关准备。
3. 从全盘思考,不能意气用事。

Wednesday, November 27, 2019

Bill Gates

看了一些nexflix 感觉bill gates 的可学习点挺多

1. 非常专注,非常勤劳
2. 找出重要问题,然后寻找解决方法 - 甚至颠覆目前现有的方法
3. 很乐观,no give up, work harder
4. Seeing things very rationally (melinda add human touch)
5. Optimization is the key
6. fearless
7. Core: all people are equal


climate change (How to reduce CO2 through innovative idea, nuclear energy - super computer to test ideas TerrPower - reinvent nuclear plant - inherently safe by cool down with few power, 90% unused, recycle it - no greenhouse gas, save, economic)
scale economic business - work with China for Bill Gates

polio (resource manageement,have map, see where inot cover, find best area by science to tackle, quantitative analysis)
diarrhea (new system  - sanitation toilet and sewer system)

Words


-I think you  just asked for the most you thought you could ask for, you did not ask for what it's really going to take to have a high probability of success.
-if monopoly means extremely high market share with short term market power, the answer is yes
-if it means that we had an unchallengeable position where new and better technology didn't have a chance to replace us, the answer is no.
-You bet. I'd rather have them live there than next to a coal plant or natural gas plant.
- if we fail, but only if we fail


Warren Buffet questions
Why IBM can't beat MS
What is the economics of MS
Where do you find smart people in things MS did

How things are price

Mike

省时间地方
1. 时间到了就走人
2. 别人再讲他在弄
3. 用最简单的方法把东西弄好,and that's it

厉害的地方
1. 过硬实力,一下子把东西弄好


Tuesday, November 26, 2019

Ricardo

Team 里面有个人
他积极向team 里传递certification
1-1向别人教导
slack里给各种有用资源。
和我聊时,完全不在意时间,我suggest 20 分钟,却聊了1小时。

忽然感觉自己也该有这种分享的喜悦
他称这个叫though leader
对于别人找他很开心。
他说,这样,他感觉自己有影响力。

不过说实在的,
不管现实利益如何,
这样长远都是好的,
该学习啊。

Sunday, November 24, 2019

维持天天做

打网球的经验是 - 你要打一会儿才能进入状态,你要一直打才能提稿能力。

三个最重要的任务
1. CV
2. Algo
3. Eng

需要确保CV天天走 (争取4小时)
Algo Eng 周末走

这样的话才能不断提升自己能力。

当然走的过程不是直线,而是开始慢,后面快。需要耐得住 - 不会有完整的时间的。

如何在工作中继续自己的计划

想想过去 其实我觉得
1. 专一
2. 去芜存菁
3. 至少每周要抽出时间
4. enjoy

Friday, November 22, 2019

忙完了

今天算是忙得到头了
虽然忙,但是收货也挺多
1. time series
2. 阿三学习
3. 老板面客户学习
4. 旅游 见老同学 给talk
5. 攒积分
6. 好久没有的敢deadline冲劲
7. 不要太急 重点是整体画面 party style professional style

相当有意思的学习,记录一下。

Tuesday, November 19, 2019

阿三complement

1. 更多时间花在slide, 和presentation上
2. 喜欢F2F 讨论,party
3. 还没做出来前,就很emotional的吹
4. 刷存在感
5. 自动自发 聊了certificate/accelerators, 弄了one page slide/engagement narrative, 很当一回事的找老板讨论
6.

Saturday, November 16, 2019

恢复

感觉现在恢复了平常
前几个星期真是太忙了
还遇到了不工作的阿三

后面的策略必须是提早建模,提早开始
这样分担掉后面的忙
然后呢如果同伴不给力
找点让老板知道

总的来说学到了挺多
1. 通过观察顾客,来给他们提供不同的product和presentation, 给他们缺的,想要的;
2. 需要的时候,必须快速决定,坚持,站稳脚步;
3. 说话的时候必须条理清晰,语调清楚;
4. 说yes, 其实是说no
5. 调动资源来完成project


现在把剩下的task弄完后
得看看CV and XAI 里的work
挑个easy portion开始

Friday, November 15, 2019

稻盛和夫

https://www.kyocera.com.cn/inamori/profile/episode/episode08.html
https://www.managertoday.com.tw/articles/view/51188
https://www.zhihu.com/question/23759167

稻盛和夫

真正的野心也好,愿景也好或者是使命感,一定是一天24小时无声无息却又无所不在的 - 专一、专一 再 专一
付出不亚于任何人的努力 - 身教
统一vision,不断重复
单位时间利益最大化
增加data monitoring作为知道好与不好
到第一线去了解情况(和基础人员)
客户投诉会到达他那里
让找茬的客户得到满足(这样不会filter掉我们自以为找茬的客户) - 这里有佛家思想
让员工和客户满足
不从硬件下手(更好飞机),而是从服务态度下手

我感觉日本人谈经营,都会弄得很哲学神圣的样子;
但是如果仔细想一想,里头的经营哲学都是很符合实际的。

Misc

国内也热衷,但是说的比较是赤裸裸的逻辑,
比如三级火箭逻辑 https://zhuanlan.zhihu.com/p/39979556
或者读了三体的感悟:
升维思考,才能降维打击 - 职场(站在上级角度),企业(站在宏观角度,并盯着vision(比如满足客户))






Wednesday, November 6, 2019

逆向思维

https://www.facebook.com/wallstreetbullring/videos/497530421097713/?t=1
买奥巴马房子被监控 -> 不买
什么样的房子需要被监控呢 -> 幼儿园

b is the undesirable property in most context
is there any context b is a desired property?

https://www.facebook.com/114797885876805/videos/766201327156888/?t=4
当你给十元,别人丢你一百元
=》很多人都回去给十元
这时候,你就负责去收十元就够了。

if people always use a to get b
can you use a for advantage?

https://zhidao.baidu.com/question/605470845.html
a can achieve the goal, is there other methods?

抽身

现在非常忙,抽身一想,其实大部分都是浮云,只有少部分有长远点的价值。
你只要想象你其实是在五年前,你回到过去,现在就是过去,就容易分辨出来了。

五年 - 容易看清什么东西对未来有用。
五十年 - 容易看清人生价值。

Monday, November 4, 2019

强求

虽然不该强求,但是有时候确实没有办法。强求的方法:
1. 对于普通员工,给各种理由 - 不是一次消费,多次消费;知道rule,希望你能通融; 必须要信心,强势,和理所当然。
2. 问上级,普通员工只有普通权限。

Sunday, November 3, 2019

忧思过多

觉得自己有时候对于短期的收益损失看得太紧,会照成忧虑这个,顾虑那个。
如果放长远来看,其实收益是远大于损失的。
另外,放长远看,乐观处事,悲观打算 - 重点是乐观处事 - 是永远好过各种顾虑的。

长远来看
1. 乐观阳光处事,修行(心理);
2. 运动 (生理)
3. 公司里学习的东西(经验);
4. 交际能力,英文聆听能力(面试和工作相关);
5. 算法,data science (面试相关);
6. 研究 (个人追求)。

这些是比较重要的。

短期的东西,比如谁做的多,做的少;比如某个项目的成功和失败和完成与否;比如今天和同事处的怎么样 - 这些虽然短时内看起来很重要,但是长远来说,或者就过了一年来说,无足轻重。




Saturday, November 2, 2019

最重要的点

有个朋友做代购, 开始觉得啊不太行,数学不好,送错货什么的,后来他做的挺好,主要人缘好 (比较随和,容易交往),靠谱,市场大。粗心呢,别人可以理解,因为她的生意太好了。
重要的点- 靠谱,人缘

有个朋友搞学术,开始觉得他不行,科研能力不行,后来他做的挺好,主要靠人际,拉funding。科研呢,下面的人帮他做。
重要的点- 上级,funding

所以呢,其实事无定论,你只要把重要的点搞对了,市场就会靠向你。

Mr. Fix It

解决地铁的问题
https://www.zaobao.com.sg/zvideos/news/story20191102-1001845

和地铁的人员沟通,注意细节
- 最后找出问题的关键,对症下药

问题的关键总是可以summarize成两三个点。

说话方面:
1. Too fast and without vocal emphasize
2. 如何paint better for illustration
3. lack of vocab or english expression for certain phrase

XAI方面:
1. not finding right people to collaborate
2. no enough time put in

忙到尽头

最近挺忙,忙得两个星期没运动
感觉快到尽头
把time series 彻头彻尾搞了遍 - arima, xgboost, lstm,当然还有pandas
短时间内迅速了解了。

一方面也在学习老板怎么面对客户的。

技术,客户面对 两不漏

现在剩下
- laptop runnable
- sept/oct data
- slides production
- error analysis


下面要搞搞 CV和XAI




Thursday, October 31, 2019

情感牌

Erramalli Ramesh 44岁

其实我也没搞明白。想一想,估计1. 媒体部长渲染 2. 他伤了85%的住hdb的居民(1.5w 买个condo就这样的待遇+他是外来移民)...第二项我感觉算是政治错误。


我感觉伤和大众渲染是有联系的,虽然我也听不出有什么问题
炫富,嚣张,侮辱这种字眼
还有老保安
想想各种大型示威都是这么被鼓动起来的,情感牌这招挺厉害

情感痛点,一触即发。

新 - 外来移民,住租屋,穷
香 - 失去民主,中傀儡

Tuesday, October 29, 2019

verification tip

1. summary function
isnull().sum()
not allowing any nan that leaks information

2. boundary checking

3. unit test test and test

Productivity Tip

1. Have a Cache.py and Info_Cache.py to record repeated used code and info;
2. Read briefly for other ppl implementation, come back and read again after your implementation (see important things and get insightful things quicker);
3. Set shortcut for repeated access folder and file (e.g., item 1 file)
4. have a logs of what you have done (for those be mindful or to undo later)
5. use bookmark in pycharm is possible if you are changing multiple files
6. change portion by portion - test each portion before moving on to the next one
7. familiar with the software engineering pattern, use them if possible
   - with distributedstrategy: (what is this pattern?)
8. no wechat, etc. when you are doing big refactoring, easily loss track


[easier step each time - it lead you to the next step]
change run_cv_supervised
-> discover [I just need to have a method to split out X_train,Y_train,X_test,y_test]
Delete run_cv_supervised back and change run_cv_normal
->discover [I can separate the cross validation recording out to make it simpler]

endogenous vs exogenous and seq2seq done

https://machinelearningmastery.com/taxonomy-of-time-series-forecasting-problems/

endogenous - output depends on it, and it depends on others (including itself) (e.g., other product sales)
vs
exogenous - only output depends on it (e.g. school holiday)


昨天终于把seq2seq搭起来,
还把另一个stacked lstm 搭起来,
浓厚的成就感。

进过了三天的全时间投入,现在一看到lstm的code就大概知道在干嘛的。
和前几年,不停地去看同一个code-based,一下忘了,真不能同日而雨。

全身心投入,可以解决很多问题,学会很多东西。

Sunday, October 27, 2019

Seq2Seq实践感言

纸上看的话是不会注意到这些的。

1. encoder_inputs = Input(shape=(None, feature_cnt)
设置None是为了inference的时候可以用1, training的时候可以用30

2. training 和testing 的差别除了item 1 还有 encoder 和decoder是分开来的,decoder是一个一个lstm cell run

3. static model - specify model的时候是没有input parameters的,specify 完后就能把input/output 的shape完整知道, 当然有些是None,这是唯一的flexibility (runtime decide)

4. [(None, 256),(None, 256),(None, 256)] 这种shape确实是一个list里三个numpy array



网球实践

今天打网球 有点心领神会 当发现它有点类似乒乓球时。
另,jupyter notebook,以前看啊看的,现在一直沉浸其中,有了很大的进步。
另,以前看了很多consultant的东西,现在时间了一下,忽然知道了重点。

知识是在时间中升华,而不是在纸上。
纸上,你可以各种知识,但是你不知道关键,而且容易忘记。
实践,你知道关键,不去学说有的,学的都是精华会用上的。

实践是个好东西。

Saturday, October 26, 2019

seq2seq

今天coding方面了解了seq2seq, 越来是这么回事。
感觉keras了解起来容易多了。
arima-garch越来也是sequential进行的两项活动,arima选了最佳p,q 给garch用。

今天到公司去,认识了以为同事,发现越来是is 前系主任的老婆,神奇。

明天就是见证着两个method的结果了。

后面想要对XAI 和CV两个方面都了解下。

Wednesday, October 23, 2019

framework

今天把剩下的data问题解决了,检查了下avg 3mths calculation, 然后给column name标注下
model 的花,把by category弄了起来,然后support 多个model实验,还有by product 的结果。

这样下来,明天
- arima-garch (for high volume)
- lstm autoencoder (for low volume)
看看效果如何

慢慢慢

最近deadline比较紧
发现如果脑子里满是deadline紧绷
效果不如平常工作中那种松紧。

大可以忘了deadline,享受于工作中。
实际想想,deadline也是自己给自己的枷锁。
学习Vikesh。
这样有利于自己,有利于产出,有利于个人良好心理。


Tuesday, October 22, 2019

framework for experimentation

scoring record (individual and overall)
visualization
feature extraction
driver
util
model

搞一天,主要把driver 和model 分开来了
检查一下还是有data leak, 和一些date 的片段木有handle
于是修正了

今天就搞了这些。
明天来搞剩下的

refactor 感言
一块一块弄

jupyter notebook感言
也是一块一块弄

不是全部一起弄
弄之前要backup来比对

framework上以后也可以用它来做别的用途,还是可以的。

Monday, October 21, 2019

LSTM multivariate input and multistep output

记录一下今天所学/复习,LSTM是个相当有用的东西。

1. multivariate input
multivariate simply set n_features, and size array accordingly

2. multistep output
2.1. for normal multistep
model = Sequential()
model.add(LSTM(100, activation='relu', return_sequences=True, input_shape=(n_steps_in, n_features)))
model.add(LSTM(100, activation='relu'))
model.add(Dense(n_steps_out)) #use a Dense layer with n output
[output with an array of size n_steps_out]

2.2. for encoder/decoder multistep
model = Sequential()
model.add(LSTM(100, activation='relu', input_shape=(n_steps_in, n_features)))
model.add(RepeatVector(n_steps_out)) # repeat n_features output as input to the following
model.add(LSTM(100, activation='relu', return_sequences=True))
model.add(TimeDistributed(Dense(1)))
model.compile(optimizer='adam', loss='mse')
[has timedistributed output each with size 1]

3. side note
3.1. for cnn/lstm - time distributed cnn before pass in to lstm
(sample, subsequence, steps, features)
model = Sequential()
model.add(TimeDistributed(Conv1D(64, 1, activation='relu'), input_shape=
(None, n_steps, n_features)))
model.add(TimeDistributed(MaxPooling1D()))
model.add(TimeDistributed(Flatten()))
model.add(LSTM(50, activation='relu'))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')
3.2. for convlstm
(sample, steps, row, columns, features)
model = Sequential()
model.add(ConvLSTM2D(64, (1,2), activation='relu', input_shape=(n_steps, 1,n_seq, n_features)))
model.add(Flatten())
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')
we have 1 row here as it is easy to interpret time series as 1 dimension

Sunday, October 20, 2019

忙碌的星期天

发现我们的工作性质是,不忙的时候挺多时间,忙起来的时候没日没夜,然后到各种地方去。有点像做研究的时候。

最近就想把大方向弄完
1. arima, lstm, ensemble
2. 更多feature
3. 什么样的model适合什么样的场景。
4. 开始做slides,和弄results。

周一
把 models 弄好

周二
把 features 弄好

周三
弄slides

周四
继续弄

GDP per capita

当人民素质越高,能创造出的GDP也有可能提高。
如果此时告诉大家,你们做什么工作都一样;按自己兴趣去做。
然后建筑业,services, 成本都会提高。
于是这也带动了GDP。

所以人的素质提高是一个关键-这是现在的感觉,虽然对经济模式没有完全的懂。

班门弄斧 - 并不一定是坏事

班门弄斧是华人的成语,不是阿三的。
他们在班门前,会评价班门用斧头的方式,然后很情绪化的说明怎么用斧头自己真诚的觉得比较好,然后在前面杂耍一下。
旁人看着觉得这杂耍的很有自信,不明觉历,于是乎相信了杂耍,而不是班门。
杂耍的人甚至可以直接用班门的东西 来描绘自己的结果,因为看的人並沒有看到砍树的过程。
这个套路,很厉害。

其实,如果某人要和班门竞争,这个套路是最优的。

那班门应该怎么做?
- 把杂耍,情绪的本质说清楚,因为班门并不善于杂耍,也不善于使用情绪,只懂得用事实说话。
- 用结果说话 - 因为班门善于制造的是结果 - 然后比较结果。


现在看的人就是line of business。
其实班门学会杂耍很重要。
追上的杂耍可以忽悠一群人。
不需要懂得太深,甚至不知道的东西都可以杂耍 (或者浅层的深入+vivid+带有看似启发性的描绘)。

无限期delay的突破

有些东西无限期delay 没什么印象。
有些东西 却不是。
比如学习英文, 比如algorithm, 比如XAI+CV,没有影响只是表象。

需要给他们调个位置,安排来前面。

整理东西什么的,不整理,到时没什么影响。


Moving forward

Melbourne - Diversity

1. 看到了来自非洲(somalia, kenya, sudan), 欧洲(macedonia, UK, greece),亚洲,的人们;
2. 澳洲人比较不academy focus, 比较experience focus, also interested in DIY (一方面那里人工贵);

Friday, October 18, 2019

真实的他 - 阿三的优势

他的behavior 出乎我意料之外,记一下,有些地方值得学习:
1. 骨子里就是marketing,面不改色,和司机/stackholder 交谈,依旧侃侃而谈
2. 还没做出来 - 但是对于做的东西充满了emotion, the data is amazing, the data is fantastic...然后开始怀疑我给的public data...这在中国人是不会发生的。阿三是emotion before factual, 中国人相反
3. 做出来的东西,就要一个人一个人去说。说的时候声色动人。this is really an amazing discovery...blah blah blah...
4. 感觉他没有准备,其实他是有准备的。阿三特别注重presentation,然后显得没有准备直接上去的样子。
5. 虽然知道自己不行,但是并没有表现出来,只是偶尔在我的面前显露一下。
6. Important - 在business user 或者不懂技术的c level 面前,他能吹的比我好。这就是为什么很多高层是阿三的其中一个原因。所以要锻炼的是,怎么对business user 描述我们做的东西。Deborah 做的就很好。可以拿她的一些段子记下来。

对于business user, 不是用技术字眼忽悠就好,也要让他们听的懂,感觉有所领悟。要想一下和马云鸡汤一样的段子。

Wednesday, October 16, 2019

如果我是他

如果我是他时,我希望有人理解:

1. Soothing - It's ok for not performing this time, and I totally understand that it takes time to grow the skill
2. Fact - But you need to be aware that the project has limited time, no one will hope that their member cannot deliver.
3. Call for Action - My advice is that, you should focus on what you can do best during project delivery period, and focus on learning during rest period.

站在同事立场

以前+现在的我
 - 假装没事,让时间冲淡一切
但是过去的经验是,这会留下一个pivoting, 除非你未来performs better (i.e., 达到我想要的), 不然这很难能冲淡一起,而且可能会越抹越黑。

但是我希望他
1. 歉意 - Sorry that I could not deliver anything for this time;
2. 说明 - I have already tried my best to get my things done at the time;
3. 达到我想要的 - From now onwards, I hope to get your advice on how to get things done better and how to contribute to our overall results better.

当我是他时,估计会看不清,还不如在我看的清楚时,先记录一下,给自己一个借鉴。

Tuesday, October 15, 2019

Boss

有个同事 和我做一样的东西 然后没结果
又不愿意做另一样东西 - feature extraction

于是老板让他
1. 做另一个东西,然后称之为 model
2. 让我run sprint review

这个恰好解决了我两大压力点。

这里主要强调的是出力点。

这和LY有异曲同工之妙。不起眼,尤其是item 2,但是正中下怀,而且是我没想到的。
还有一个地方,就是不哆嗦,言简有力。
还有就是时机,在1-1之后。


Sunday, October 13, 2019

阴阳思考

做每一件事情,不能因为只想得到利
不做每一件事情,不能因为只想到弊

少一边都是不完整的
这个世界就是阴和阳
两边都要去了解,拿捏,最后利用。

being indirect to be direct

一个心理医生说,如果你直击心理问题关键,不会得到答案
如果你只是passive听,反而是最快的到心理问题的关键。

这是个妙药。

Saturday, October 12, 2019

crowdsourcing solution

1. minimal input output example
2. your code
3. ask for solution in stackoverflow

我在想有没有可能把研究问题变成program 问题 放上stackoverflow 呢。

另外,最好的公司,其实就是stackoverflow, 因为上面有着各种不同专长的专家。

大公司

1. 零部件 - 大公司的sales 需要将大公司各种部门集合起来完成一个client的task
2. 借resource - 大公司的老板在自己员工不够的时候,可以去借贷,结果自己享受,又不用承担人数。
3. sales - sales 会把时间花在能close的account上,尤其是Q4, 因为来年account不一定是自己的,如果花时间在其他account, 可能帮别人做事。

重要性

今天grab故障了 我竟然不能从槟城一地到另一地,被禁闭了。
于是体现了grab所解决的问题的重要性。而且确保自己是问题解决的唯一答案 - 把竞争对手挤兑出去。
这点有意思。

Friday, October 11, 2019

xgboost

这四天 终于把一个框架搭起来
后面就是试试lstm 和arima 和 arima garch 和 dcmm

Thursday, October 10, 2019

试错前进

我的这行code,
df_rec_c= copy.deepcopy(df_rec)

看上去神奇
但是是我经过了两次失败
df_rec.copy() (shallow copy)
df_rec.deepcopy() (deep copy没生成)


feedback directed的进步,远好过你懂得了copy.deepcopy才来写code。

minimal viable improvement

想到shap,就想到shap+
shap+是什么样的product 呢
当然是一个好用,可视化做的好,而且要不complement,要不比shap好的。

当然不会是ambitious research prototype, 然后半桶水

大公司要求十倍进步
个人,要求一点一点进步,累计十倍

Wednesday, October 9, 2019

三种情绪

观察自己,一天内有三种情绪

一种是working mode
一种是boss asking mode
一种是browse nothing mode

前一种是benefitial
后两种nonsense, mitigation 就是尽快将自己走进working mode, by working 10 mins consecutively.

Tuesday, October 8, 2019

jupyter notebook + xgboost

今天jupyter notebook 大大学习。
xgboost 弄了一下,然后听了Kaggle GM的说法,
one must NOT use either one of the following when using XGBoost: one hot encoding, missing value fill, and input rescaling,

听着的时候,这些是没有听进去的,做了一遍后,再听,瞬间觉得重点完全变得不一样了。

就像从我现在的角度,看旅店的规划,发现旅店都集中在有大公司的地方,不是偶然,而是方便出差,而且这种出差往王阔气,多天,因为是公司负责。

明天,
1. CV with important graph for 3 stores
2. Massive feature engineering
3. LSTM try out
target encoding - https://maxhalford.github.io/blog/target-encoding-done-the-right-way/
add new feature/remove useless feature
skewness test of target variable
textual feature of catalog

Feature:
discount strength
isMajor
isHow
pages



Feature Engineering:
https://www.slideshare.net/0xdata/feature-engineering-83511751
https://www.slideshare.net/HJvanVeen/feature-engineering-72376750

Monday, October 7, 2019

jupyter notebook + 航空酒店

今天航空酒店研究了一早上+中午
了解了各种奖励配套
要好好optimize 一下

---

另外 jupyter notebook还真是个闹人的东西,但是还有common pattern
1. df[['a','b'.'c','d','e']].groupby(['a','b','c']).agg({'d':sum, 'e':list}) #dataframe
or df[['a','b'.'c','d','e']].groupby(['a','b','c'])['d'].agg([sum])  #series
2. df.apply(lambda x: fun(x['a']),axis=1)
3. df['a].apply(lambda x:fun(x))
4. df['a']=df['b'].shift(1)
5. df.sort_values(by=['a','b'])
6. pd.merge([df['a'],df['b']]) [concat]
7. pd.concat([df,df1]) (row, axis=1 for col)
8. dfa.merge(dfb, how='inner', on=['a','b'])
9. df.loc[df['a']>0]=df['a'] (assign value conditionally)
10. df['a']=pd.to_datetime(df['a'])
11. df.rolling('60d',on='time')['number'].mean()
12. df.set_index('date').asfreq('D') or df.set_index('date').resample('D').sum()
13. df['a'].fillna(method='ffill',inplace=True) (or 'bfill')
14. df['a'].groupby('b).apply(lambda x:
x.set_index("time).asfreq("D")).drop(['a'],axis=1).reset_index()
15. df['a'].groupby('b).apply(lambda x: x.set_index("time).resample("D").sum()).drop(['a'],axis=1).reset_index()
16. onehot encoding: pd.get_dummies(df, columns=['a'])
17. label encoding: pd.factorize(df['a'])[0]

麦当劳睡衣

抢购=可爱+免费+限量?

Tuesday, October 1, 2019

marketing keyword - 重复

1. 对上面的人, 对外面的人 marketing
不可能一次就够
要重复
知道get 到为止

不要以为发了一次就很厉害了,就像螺丝钉掉入水里。

Sunday, September 29, 2019

怕的是doing non relevant

前文说的每件事慢慢来
其实更重要的是,这件事是relevant的

最怕是
1. delay
2. 做些not-relevant 的
3. 心理扰动 重复目前的relevant事 - 等于无功


Thursday, September 26, 2019

欲速则不达 一件一件来

发现自己有时候就是没耐心一件事一件事来完成。
但是其实这是最优的做法。
比如写program是,我就尽快把代码敲完,结果debug时间挺长。
正确是,慢慢的写,带脑子不凭习惯的写
这样看上去不快,其实最快。

Value for company

for new company
1. your experience
2. your self learned relevant knowledge

for existing company
1. cognitive impact - cognitive level related to marketing

for outside company
1. how you bring value to their company


Wednesday, September 25, 2019

Productivity

1. email 看完后直接分类,记录,或设定时间等待处理。
2. 早上 - 看calendar, 然后list todo, 不重要放pending and minimize the task
3. 东西放好 - 不要天天找东西
4. 一转头粉碎虚空,不要纠结
5. note down your question, listen whole heartedly - not cut it
6. don't focus too much on short term effect, play mid/long term strategy game
- listen better in US/AUD english
- better in algo and ds

Tuesday, September 24, 2019

心胸越大 走的越远

这个以前看不懂
现在逐渐懂了

心胸越大
就不纠结(但是不是不列入考虑)于芝麻绿豆的小事
不会让你trap 在locally
会让你的眼光停留在更高的维度
做global optimization

Saturday, September 21, 2019

再谈marketing

今天去了st. kilda beach, 这地方看到了小企鹅 环境也真不错

想一想, 印度人为啥可以在职场中无往不利,其中一个原因就是marketing.
善于marketing, 把功劳传遍全公司。

marketing和optimization, 都必须是一种生活态度。

各族各有所长 + Consultation + native speaker 听力

各族各有所长
印度 - marketing
华人 - 执行力

 Consultation
我感觉 - 我们做的东西和consultation 很像

- 但是需要outline我们的问题
- mini-summarization
- beware of changing context
- final conclusion

 native speaker 听力
另外,需要训练下对native speaker的听力,这是个很重要的东西。

Friday, September 20, 2019

marketing (小insight) + 靠别人

marketing (小insight)

我发现和我一起做东西的印度人 口上功夫可以学学
做了一个小feature, 就不停的说
最最重要就是provide一些别人不知道/没想到的小insight, 而不是common sense comment.
然后present的时候 非常自然 就和平常说话一样


靠别人
1. praise and acknowledge their work
2. help them and place yourself as secondary
3. no complaint when there is a work
4. give comments that is relevant to their KPI, give inspired comment, not common sense comment.

平时像战时 战时像平时

我觉得平时说话
- 必须要 consistent with 演讲说话
- 除了问问题 要捉紧机会发表
- 要第一时间让别人了解
- 争取不让人有机会来批评



墨尔本 uniqlo 芝麻街同款

https://www.xiaohongshu.com/discovery/item/5bf745b3910cf60f3b751a88
https://www.aoweibang.com/view/38992914/
https://www.theguardian.com/artanddesign/2019/sep/19/kaws-artist-exhibitons-melbourne-london-brooklyn

长队
- 限量版 - 倒卖价值
- 童年回忆 (图,文,故事)
- 捧

NLP vs CV

NLP
chatbot (chat + q&A)- chat is option
smart financeal, q&A could be difficult to scale, quite standard nowadays (no surprise), how to maintain from client
translator - its a function in big company, difficult to get it right
personal assistant - siri, etc. Privacy - difficult to use data to make it better
difficult to go saas for a scalable context

Vision
smart health (medical)
auto-driving
smart city - people flow, tracking, facial recognition (even in custom)
smart home

other
education
emoicon (include style, your/other face mixed)


墨尔本

- 总体来说,这次的两天挺忙,可以考虑
  - 带点食物



- presentation
Prasad based 自然,present, 沟通,日常、专业态度一体化

- 客户交流
称赞,专业化自己
英文澳洲英文 交流
保持微笑 正面
不要太直接

- CW
  - promotion based - frequently, make it a frenzy
  - planogram, seasonality, events, weather, disease, competitor, new product launch - will all affect the things
   - planogram required highly compliance
   - more chinese area - china market
   - local > chinese as chinese drive by local
   - some days is super frenzy like 55, 88, 10-11
 

Sunday, September 15, 2019

冲击两次 - 终于冲破

上次windows上装vpn失败了
因为必须赶到机场

这一次
用着上一次的经验来do the heavy lifting
总算搞出来了。
弄了三个小时。

再一个城墙口上解决问题真是太太重要了。

先做再想 和 impactful 的marketing message

和几个做sales的人聊天
发现他们的人生观就是不太一样
他们会尝试不去准守rule

- 找工作的,不说现在这份才找到一个月的工作
- 想升职的,和老板打好关系就好
- 属下有些dirty work, 如果不被caught up, 自己拿permission, 被caught, 让属下被黑锅,说和自己没关系
- VP 让属下打听风声, 说如果有什么风吹草动,会fire那些人

其实他们也算好了不去准守rule被 caught up 时的plan B
这个有可能是比较optimized的
如果不考虑道德底线的话。

但是这些都有些不太道德
需要用智慧 - 不夸过道德红线

那如果这些东西都符合道德底线
再用agile的方式小规模experiment和看feedback
其实比想了一百年要快速得到第一手结果。
==
另外,change the world 这个marketing message是个很好的message
I want to place PC on every computer user
I want to reinvent PC to change the world
这种大家都会被影响的message 杀伤力巨大。

Saturday, September 14, 2019

意外

LY/Trump 本来觉得他不能成 他成了
咸蛋黄酥 本阿里以为做不出来,竟然做出来了
JS/Python 以为不会火,火了

大部分事情在意料之内,但是还是有些在意料之外的

===

今天把所有医生看了一下,各种会,网上中秋聚会,比较多活动。

===
明天
- NLU弄完
- time series 搭起来, that's it.

Thursday, September 12, 2019

为大部分人服务

之前和msd的project manager聊过 那种是80%ignorance to AI details 于是我给20%的人准备了比较tech的material 过了跑了了一下bert什么的。
虽知道刚和一会前msd data scientist一聊,发现不是80% 是98%, 看来我得重做了。
我感觉来到工业界,不要怕说的浅被人笑,你就要为你大部分的听众服务 - 而不是小部分的。

===

今天总算把nlu slides 搞得差不多了,明天把comm 的一些use case 加进去大概就行了。

===

time series 上
1. promotion
2. external data
3. metrics
这些都要加上

===

另外
1. intentedly delay 自己回讯息的时间,主要是context switching time

===



Huge Difference

Melinda and I think a lot and we want to find an area that we can make huge differences for people live, we found out there it is eliminating infectious disease in Africa; and to make US strong; therefore we want to do it from educational perspective to let everyone has a better education (K-12).


- 你能为哪个领域带来巨大的不同帮组一大群人

点到为止

我感觉学习某个机构 某个人;
你就学习你能明白的部分,不要太过迷信(overfitting), 点到为止。
邓小平学新加坡,李光耀学习西方,都没有overfitting。

===

佛性是海,人生是波浪,
你我在人间流浪,最终又回到海上。

====

今天nlu上
- fit slide
- fit topic

明天
- 把内容填上
- code oriented

===



Wednesday, September 11, 2019

devil's advocate

最近和一个印度人合作,他喜欢对我评价,一下是一些可以进步的地方
- speak slower
- content organization: connect with them, resonate what you say with (use their example), make ppl understand the value, can't assume understanding, need feedback.


挺好。

另外昨天看了以色列的书,他家优势
1. aggressive in asking different unorthodox and pointed questions to a topic
2. great and detailed execution
3. start with easy and small idea and grow up.
  - 其实纵观,大部分企业的成功,不是有一流的idea, 而是有一流的执行力。
4. frank - effective communication
5. world as your platform - don't set geographical constraint



personal branding

https://www.thinkific.com/blog/personal-branding-guide/

Tuesday, September 10, 2019

明天nlu

今天早上公司
中午到三点 都在弄CW
后面准备好question
再来去上课
回来弄travel 和电话和cancel hotel

明天就指望把nlu的slide搞定
基本计划是bert导向,卖watson

---

明天后天争取nlu搞定

yoga

今天当了瑜伽陪练,感觉瑜伽里有许多佛教的技法,比如普通禅定,婴儿休息,大摊尸法。
今天学的是哈达流。

一个小时,领略了人生第一次;一班的女生,领略了一个男生的独特。

和老板聊了,把所有concern的问题问了一遍,释然了许多。

今天基本就是准备问题,和老板聊,瑜伽,然后准备metrics。
明天上班场也是各种忙,一直到一点钟。

然后接着就可以开始准备下nlu,把他搞完。


Monday, September 9, 2019

high level and low level

当自己不时在implement时,面对一个问题,但是这个问题有时候你是之前就想过的,而且结论一般都是对的,但是当你在implement connect the dots 时,大部分时候困扰你的不时这些问题,而是其他你没有想过的问题。

所以最好是
high level 到 low-level 再回到high-level

然后呢90%以上的时间应该花在low-level, 其实那就是执行力的表现。

Sunday, September 8, 2019

Problem-oriented - method adherence, enable feedback directed + 耐性

今天终于把time series 的方法 + data + framework都匹配上了。
算是第一个sprint。

想一想前面怎么搞了那么久的time series.
1. 其实这个topic牵扯的东西挺多的
- arima: 各种不同的 arima, i, acf, pacf
- lstm, convlstm: 输入的格式
- residual: 需要分析
- multivariate, multistep: lstm+ arima+其他算法怎么弄
- cross validation
他自身自成一格
2. 一开始的时候不是code-directed学习
3. 一开始的时候没有problem-directed 学习 - 客户没给data, problem - 需要了解其他人的问题来解决。
---
其实那么快能fixate, 原因在于
- data有了
- problem清晰了
----

所以学习一样东西,必须给自己一个问题,
这样所有的方法才有依附的东西,
而且有feedback-oriented的学习,
这样其实效率更高。

----

当然你可以先给自己一个问题
感觉解决不了
你就换个问题
不要停在那里
要不这就是没效率。


----


另外 一个新领域是需要时间的
要有耐性 不要操之过急
主要是一心一意的在一个领域上解决问题。

Saturday, September 7, 2019

Conciseness - Quiz like thinking (精学) + 自发式学系.

公司有一些课,最后都会有一些quiz
我呢 之前都是一一把东西看个遍 - 觉得难得的学习机会。
现在呢,我就是只做quiz, quiz 问到的东西再去看 - 其实间中也学到东西,但是目的就是赶紧弄完。

可想而知,我做quiz上下不上十五分钟,如果我要仔细看课程,估计要4-5小时。剩下的时间不是一点点。

那换算的现实生活中,其实你大可不需要学很多知识。宁可少学,从project中学习。就学那些你会用到的。比如data science, 除了像pandas这种你需要很大的了解,大部分知识都可以需要时再学习。

另外,今天开始做lstm时,我从来没有发现
1. training error 比 test error 高 - 因为dropout的原因。
2. 单单lstm feed的不是太好。
3. lstm 里error function特别重要。如果overfitting>underfitting 那么你就要选一个适当的error function来往这个方向推进。

你可以看到,自发性的解决问题,你会发现一些特别的性质,知道会出现的问题,和相应的解决方法。这些单凭被动性的学习是无法了解到的。

所以比较好的方法是 -
自发性学习 - 然后呢知道缺少哪些知识,agile-based 的搞懂;
精学 - agile-based 的围绕你的问题往外搞懂,因为你没有无限多的时间。



Toastmaster Revisiting

- 感觉不去Toastmasters两个月,某人开始不愿上台,有点紧张,但是得来的技术并没有失去。
我自己呢,感觉开始在自我介绍时有点小不适应,过了一会儿在table topic,没人说太多pause filler, 不够smooth, 然后evaluation的时候直接把问题解决,然后剩下content organization不够好。这是个很好让自己学习 去failed的地方 更重要的是你重复的在这种演讲环境下 有助于你在工作环境中更好的使用这些技巧。还是应该常常去的。

- 网球打的有点感觉了,需要好好的训练下。


放轻松

总算有了初步的data 
把前面准备好的time series东西都倒到里面去


下面有一个东西需要捣鼓的 (怎么把这些东西两天搞定)
- accuracy of time series (2-day)
- metrics (2-day)
- nlu preparation (next week)

还有下面两个 (想好怎么说)
- aus+cal stay (Sunday think)
- china stay (Sunday think)

其实我感觉我应该学习的是不要fixate一样东西
没有什么东西是很重要的
需要放轻松。


Friday, September 6, 2019

generalizable - template thinking

其实很多时候 你听了演讲 ;
演讲本身 如果只是听 并不能generalizable。

但是 你用演讲后面可重用的template,替换承你自己的content,该template 就是generalizable的。别人的成功,整体是不可复制。但是如果你和你context不匹配的部分,变成template, 塞进你context, 就是generalizable的。

就像:
https://medium.dave-bailey.com/how-to-perfectly-capture-your-customers-need-c924e3209484
这种template.

几个keyword:
context, template, action.

跑步

感觉原来跑步机跑到的脚养感
其实也是跑步机上才会有
因为强烈震动的原因
今天终于又跑了个7.x 公里
满足了运动量

---
time series感觉怎么看都看不完
感觉需要给它一个界限
就是明天把best lstm 和 dcmm看懂
再来把所有的model 做一个common input 输入
放入CV处理。
最后要搞懂的是metrics
===
其他还要关注的就是
external data 和market basket
===
再者还有看bert
----

adversarial robustness toolbox 也要赶紧看开来 - 下个礼拜中开始。

Wednesday, September 4, 2019

code-directed

今天把3/5 的time series 的东西都记录了
明天把剩下的2/5 看一下

今天主要是复习了numpy, 了解了lstm 和把server 上的一些package装了下。
明天把剩下的东西看一下。
其实code-directed 学习往往是最好的。


---
后面expvis,
最简易的方法莫过于从ibm的code下手,
找内部人合作。

LY可以谈一下。
- project for industry
- bring in industry expertise
- individual effort in contributing
---
nlu 的话可以简单过一下bert 的方法然后document
watson assistant可以prebuild, or on record just in case
---


执行力

今天看到好几个朋友中了NIPS,有几个想法
1. 我理论上可以
2. 时间紧迫,竞争会越来越激烈

然后行动上,我就会开始
紧锣密鼔起来。

----

我觉得cohort的重要性在于emotional anchor。
如果你在名校,你的压力肯定杠杠,因为大家都那么优秀 - 会让自己一直变得更好
如果你在差一点的,没太大压力,拿到那么点就算是bonus

---

其实真正应该比较的是自己;
你要让昨天的自己比今天好;
好多少,随缘 - 每天做同样的事情必定能进步。

----

究根结底其实还是自己执行力没有太好,
这个执行力比起智商,比起你现在有的,其实价值高到不知道哪里去,

要对自己执行力做一个评估。

---

看看天下最好的执行者,
其实就是一直每一天重复一样事情,
越做越厉害,
最后成精。

不是你要耗尽你的脑袋,
而是你要constraint你做的事情,每天固定时候,专一做。
这就会变得更好。
1. 变成一种习惯 自然而做
2. 每天都有进步
3. 没有context switching
4. 坚持,越战越勇
没有网路,就是work, 一种飞机上的专注状态。

---

最近开始养成一种天天记录的习惯,
其实就是坐在按摩椅上,
先翻翻facebook share 一下,
然后思考自己的一天,敲一下键盘。
然后再从更广的人生角度来解析一下对不对。
就是一种习惯。

---

好了,就说写这里。
It's not about the events
It's not about the intensity
It's not about the consistency

When you go for gym, 1-2 days, you won't see the change
it's little, boring things accumulate overtime that make you change.





Tuesday, September 3, 2019

marketing 课

今天又去听了下marketing 课,
感觉这种recurrence 的学习让人受益良多。

1. recurrence immersion - 容易让你接触到不同的思维,刺激不同的脑神经
2. interview - 问问题从客户需求下手,不要一开始就告诉他们我们的product
3. target customer - 你访问了100个人,60个人愿意,可以用这个比例来算target customer
4. idea - 石膏magnet扒痒器, 防止细菌生长薄膜;degradable plastic using toufu

明天
1. complete sarima/arima
2. continue the remaining stuff for time series


Monday, September 2, 2019

relax and concentrate

真觉得自己什么都懂一些
但是真正实践起来却没有太厉害

主要问题我把大部分实践花在各种知识的了解
比较少的实践花在自主的编程上

再来一个确切问题:
你自主编程了吗?

继续
你攻城了吗?
你timed了吗?


看到一个朋友的post:
考虑一千次,不如去做一次。
犹豫一万次,不如实践一次。
华丽的跌倒,胜过无谓的徘徊。
迈出第一步,收获停不住!

今天
time series - 把server 搞定了
nlu - 把slide 开始了

明天 - 继续把server的空给填了 (两天)
nlu - 把slide 给填了 (preprocessing, work embedding, models)
             把bert/transformer跑一遍 (两天)
              准备下chatbot (Watson assistant)

Mind Framework

Bill gates喜欢用时间轴和graph来看看知识之间的关系。
这个可以学习学习 有助於我们看到看不到的部分。
当然我们要针对城墙们来看。

Sunday, September 1, 2019

timed bounded and work on the wall

我觉得
1. time bounded
2. working on the right wall
这两点挺重要

今天终于开始working on the right wall.
明天呢,就是继续working on the right wall.
再者 6pm 为止。
然后work on nlu。

才才开始

我现在在学了一圈的知识后
终于开始了- 终于开始了在environment 上开始搭code
其实早就应该开始了。

我一般就习惯环绕知识城门转一圈后开始攻城
虽然学到很多知识,有更周全的idea,坏处是

1. 不能feedback-directed on your own use case
2. 不能直接把学的放上去 - 后面可能忘记了
3. 转了一圈后,你也把很多现在没关系的知识学了,或者现在需要的知识没血。


还是iteratively 攻城好。
agile 是个好东西。


给自己一个问题
- 你攻城了吗?
- 你timed了吗?

timed myself

感觉设定有限时间 还是比较靠谱的增加效率的方法
但是你必须要有觉醒。

今天把大部分该懂的懂了
明天
把剩下看完,+弄template

Saturday, August 31, 2019

注意细节

我觉得我喜欢往某个大方向打一圈
然后呢细节上的实施 就不太行
细节是魔鬼
我就是个忽略魔鬼得人。
要注意细节!

没有什么成功是不需要细节的,
以后这方面要多多训练自己


1. time series - 看完了kaggle arimax, 要看
    - lstm with external
    - prasad recommend
    - 细节搞懂

发现自己很多assumption是对的
  - one hot encoding
  - residual analysis

基本 time series analysis 过程
 - break date into day, month, year
 - line plot to see trend
- do seasonable decompose to see seasonal
- test stationary
- test the right thing for I
- ACF, PACF
- Arima, Sarimax
- Residual Test
- Draw both forecast and actual
- Use Mape and SMape


Question
1. How to do cross validation?
2. Arimax how to take the x into consideration
3. VArimax how the code looks like
4. The DCMM
5. Template code
    a. transform the fields into general format so following code can be reused
    b. general EDA (ACF, PACF, stationary, seasonal, residual test, plot (forecast/actual, line, normality)
    c. VArimax code
    d. LSTM code (handling to get the right dimension)
    e. DCMM code
    f. XGBoost code
    h. other known good model
    i.  Putting external information
    j. accuracy metrics - can they diffentiable, which one is good, do/how they used in algorithms.


2. nlu - 0 


3. algo - 0 

4. expvis - 看了survey, 
几种方法
1. prototype
2. Approximation as trees
3. rules extraction
4. Reverse engineering
5. saliency masks
6. Activation maximizatoin
7. sensitivity
---

目前感觉 approximation最简单
其次activation maximization
其实我是靠猜的
下一步要看看里面的代表作更进一步了解。



Thursday, August 29, 2019

Default is powerful

今天的课老师基本是在说明如何产生idea,

1. Default is powerful
2. Survey can use sequential logic to identify whether it is consistent
3. Survey sometimes not credible, we can use ethnology to observe people, like Facebook observe our behavior
4. Try to think of something without boundary, restrict the option, implement it
5. human has cognitive bias (difficult for judgement - see the link), starting from cognitive bias

今发现最容易让自己有进展依旧是timed youself, or timed every two minutes.


1. time series - 刚开始arima
2. nlu - 0 
3. algo - 0 
4. expvis - 看了survey

Wednesday, August 28, 2019

又飞上天

今天想了下msd的presentation, 有了outline; 看了下expvis,有了些想法; 整理了data, 有了可以处理的data;买了leetcode, 有了可以做的习题。

明天
1. time series - 搞完
2. nlu - 把slide模板弄好
3. algo
4. expvis - 放到ipad里


下面全靠execution
1. 简化
2. 分担
3. 专一
4. 热情

distant from tech

今天去参加一堂nus的课,研究企业business model,
从market, competitors, revenue model, mvp, funding, etc. 这种business角度来看一家公司,挺有意思。
中间教授提到一个business model 太复杂,简单点最好。这个建议挺好。
另外大家提了各种idea
1. 厕所evolution
2. iot 全套
3. 智能billboard - 通过computer vision 来调动广告,或者people counting
4. hot desk - 名贵参观无用时间来作为hot desk, 类wework
5. 放遗失贴纸
6. 老人social media
7. cloud luggage - 一家公司帮你弄好所有luggage该有的东西
8. 机器人 - 帮老人,类boston dynamic
9. hyper personalized speech recognition, nlu etc.
10. sensor for 老人

现在看expvis, 忽然有了不同的角度。
看来distant自己from tech 有时还是有帮助的。

---
另,今天在参加bidding是碰到自己的高中朋友,也在ibm,这是巧合
---

另,发现马云鸡汤到处飞, 没创业过得口里说的都是马云鸡汤。固然道理很对,做到不容易。好的VC都看团队,看执行力。

---

明天,

time series, nlu slides, tech sales slides

Monday, August 26, 2019

Rule-based

我感觉虽然发散性思维很重要但是需要配合的是高度专注 rule-based 的行为和执行力。

感觉自己最大的问题是比较随性,发散思维无时不刻。
其实每天晚上发散一下,早中晚rule-based 生活。1.

首先
1. 高度专注 - 也意味着放弃或者延迟各种其他活动
2. rule-based - 也意味着你要放弃你心里想做的事
3. 发散/feedback-directed - 意味着这时候你要从资源的分配和创新上来进行下一轮的分配

另,
发现mba还挺有意思的,撇开技术只谈商业道理。
但是光有道理,没有实践,也是空谈。

来给明天计划一下
1. time-series 履行


Sunday, August 25, 2019

机遇

刚和一个学弟聊了下,有几种新加坡博士生最后会升上教授
1. 机遇来时
     - 当机遇来时,你会发现你好多朋友同时都能上,和能力无关 - 和机遇有关。像queenland university, melbourne university这种算机遇。
2. 老板牛时
     - 这个比较predictable, 当你和老板处的好,可以用资源来帮你
3. 经历牛时
     - 当你到国外倘金水回来时


===

今天的话把slide做完了,算urgent task.

important+urgent
1. time series
2. nlu
3. schedule talk with Derek

为啥最重点进行慢

1. 最重点进行时各种看,因为重要,但不紧急
2. 最重点进行时各种活动。
3. 总想把时间让给好像挺重要,实际不重要;或者紧急,单不重要的事情。

明天
1. 把visualization
2. feature extraction
3. cross validation
4. stationary testing/acf/pacf for arima
5. xgb 和 lstm 和 arima 搞懂

Saturday, August 24, 2019

exponential growth and (persistent+reward) process

1. exponential growth - when build something, rather than building something with linear grow, or worse logarithmic grow (very attractive) - try exponential grow.
2. reward as motivation - you need to be persistent until your first reward, after the reward is constant, the motivation will kick in automatically to replace persistent
3. time time and time -
today, morning, discussing the visa and handle visa
afternoon - discussing the tp
afternoon after 4pm -9pm accupuncture and out.
>9pm handling the email, listen to talk

Tomorrow
1. handson for state-of-the-art time series (ibm, m3, kaggle)
2. understand the normal data extraction process (for CV, XGBoost - xreg, LSTM-external)
3. fast template for code

Friday, August 23, 2019

不是不是不是

继续洞上努力 -

终于了解有些教授把方向说的那么明白的好处 - 变成一个城墙口。
就算教授们把他说成一个墙,你自己还是要找到一个城墙口,aim准发射。


很多看上去有意义的,但是他们都只是墙的一部分,不是不是不是城墙口,但是他们可能可以帮你看清城墙口:
1. 开会
2. 回答email,问题
3. 整理文件
4. 学习知识


冲城墙口:
1. 为你的目标写code, 犯错误,修改错误
2. 和别人了解城墙口怎么去冲破

Thursday, August 22, 2019

洞上努力

忽然间多了件杂事
纵观今天 其实在end-to-end上的投入不太够
虽然有了很踏实的time series bird eye view
再加上今天听了个免费的data fun关于文章理解的talk


Lack:
1. handson for state of the art model
2. handson on your own model
3. expvis - starting (reading on explainable AI paper)
4. algorithm - handling the high frequence question

纵观今天
- 早上准备talk
- 中午整理talk 休闲一下
- 晚上听datafun talk 和 ibm talk | 寻找问题答案

其实
- 休闲一下
- 晚上听datafun talk 和 ibm talk
这两个没什么关系。

我感觉其实看起来有学习意义的东西,
看起来有意义的东西,
其实换个角度想不一定有意义。
必须确保自己在一个城墙口冲锋,用足炮药冲锋
而不是随便一个城墙口随便叫一下
城墙口都是好东西
但是力量不专注,目标不专注是个极坏的东西。

Wednesday, August 21, 2019

搞了leetcode

终于看到time series 的边界了
感觉这个题目不容易,各种方法
我觉得提早看到尽头 很大的原因是我有个deliver deadline
逼着自己不能走遍所有胡同 但是确有必要看到其他胡同的存在
这个deadline还是很有用的。


但是我感觉更主要的又回到了时间利用
你必须maximize你的effective output
明天要定好需要的effective output
然后分时间段来deliver个别 effective output
所有的non-related input 都要pending到晚上一小时弄。

接着要增加expvis的部分和algorithm 的部分

今天有人来问algorithm
折日不如撞日
直接买了leetcode。

Plan 一下
1. 早上 - 搞懂OWA, 和把实体上最好的方法加进去,然后加点别的东西到个别的栏目里。
然后计划讲稿。

2. after 2pm - 把lstm 了解 和 state-of-the-art end-to-end 搭上来跑一遍。

3. 晚上和周末 - expvis 和 algorithm。

Tuesday, August 20, 2019

井里飞向天空

明天要和老板开会,瞬间从井里飞向天空,有了比较完整的bird eye view。
lstm 和 xgboost 还没有看完, 明天继续看。
看完了,做个bird eye view 的整理就完了。

Monday, August 19, 2019

time series 整理

今天把那些问的问题都有几本答案了
只是感觉还有点not down to the earth
明天打算好好地down to earth

今天走去red hill market 拿了吃的
又走去bukit merah 买灯泡

CW - 明天down to earth
exvis - 新开这个栏目,目前没进展。

Sunday, August 18, 2019

Time series

今天看了一天的time series感觉内容太多
明天主要focus on
1. 把重要问题解决找出来
2. 把end-to-end solution 弄出来

人生呢
觉得有种自觉安静,但是却在静中没有达到寂静的情况。
就是大方向上,是宁静的。
但是专注于心里,却依旧是波澜四处。
需要小处着眼。

网球

今天学习了网球,太阳太大,打得汗流雨下。
另,time series 的话基本搞懂了acf 和 pacf
pacf for ar
acf for ma

明天要
1. 把time series 的入门知识看完
2. 把template code搞起来。

Saturday, August 17, 2019

从 82 到75,瘦下来了,估计到高原缺氧环境爬山有关。
去的时候缺氧,回来的时候醉氧,感觉生活在梦里。

明天呢要继续time-series
1. arima series method
2. xgboost
3. derek's questions
4. end-to-end model training
5. external data

Friday, August 16, 2019

开会

今天做了什么呢?
1. 整理了解
2. 开会
3. 休闲

明天应该做什么呢
1. 整理注意事项
2. Time Series
3. Data seek
4. 训练自己的说话

今天嘛 - 其实一整天都在为CW准备,其实进度还可以。
但是只要有个会,会前就over prepare,  会后under prepare
应该来个,会前just prepare, 会后 continue prepare。

明天主要把2,3 搞一搞。

Wednesday, August 14, 2019

旅行

到稻城亚丁去旅行,也到成都去。
发现这两处人们, 和江浙沪不太一样,对生活更懂得享受,也不太懂得攒钱。
所以说虽然中国人民有很大的相似性,但是还是有地区的差异性。

另,藏人的生活,基本是全依赖信仰,他们在高原生活着,过着养牦牛,打工的生活。
1/3 信仰,1/3生活,1/3买七宝。
他们的生活很有启发性。

对于人生的看法呢
1. 要更懂得享受生活,追求行而上的成就。追求平衡的人生。

对于中国的看法呢
1. 川西真特别,刷新我的中国风景观念,和生活价值观。
工作方面呢
1. 两大重点
a. 把大方向弄清楚,把问题搞清楚
b. 弄sample code

Wednesday, August 7, 2019

不竞争

今天和一个加拿大老师聊了下,感觉加拿大的治国和众北欧国家很像。
医药全免费,学费全免,大学贷款,工作换。
另外,他们的没有竞争意识,大家就应该把事情做好,爱干什么工作就干什么,教授和货车司机同等,他们很可能是邻居,因为工资差不多。
加拿大领导人地位不会太高,就是帮大家工作而已。
但是加拿大消费高,大家还是要好好工作。
这是一个很厉害的社会发明。

但是加拿大没有太厉害的科技公司,北欧国家貌似也没有。
有可能他们没有适当的KPI来鼓吹这个事。

今天搞了一点time series,
主要和CW接壤上了。

明天:
1. VPN
2. 准备好汇报
3. 把机上Time Series 学习 和 CW的material都准备好。

Tuesday, August 6, 2019

生活中的想法

1. 落地来想,换方位来想 - 李光耀,制定国家政策,凡夫俗子该怎么去思考这种大问题?就必须把这些政策放到你的日常生活推演一遍。

用英文做国家语言 (李光耀):
a. 老百姓 - 会带来大家第一时间讨论最新知识,最新娱乐,最新新闻 (西方来的),因为不需要翻译。
b. 金主 - 还能给西方投资带来良好的环境(大家会说英文)。
c. 李光耀 - 能用自己熟悉的语言和大家沟通

精英政策(李光耀):
a. 老百姓 - 平穷的奋斗把自己变成精英,为了出路。富有的需要继续奋斗。
b. 金主 - 优秀的人才供给。
c. 李光耀 - 自己也是精英,起了模范作用。

2. 学习成功模式 and 用相关事件,或小范围实验来做决定- 邓小平

1. 学习成功模式 - 参访了各个国家,学习了新加坡的经济模式,改革开放,因为他迅速获利。
2. 用相关事件决定 - 当时苏联连阿富汗都没拿下,断定不会出兵援救越南。
3. 小范围实验决定 - 在深圳等地区小范围试验了改革开放,成功后扩张全国。
4. Context Aware - 只改经济,不改政治。

3. 迅速测试-
   先email 后说话 - 从email 的回答来判断一个人的知识,然后再决定和他说话与否。

4. You want to be the best
只有一下群做的最好的人能分市场一杯羹,其他的就准备从市场走出去,现实要求 - 你必须在某个领域做到最好。

Monday, August 5, 2019

The Projector

- 今天去了The Projector 看了Parasite, 很特殊的一个电影院,好地方,好电影。
- 了解了:time-distributed, 各种不一样的network 需要的data shape, lstm(hidden state!=cell state), return sequences/states, cnn (kernel/filter, stride, same/valid)

明天要了解 cnn-lstm, convlstm, sarima, optimization

Sunday, August 4, 2019

合作

- 找人合作是们学问,而且是们大学问。
- Time Series MLP了解了下,对于各种use cases 和需要了解的部分,有了飞跃的了解。
   MLP是[samples, time steps] (one feature)或 [samples, time steps*features] (multiple feature) 
   LSTM/CNN 是[samples, times steps, features]
   另MLP的学习能力出乎我意料之外,学个两数相加学的挺好的。 
- 今天从china town 走回去 3.x 公里
- 明天呢?
   LSTM - SARIMA - Exponential 这个方向学习
- 大智大勇很重要。

Saturday, August 3, 2019

Time Series

0. 一早把所有的东西都搞完了。

1. 把明天的toastmasters推了 为了更多时间来了解time series;
今天看了下,感觉能做time series 的方法基本你能想到的model都能做 - 基本是跨model的。

2. 今天和PS 一起开会,他竟然拉了一堆人来帮忙,太尴尬了。拉了一个人,他起初同意,然后要拉上一帮人,那人开始不愿意了。真晕。不过他厉害的地方就是把很简单的东西说的很厉害的样子,主要借助形容词和语音语调变化,需要学习。适当的拿资源也该学习。


明天
1. 一早直击time series
2. 问问题

Friday, August 2, 2019

记录

明天得记录
1. onenlp
2. bayesian network
3. ai verification and smart contract

明天得先看
1. telco
2. spectra engagement, 熟悉他们用的方法
3. 接着看time series (arima and deep)

今天呢
1. 了解了onenlp
2. 看完了fss
3. 搞了点time series

明天要有什么改变呢
1. 起来奔电脑搞记录
2. 专心干活
3. 专心娱乐


Thursday, August 1, 2019

找人讨论

今天又恢复参加talk听科研的阶段了。
挺有意思的,听jingyi和sun老板说了一整天,对于AI Verification 有了一些了解。

基本就是
1. 用program analysis 的方法for smart contract
2. 用neuron coverage 的方法for testing neural network
3. Testing - adversarial attack (add impercetible noice noise) detection - imperceptible noise (using pnorm and threshold it)
4. Verification - condition under a constraint will yield same output
5. Mutation - change network (ensure 90% accuracy)and change image

Tuesday, July 30, 2019

CW 学

CW需要supply chain+forecast+optimization.
今天整体看了translation API, Watson 2.0 AutoAI 和 Watson Assistant
明天把剩下的Markovian 和 FSS看完
再来就是Time Series 了

今天早上和Comm CTO 聊了一下,现在都会把聊天录下来,来作为自己的改进。发现了不少问题,以后得多注意。
另外,晚上部分去走+跑了7.5公里,现在这种距离已经习惯了。

对于人生有什么体会呢?
感觉现在30+,人生就是30几年的再刷一次半。不是很长,想想过去,也是挺梦幻。
人要自然,怎么过都可以,不要太执着想要达成什么,尽力就好,开心就好。
我感觉现阶段最重要是心,需要安宁安静下来,静静地,安静的,简单的,干点什么。

Monday, July 29, 2019

Pru -> CW

今天听老帮聊了下CW, 了解了 不过压力可能会比较大 因为是各个大公司间得竞争。
明天得专注forecasting 的部分。

今天主要学习了translational API, 针灸。
video 部分的话放到ipad里后面听。
watson 部分可以找天去公司的时候看。
现在主要是要搞清楚forecasting 和 optimization的经验。

另老板说要竞争这个project, 因为后面的asset可以变成reusable的,而且应用场景广。果然是高见。 

忙碌周末

感觉这周末活动挺多
周五 - 吃饭
周六 - 实验室集会
周日 - 人大集会,一点吃到六点, 晚上去跑步7.5 km
见了上上下下 20-30号人 挺有意思 

就是work 方面进展不大
反正周末,明天就要开始干活了。

另外,博士导师待孩子的方式很有传染力
感觉积极培养每个孩子
以一种正面的方式,并给与良好的环境。

work 方面,今天记录了老板的东西
回复了msd的email
就这样 就这样的过去了。

Sunday, July 28, 2019

实验室集会

今天上午部分把一些东西整理了一下 (Sarima, IBM FSS)
明天还要继续整理。

明天还要继续。
motto: 做个有效率不拖拉的人

今天参加实验室集会。
在east coast jumbo
和各室友们继续connect了一下。
也和导师聊了一下
被催了生小孩
然后也和导师师了解了他最近的科研。
原来他在新加坡的房子出租也配上了女佣做额外服务。
真是一个非常棒的plan
澳洲也有好几幢房子
tool 方面做得是silan
感觉挺融合目前时代背景
但是不易火。
其他同学也聊了一下
后面去吃了榴莲,味道还不错。
===

另外,继续了上次的尊重每个人的看法的哲学思想
我们要尊重喜欢我们的人,当然也要尊重不喜欢我们的人
因为在这个阴阳世界,若阳是喜欢我们的人,阴就是不喜欢我们的人
全阳世界明显并不合理
太极叫我们要在阴和阳之间仁运,仁运才是至理。
把阴和阳运用的刚刚好,

阳 - 快乐
阴 - 进步,改变,让。

就会发出最美妙的光芒。

假设真有全阳,其实并不一定好。
没有进步的,学习的空间。

Saturday, July 27, 2019

checkpoint

1. 记录 - 翻了一下2013年交毕业论文的记录 发现当时的流水记录 后面读起来挺有感觉。感觉还是有必要记录的详尽点。

2. 办活动 - 今天办了场bbq。怎么办下来,发现了一些规则。BBQ 大家虽然是自然交谈,但是也要想着 - 食物,气氛。这些都和人有很大的关系。有些人能弄好吃的食物;有些人能带气氛。但是能带气氛的人需要别人一起方能带上。还有一些人会把气氛带low - 因为他们自带low气场。每一个人都是一个不同的化学个体。怎么样平凑在一起是一门艺术,也是一门科学。

3. 预防针 - 今天会了老板了解了自己的title。藏在心里多是的问题得到了解决。也了解了一些engagement的学问。老板的长处在于预见所有可能发生的事情,先打了预防针。然后做transparent的回报。让别人无痛点可捉。比如,把risk先列下来,然后在每个progress report针对risk 的 possiblity 和 impact 做汇报,别人指出问题是,risk里的内容就可以作为反击。

4. project-based+各种尝试 - 我发现目前,我就对genetic algorithm 的用法了如指掌。对于linear programming 马马虎虎。对于普通DS就不用说了。总体来说,我的学习方法是错的,应该project-based, 而不是theory-based。然后随便改动,各种尝试比较。

5. 反直觉 - 今天发现如果你的直觉告诉你一个方向是对的,然后发现是错的。第二次在同一个地方,直觉告诉你是这个方向,你只要反过来就行了。这个其实是很有意义的发现,因为我们做某件事情,直觉告诉我们的方法去做,发现并没有效果,其实第二次,可以试试反直觉。档案要70%以上把我是因为第一次直觉所给与的方向是错误的。

6. 可能性 -  我发现,如果你发现跑42.5km是有可能的,你大可能会逼自己去尝试。但是如果假设这个世界上只有一个人呢? 这种情况,我们其实可以把昨天的自己,和今天的自己分开,成为两个人。今天的自己要尽力超越昨天的自己。比如Elon Musk,如果他要做一个全世界的pioneer, 他说他是first principle 来思考,然后尽全力达到这个first principle 的theoretical value。其实这个世界,如果你可以科学对待的话,你获得的回报应该是杠杠的。


Thursday, July 25, 2019

variational autoencoder 终于搞完了

paper - 终于把variational autoencoder 搞完了。
搞了那么多天
估计不太值得哎。
但是搞懂各种math还是很有成就感的

我感觉我学东西都是看过类型 - 不怎么对
应该project-based

pru - 明天就争取吧ibm那些tool 看一看
后面就project-based 学习了

今天跑到了克拉码头 从那里走回来。
算是多年来第一次跑步机意外的跑步。
跑了3.5km,走了3.5km

聊到了一个mutation idea.
感觉paper 的话和前团队合作还是一个很不错的idea,
毕竟这样迅速把domain搞熟悉,然后有人一起忙着。

今天唱了好多首歌。
发现自己唱歌不咋样
就是自唱自high


另记一下sun zhengyi的 孙氏平方法则
很简单却很有道理。





理念:道天地将法
道——恪守使命
软银的整体使命,是利用信息革命让人们愉快。软银所有人都曾听说过这点,并熟知这点。在孙正义的30年计划讲话中,这也被多次提到。
天——道法自然
在特定时机下有着特定的机会。孙正义列举当前时代中发生的独特事件:信息大爆炸、微处理器、互联网。
无论你有多么优秀,如果生于错误的时代,那么机会就将受到限制。当代人很幸运能生活在这样一个时代。
孙正义也提到了此前的几次革命:农业革命、工业革命、信息革命。信息革命可能是其中最庞大的一次。生于这个时代很幸运。机会就在这里,我们应该充分利用机会。
地——地势之利
以往,美国占全球互联网的50%。而到2015年,亚洲将全球互联网用户的50%。以往,由于用户在美国,所以美国人、说英语的人更有优势。在历史上,所有大型互联网公司都来自美国。
然而,时代正在改变,互联网正在转向亚洲。软银在亚洲的存在已有10年,例如在中国投资了阿里巴巴和人人公司。 由于“天”带来的黄金机会,以及地形优势,软银没有理由不充分利用当前的机会。
将——招纳贤士
CEO必须是优秀的领袖,但他也需要有至少10人组成的团队。没有任何事可以独力完成,软银总是在储备优秀的领导者。
法——建立机制
借助意志力和运气,你或许可以取得一次成功,然而这不可能永远给你带来成功。为了持续取得成功,不断驱动创新,你需要设计系统,让这样的成就反复实现。
软银已部署的系统包括:将把计划分至各个部门;引入新的商业模式。没有“法”,你的执行不可能实现一定的规模。
愿景:顶情略七斗
顶——明确愿景
当你登上山峰之巅所看到的景象。这是一种愿景。领导者必须有能力想象,登顶之后的景象。他必须选择去攀登哪座山峰。正确的选择意味着50%的成功。你必须确信,自己选择的山峰是正确的,并在没有攀登之前就预见到登顶之后将会看到什么样的景象。没有愿景的领导者是最糟糕的领导者。
愿景并不是在一两天内形成的,你必须每天去思考。在孙正义的30年计划中,愿景花费了一整年时间的积极思考才得出,并利用了来自许多人的输入信息。
情——收集情报
孙正义研究了40家企业。最终,他积累的纸张堆起来有1米高。在孙正义大学毕业回到日本之后,他想要创业。然而,他花了1年半的时间才着手开始。在这段时间里,他研究并收集信息。他研究了40家企业。他可以为某家企业制定深思熟虑的计划,制作商业方案,分析财务状况,以及竞争对手解析。
孙正义认为,他的公司将会是世界上最优秀的公司。不过在23周之后,他会设想出另一家公司,而这家要好于前一家。随后,他会重复这样的研究,不断提出新计划。他重复了40次,每次得出的公司计划都要比之前的更好。而他的最后一份商业计划最终发展成了软银。孙正义强调信息收集的重要性。
略——制定战略
从本质上看,“略”是对愿景的执行。在进行研究之后,你可能会有40种选择。“略”是指你从中挑出一个选择,不再回头。“略”将会把愿景变为现实。
七——七成胜算
如果只有50%的成功率就去开始,那么是愚蠢的做法;而如果等到90%的成功率再干,那么可能为时已晚。真正的将才只在确信能够胜利的情况下才会出战。
孙正义被认为是积极的冒险者,但实际上他自己非常谨慎。他从不会冒大于30%的风险。即使公司将失败,他也可以将一部分关闭,并推动核心业务的继续发展。你必须确保,自己的计算是正确的。
在形势所迫的情况下,领导者必须做出战略撤退。这是最困难的一件事。对下一代领导者来说,这甚至更困难,因为他们可能会被批评不如自己的前辈。关闭某些业务需要极大的勇气,你将会受到各方的指责。
在将军损失30%的部队时,他需要立即撤退,任何其他决定都将是愚蠢的。如果无法理解这一概念,那么软银将会被毁灭。
斗——百步穿杨
在战斗过程中,你可能看见一些东西说很容易,而执行总是更困难。你永远都会有竞争对手,在战斗过程中,情况会发生改变。无论愿景、战略或研究多么棒,但如果你无法落实到执行上面,那么一切都是无用功。
孙正义提到,所有公司都是通过一系列的战斗才达到现在的地位,例如丰田、本田、福特、洛克菲勒、比尔·盖茨、史蒂夫·乔布斯。
愿景等于执行,执行等于愿景。为何要战斗?这是为了让愿景变为现实。
战略:一流攻守群
一——勇争第一
必须成为领先优势明显的第一名。必须控制特定的市常只有在控制市场,远远领先于第二名之后,你才能实现长期的盈利。
如果你的领先优势微弱,那么丢失所有的利润可能只是时间问题。在科技行业,这点尤为如此。只有成为第一名,你才能打造平台,定义事实标准。孙正义提到的平台包括微软的Windows、英特尔的CPU、谷歌、亚马逊和雅虎。
公司必须有强调第一的文化,你必须争做第一。满足于不是第一的文化是一种非常负面的文化,这将十分糟糕。孙正义表示,从小学开始,他就一直是第一。如果自己不是第一,那么他会睡不着觉。
流——顺势而为
不要抗拒潮。不要逆潮流而动,确保方向性正确。你要选择哪一操作系统?毫无疑问应该是用户数最多的操作系统。不要选择小众产品。在小众领域成功的创业者并不是真正成功的创业者。成功的创业者需要在主流市场做到这点。
软银不会投资小众市场,而只会投资未来有着巨大发展的市常在小众市场取得成功毫无意义。如果你由于害怕而选择追逐一个小众市场,那么就是失败者。
攻——全面出击
销售、技术、并购、新业务的发展等等,必须善于多方面技能。
守——防微杜渐
现金流、成本优化、投资者关系、关闭业务、合规、审计、媒体关系等。当前的许多企业死亡是因为财务问题。软银专注于成为零债务公司已有4年历史。
群——多点开花
软银将成为由5000家公司组成的集团,并采用多品牌、多业务的模式。如果你希望在未来30年中生存,那么这可能并无必要。然而,如果希望在未来300年中生存,那么这样做是必须的。类似微软和英特尔的公司正处于困境中,因为它们只有单一的品牌。
领导者能力:智信仁勇严
智——足智多谋
知识、关键思维、全局谈判、演讲技巧、技术、财务、分析能力等等。领导者必须掌握多方面技能,并在这些技能间做好平衡。领导者必须精通某一领域,成为这方面的专家。领导者不能依赖于专家,而必须利用好专家。
信——保持信念
相互之间自愿的合作。信任他人,被他人信任。合作。如果你失信,那么他人不会为你工作。
仁——造福于民
让他人感到愉快。可以回顾愿景一章。让他人愉快。
勇——攻守兼备
挑战大竞争对手的勇气,关闭业务的勇气。
严——纪律严明
严于律己,并在必要情况下严于律人。如果你坚信愿景,以及对所有人最好的做法,那么某些时候你必须成为“恶魔”。
战术:风林山火海
《孙子兵法》中讲到,其疾如风,其徐如林,侵掠如火,不动如山。
这在孙正义看来,是他用兵制胜之道:面对压力,采取突破性战术,当所有一切都被吞噬之后,战斗才会结束。
而剩下的只有彻底的平静。正如大海一样。

Wednesday, July 24, 2019

variational autoencoder

今天就在整理variational autoencoder.
这东西不容易记得,还没弄完
其他的在记录lstm

明天就是pru的东西+variational autoencoder.

Tuesday, July 23, 2019

Sarima and variational autoencoder

Sarima - 就是arima上再apply seasonal
Variational autoencoder - 就处了reconstruction再让coder的部分learn一个分布,和哪个接近 (q||p),reparameterize trick (to make parameter differentiable)
LSTM Time series, 原来窗口是这嘛事 - 另encoder, decoder也是流行的一部分。


还有就是把东西note 下来

明天experiment 一下
1. Variational encoder for topic modeling
2. auto feature engineering

看看结果
再来就是brown 的一章章阅读 转成medium文章和课程

and Pru stuff (Traslation, Watson Assitant, Watson 2.0 [AutoAI])

Monday, July 22, 2019

time series

今天主要整理过去所学
time series oreilly讲得不太好
于是看了另一个video,把
1. arima
搞懂了

也整理了
2. nlu from 狗尾草
3. lfe, Cognito 和onebm
4. useful lib - magenta, kaldi, deepchem
5. some business model and business strategy

看了下
1. deep reinforcement learning (deep q-learning)
2. RBM, DBM, DBN

明天着重
Sarima and Variational encoder and Pru stuff (Traslation, Watson Assitant, Watson 2.0 [AutoAI])

Sunday, July 21, 2019

Automated feature engineering

今天去看了朋友孩子,虽然感觉他不是那种特别emphathy类型和rational 类型,但是在技术上,和职场上还是学得挺多的。
我觉得为什么要尊重每个人的不同,因为这种diversity会比较optimal,大家有不同的优点可以互补。

feature engineering上,终于明白了ibm的work.
基本概念是把feature for each class 做quantize sketch, qs
[qs for feature 1 on class 1, qs for feature 2 for class 2]
然后来learn whether a particular transformation is suitable

整体概念是 给予过去input distribution 和 output作为training, 来判断一个transformation好和坏
一个transformation弄一个nlp
这下懂得ibm 的auto feature engineering怎么弄了
基本概念是用过去的feature engineering 帮助现在的

paper 写的真难懂,看了好一会儿才看懂。。。

paper - lfe
pru - watson 2.0 with auto ai

游戏

这世界就是一场游戏
金钱游戏是其中一种
但是如果没有这个福分缘分去玩
不一定要太fixate on that
还有很多的游戏可以玩
当然有机会玩玩的话
不要玩得太投入
反正就是一场游戏。

玩得happy, 玩得尽兴,玩得high,
才是游戏的意义。

看穿了,其实整个世界的设计,乃至宇宙的设计,就是一场游戏的设计。

我们会自动被assign 一个角色,和一些筹码,当然有你本身的能量值(福分) - 你可以去增加和减少能量。然后配合着宇宙意识的潜在操控,这场游戏进行了。

游戏有确定性的,也有不确定性的。因为玩的人是宇宙意识,宇宙意识又是个体意识的总和。个体意识是有能力去改变宇宙意识的。也就是,你就是其中一个玩家 - 站在游戏的设计上。

当然游戏更大的目的,其实是要你了解这是一场游戏,去take over 宇宙意识,最后跳出这场游戏。

游戏外 清醒,游戏里 清醒,但是玩的尽兴。

步行

早上武吉知马步行
晚上吃了小杨锅盔,biangbiang面,凉皮,cendol, 汽水, 100号,吃茶三千 - 冻冰乌龙。从GEM走回家10公里。

从JE走到clementi (4.7km) - 很长,1/4路程,走起来感觉是我应不应该投资JE房子,感觉这里起的好快,目前又恢复plateau。另,原来马桶盖就是沿路买的。
clementi  - 买了水补充下
从clementi到dover(1.6km) - 经过poly, 和遥望utown, 这段路好不错.
从dover到buona vista(1.6km) - 原来我去过rochester mall的starbucks
从buona vista 到commonwealth(1.1km) - 前住处,很熟悉
从commonwealth 到queentown(1.2km) - mm提醒下原来我去过好几次queentown community centre. 另3-4个mrt旁边的公寓在建,新加坡的房价挺看重这一地带的公寓。
从queentown到redhill(1.9km) - 常走。

感觉是相当有成就感,把这条路走通了,了解了。向东十公里走过了,向西4公里走过了。

吃茶三千
1. 故事:进门电视介绍,给自己一个故事
2. 专业1:后来看着员工专心做茶,身体力行
3. 免费:店员给免费茶,浓茶但不苦,而且凉爽
4. 专业2:最后不了解乌龙茶,柜台让我们闻茶,增加专业度
5. 体验:口里的茶,浓而不苦,顺喉,这就是一整套体验

Paper方面,今天就整理,看看auto feature engineering. 感觉这是个可做的题目。

Saturday, July 20, 2019

原来超级简单

最近发现大部分有效的方法,都是简单的。
1. Hyperparameter tuning on simpler model - 这是我原来想法, simpler model 这个想不通
后来发现有人弄出过这个方法, simpler model = model trained with less data (原来超级简单)
2. Use an approximate model to model the performance of original method, approximate model 这个想不通
后来发现也有人弄过, approximate model = faster model train with same data (原来超级简单)

我的想法是simpler/approximate model -> 需要用个什么complex heuristic来求,或者什么feedback directed method之类的。
别人就用 few data, simpler model 这种,直接搞定。
这个思路太厉害。

Friday, July 19, 2019

学学慢

今天学的比较慢
早上听了ceo的 talk 后面deep lift 回来看了ellison 然后又再看deep lift

追根揭底,应该等到晚上看难点的东西,早上看容易点的。

Paper - deep lift
Pru - icpd 6 - to learn

Thursday, July 18, 2019

学学学

今天各中学
1. time series
2. google algo
3. automl 4paradigm
4. automl ibm
5. nlu china comp
6. some ML intro on neural network building (kaggle, and practical)

下面还有talk 一直到1am..
真服了

paper - 上面的
pru - todo:Watson 2.0, Watson assistant

Wednesday, July 17, 2019

大神的共同点

不急不燥 constant speed
对每一个细节(default是什么,每一个function 有什么用途) 了如指掌 (我是急急燥燥,细节都不太注意)

大师解决data science 题目时都是老
我的问题

1. 不先build 一个base model,直接用别人的model
2. hyperparameter tuning, overfit on train data. Leaderboard, overfit on test data
3. 不看问题解决从根本
4. 没有很好的cross validation

大神
1. EDA->Base line ->feature engineering ->HPO-> ensembling 一步一步来
2. 每天半小时一个submission
3. HPO不要太强调,避免overfit on training data
4. cross validation 很重要,不要太care test data

总结来说我发现,大神的方法都是很惬意的,怪不得sustainable.

Tuesday, July 16, 2019

铺垫+说慢点+强调+圆滑-同理心

铺垫
- What is your area of focus that Derek assigning to you? vs
- You have one to one with Derek yesterday? What is your area of focus that Derek assigning to you?

说慢点
- 字和字之前要有空隙, 字字发音清楚

强调
This is really AWESOME

圆滑-同理心
有三个人在一起,不要只和一人商量,要三人一起
plan要圆滑, 不要只有single direction,要multidirection


Rd 这种empthathy 值得学习.
Nj 的话就是时时发言, 但是就是缺乏了钱前面所有的.

多发言
我自己的话,需要多发言,前面的部分需要加强.
要以一种聊天的心态对待
发言的时候要注意art 的部分


Pru - 了解了所有人的band, 了解了leave, 了解了data science band,了解了work/idle ratio
Paper - nlu 实现 + tranformer/bert
整理资料

genetic algorithm, ask slide

Monday, July 15, 2019

回顾旧公司

看了dialogflow 后回顾下前公司的nlu 发现其实前公司还是有优势的,主要是
1. reliability不足
2. 没有在真正该research的地方投掷心思
    a. coreference resolution
    b. goal oriented dialogue
    c. siamese model faq with knowledge graph
    d. better intent classifier/entity extractor
3. 所有的东西都是for prototype, 用python 做production

但是feature-wise还是有很大的优势的。所以dialogflow其实也是一个开端而已。


另外,另外想弄的东西就是把nlu (conversational classifier, intent classifier, classification model 和ner的code) 给导出来。


paper - chatbot exploration (nlu code to export)
pru - 老板那里了解了一下project

Sunday, July 14, 2019

dialogflow 和 自己做主 和 打预防针

另外有个体验,我觉得世界是为我们所用,让自己快乐所用。
所有东西都要自主
比如看不看电话,和做不做某样东西,其实你都可以做决定。
不一定大家做你就得做。
不一定要顺着别人的喜好。

但是自主里也包括了自律,同理心等等。。因为这些最终都会使到自己快乐
====



今天看了dialogflow, 感觉我前公司的产品,有很大部分参照了dialogflow, 也难怪,我们最早期的顾问来自google。

dialogflow里有
context (can set lifespan)- 记录前面的variable
followup intent
event - 可以是welcome message 之类的callback event
action - 就是url的名字
knowledge base(database? webservice?)/skill - 来question entity
synonym - 同义词
(multiple) response messages
fallback message

nlu 里的extra feature
intent redirection
其他需要查找  
后面要看看seq2seq 的课程。

====

明天有team meeting,
前面部分要准备说什么
然后继续看dialog flow 和seq2seq,
中间不要有太多的激荡。

Saturday, July 13, 2019

NLU Chatbot

今天开始开启一个新的series

天天 Explore 一个 新的new topic!

今天首选NLU Chatbot

问题:
1. 现在的chatbot一般怎么用
   - dialogflow 这种其实和iamplus差不多,明天继续看
   - 也可以seq2seq learn, 明天继续看
2. 是rule base 还是goal base的?
   - dialogflow 应该是rule base
   - seq2seq 可以看看了解下

今天就是处理了email, 然后搞这些学习的material
明天就集中一个专研下去。


Rosso Vinno

今天到clarke quay 去吃意大利餐 Rosso Vinno, 味道挺不错,我吃的是Tagliatelle Pesto (24.9), 另外喝的酒Moscato BTL(58)也挺好喝的。

当中聊了英国oxford发paper 的方式。他们都是上半天班,但是效率挺快。不敢conference, 都是把一个work做完后,再考虑投会议。虽然追风,但是有自己的原创性。这个模式挺make sense。


Wolfgang (米其林)
Le Rida (印度餐及地中海餐)

这些后面可以试试


今天也看了text to speech, speech to text 和 Watson Discovery API.
1. 明天要把NLU的部分整理一下,弄成一个pipeline - 弄个NLU 的课程。
 - BERT/XLNET
 - Time Series 
 - Reinforcement learning
 - YOLO
 - RCNN
 - Graphical Model
 - MCMC
2. 整理verse里 Oreilly 的东东。
3.

Friday, July 12, 2019

放弃了

topic modeling不是个low hanging fruit
主要原因是evaluation问题
就算有成果也难于验证
而且还要证明自己evaluation的方法
这个opportunity cost 太大

现在走free style 路线,每个礼拜搞些东西来学学。
Pre
Speech to text, text to speech and the recognition API
MSR talk preparation

我感觉我对于
1. Pytorch 和 tensorflow 不熟悉
2. neural network architecture 不太熟悉
    a. reinforcement learning
    b. game theory
3. mathematical model 不太熟悉
3. time series 不太熟悉
4. nlu 里 Q&A, bert and xlnet


没有实战也没有bird eye view

Thursday, July 11, 2019

concrete plan and duxton

今天把topic modeling 的model 搞了一般
我感觉unsupervised 的model 问题是你需要去看,不能自动化的选最好的方法。这也难怪,要是有好topic还会留到现在,需要硬着头皮去试一试。
今天针灸后去了duxton, 这个HDB顶楼要六块钱,不过确实view 很棒。
今天topic modeling 的进度感觉还行,但是不是太快。
我感觉需要一个很solid的plan 来guide这个进度。不能把plan变慢,只能把自己的工作方式和想法变对。该block的还得block。现在一开始慢其实挺正常,因为不熟悉。

如果不是topic modeling, 一个很重要的问题。。有没有supervised 的问题来解决呢?做实验会容易多点。
另外unsupervised evaluation 的话只有persplexity,可以先把这个实现了来试试。 



Paper - topic modeling进行总
Pru - later knowledge catalog call

枯燥乏味无聊

想要完成一件事情,
生活必须得枯燥乏味,然后从中享受宁静的快乐。

可以用各种甜品来填满生活,但是那种快乐是短暂的,而且都有opportunity cost, 会照成stress的。

我发现不管学习,读博,编程等等,执行力强的人总能在很长一段时间枯燥无味,很稳定的去完成这些东西。这种过程中,不急不燥,没有压力,只有无聊枯燥,而且会很宁静产生的快乐。

我感觉这种枯燥乏味,和宁静的快乐,是很有裨益的。
- 心平气和
- 最大生产和长远利益
- 产生具有持久性的快乐
- 和禅定有异趣同工之处

刚刚睡醒的时候,看了一个搞笑视屏,结尾就是个段子:有钱人的快乐往往就是那么的朴实无华,且枯燥。

洗澡的时候想着这个枯燥,想了想和LY及印度distinguished engineer 和合作,总结出了和视频没什么直接关系,但是有意思的invariant:
1. 自己的生活就只干一件事,越枯燥乏味无聊越好;
2. 享受宁静的快乐。

Wednesday, July 10, 2019

收拾

感觉今天是收拾的一天
早上一小时多去找了牙医,照了x光,160 -学了一个牙线技巧。
后面就是在laptop 上装python, so that can work on laptop later on.
再后面就把data导出来了
pytorch的部分还有从新看下

明天任务是
看下pytorch
把 embedding 导出来
不需要的部分comment 掉 (直接用写好的code)
然后看下结果。

今天整体感觉就是在收拾收拾。
明天可以正式启动。


paper - 就是上面的
pru - 和msd聊了一下talk 的requirement, 现在暂定data analytics on nlu.


飞机时间

飞机时间 - 就是在飞机上因为没有网路 所以被逼做一样事情;
但是飞机时间以外,可以做的事情太多了。所以你要问自己 如果飞机时间,你会做什么,你不会做什么。

我感觉现在最重要就是把laptop setup起来,make the work portable
再来就是弄一个飞机环境,按照飞机环境学习。让自己渐渐习惯。

Tuesday, July 9, 2019

马上的好习惯

最近养成了躺在按摩椅上写博客的习惯
昨天回了家里 就懒得写了
其实好习惯很重要
昨天在家没有好习惯 凌晨三点才睡哎

带牙套 绑牙
一开始很纠结
但是一段时间后 就像是身体的一部分 不会去想着他的存在

这就和好习惯一样
开始的时候纠结
比如上了飞机这种 是情非得已
但是在正常生活空间里
老是面对的问题是不 马上 现在 即刻
还有就是不中断的做一件事
这点需要改进

另外昨天回马来西亚是为了找比较好的牙医
第一个牙医感觉比较温柔,但是还是用镜子弄了下我的嘴巴(这点比较粗暴),看了一下,没发现咬合不好,提议4000马币以内。距离近,环境好。但是职员没那么和善。


第二位牙医脾气比较不好(对职员),比较粗暴,把我牙齿弄得好疼。不过他发现了需要洗牙 和需要补牙。这点还是不错。距离远,职员比较和善。


另外,还去找了中医。这个中医很特别,一个住家,各种人来。他就帮我挂了会儿沙,于是就给了我刮痧的,让我自己刮,然后马币30. 这做生意的手法真独特,有点像慈善。外面按摩较低的人好多,感觉大家挺享受的,而且只要马币20,下次必须试试。

记一下,还需要从他那里拿一个刮痧的和油。

另外,paper搞到有点压力。
我现在的策划师
paper - 没结果就顺其自然的explore neural network, 增加阅历,争取一天一个,慢慢增加。这样长远来说比较有用,压力也地点。

再来还要想msd talk 的 topic

Paper - 0 
Pru - 0

Monday, July 8, 2019

military spending


RankCountrySpending
(US$ Bn.)
% of GDP
World total1,8222.1
1United States United States of America649.03.2
2China China[a]250.01.9
3Saudi Arabia Saudi Arabia[a][b]67.68.8
4India India66.52.4
5France France63.82.3
6Russia Russia61.43.9
7United Kingdom United Kingdom50.01.8
8Germany Germany49.51.2
9Japan Japan46.60.9
10South Korea South Korea43.12.6
11Italy Italy27.81.3
12Brazil Brazil27.81.5
13Australia Australia26.71.9
14Canada Canada21.61.3
15Turkey Turkey19.02.5

Military expenditure as a share of government spending

RankCountry% of spending
1 Sudan30.9
2 Saudi Arabia30.4
3 Oman26.3
4 Belarus25.3
5 Congo17.9
6 Singapore17.2
7 Pakistan16.7
8 Algeria16.1
9 Iran15.8
9 Jordan15.8
11 Lebanon15.6
12 Armenia15.5
12 Chad13.8
14 Mali12.7
15 Myanmar12.4
15 South Korea12.1
中国是美国的三分之一,两国加起来全世界一半
亚洲这里除了中国,印度,日本,韩国, 最多。
南美洲巴西最多。
欧洲俄法英德意土,俄法最多。
中东沙地最多。
大洋洲就澳洲最多。
新加坡的~11 billion USD, 17.2% in terms of government spending.
新加坡gdp 350-4 billion USD, ~3.1% in terms of GDP
马来西亚目前将spending 降到3.3 billion USD

国家的强盛,其实除了经济,军事也是strongly correlated。
military spending correlated to geopolitics, economy, current world context, 也说明了别人要欺负你需要的底气。
看着这个列表,觉得挺有意思。