Archive

Archive for July, 2011

学校荷塘里的猎食

新搬来的这个暂住两个月的北京哥们喜欢自己做饭,家里厨房堆满了各种做饭的家伙,自然就没有我发挥的空间了,不想麻烦去自己弄饭,索性就到学校食堂吃饭,省事儿。周六食堂空荡荡,没有几个人在11点半这个点吃饭,因为人少,打饭的也都换成了新手,一边的老师傅教导着他们如何打饭打菜。一天两顿饭解决后,在下山到大学地铁站的路上,看到了这一幕:

  

这是学校山下的一个荷塘,一只栖息在这个荷塘附近的大鸟竟然从水里叼起了一只青蛙。就在这时,我旁边一位在这拍风景照片的女生看到这一幕后,跑到一边的草丛中捡起了一颗小石头,赶紧跑过来朝这位猎食者扔去,结果猎食者丝毫没有放弃的意思,竟然叼着青蛙飞走了。。。

Categories: Gallery, Jotting Tags: , , , ,

中国老奶奶和美国老太太

2011-07-14 1 comment

中国老奶奶和美国老太太的故事想必大家都熟知,就是中国老奶奶一辈子省吃俭用攒了一辈子的钱,到最后来人死掉了钱没花完;美国老太太年轻的时候从银行贷款,不愁吃穿,享受生活,到老的时候用挣到的钱还上了贷款。这就是典型的两种消费观或者是价值观,从我身边的人来看,发现更多的是“中国老奶奶”。一个主要原因是实验室的好几个师兄都是已经结婚生了小孩的,我不了解实际情况,按照一般中国传统,女的没有男的挣得多,男的挣钱得用于养家养老人养小孩的假设来看,他们的实际生活水品应该是等于他们实际收入水品除以一个数了,这个数的大小得看个人情况;与之相反的是,实验室未婚无子女的成员生活水品相对要高很多,但是仍然低于他们的实际收入水品,因为其中不乏“中国老奶奶”。虽然我非常赞同“美国老太太”的生存方式,但是从小生长在这种传统环境下的我更欣赏勤俭节约的生活。这种看似是“中国老奶奶”式的勤俭节约生活不应该源自于压力,而应该源自于内心崇尚。但是现实中很多“中国老奶奶”他们这么勤俭节约地生活都是源自于生活压力,他们分别称为了现今的房奴,车奴,孩奴等等。昨天跟乐乐电话,她说,上重点大学,到香港留学,好好做人,努力工作都没办法过上有层次点儿的生活的话,那这个国家的物质分配到底是肿么了。但是我看到身边的这些师兄们,觉得他们的生活水品也没有很好,我仔细想了想,竟然得出一个让自己都害怕的结论,那就是中国的多人口环境+中国式的婚姻导致这样的情况。中国人口众多,资源分配当然会很少且不均匀;中国式的婚姻跟美国不同,美国式的婚姻是两个人的结合,而中国式的婚姻是两个家庭的结合。由于人多资源少,家境贫寒、资源匮乏的家庭占全中国所有家庭的大多数,婚姻在两个家庭结合之初,给了年轻一代的人越来越大的压力,再加上现今通货膨胀的添油加醋,物价房价飞涨,能够独立承受起这一切的年轻人太少了,出现了最近兴起的裸婚时代的原因也正是因为如此。。。。。累鸟,不想写了,“中国老奶奶”要睡觉了。。。。。

Categories: Jotting

统计学习那些事[zz]

统计学习那些事

香港科技大学 电子与计算机工程系 eeyangc@gmail.com

在港科大拿到PhD,做的是Bioinformatics方面的东西。Bioinformatics这个领域很乱,从业者水平参差不齐,但随着相关技术(比如Microarray, Genotyping)的进步,这个领域一直风风光光。因为我本科是学计算机电子技术方面的,对这些技术本身并没有多大的兴趣,支持我一路走过来的一个重要原因是我感受到统计学习(Statistical learning)的魅力。正如本科时代看过的一本网络小说《悟空传》所写的:“你不觉得天边的晚霞很美吗?只有看着她,我才能坚持向西走。”

离校前闲来无事,觉得应该把自己的一些感受写下来,和更多的爱好者分享。

先介绍一下我是如何发现这个领域的。我本科学自动化,大四时接触到一点智能控制的东西,比如模糊系统,神经网络。研究生阶段除了做点小硬件和小软件,主要的时间花在研究模糊系统上。一个偶然的机会,发现了王立新老师的《模糊系统与模糊控制教材》。我至今依然认为这是有关模糊系统的最好的书,逻辑性非常强。它解答了我当年的很多困惑,然而真正令我心潮澎湃的是这本书的序言,读起来有一种“飞”的感觉。后来我终于有机会来到港科大,成为立新老师的PhD学生,时长一年半(因为立新老师离开港科大投身产业界了)。立新老师对我的指导很少,总结起来可能就一句话:“你应该去看一下Breiman 和Friedman的文章。”立新老师在我心目中的位置是高高在上的,于是我就忠实地执行了他的话。那一年半的时间里,我几乎把他们的文章看了好几遍。开始不怎么懂,后来才慢慢懂了,甚至有些痴迷。于是,我把与他们经常合作的一些学者的大部分文章也拿来看了,当时很傻很天真,就是瞎看,后来才知道他们的鼎鼎大名,Hastie, Tibshirani, Efron等。文章看得差不多了,就反复看他们的那本书“The Elements of Statistical learning”(以下简称ESL)。说实话,不容易看明白,也没有人指导,我只好把文章和书一起反复看,就这样来来回回折腾。比如为看懂Efron的“Least angle regression”,我一个人前前后后折腾了一年时间(个人资质太差)。当时国内还有人翻译了这本书(2006年),把名字翻译为“统计学习基础”。我的神啦,这也叫“基础”!还要不要人学啊!难道绝世武功真的要练三五十年?其实正确的翻译应该叫“精要”。在我看来,这本书所记载的是绝世武功的要义,强调的是整体的理解,联系和把握,绝世武功的细节在他们的文章里。

由于篇幅有限,我就以Lasso和Boosting为主线讲讲自己的体会。故事还得从90年代说起。我觉得90年代是这个领域发展的一个黄金年代,因为两种绝世武功都在这个时候横空出世,他们是SVM和Boosted Trees。

Read more…