CVPR2010 旧金山游记

Table of Contents

③ 六人豪享海鲜宴 ③

早晨

这一觉睡得可真好。早晨起来已是六点半,相当于匹兹堡时间的九点半了。众人洗漱完毕大清早出门, 七点多些直奔会场。今天主要还是Workshop和Tutorial,但可看的内容相比昨天要多些。我和爱德华经 过一番讨论,决定先去structured models in computer vision(“计算机视觉中的结构式预测?”) 这个workshop。虽然graphical model(图模型)大家都知道对于计算机视觉的效果不如在其它领域的应 用效果好,但它毕竟是一种非常重要的通用建模手段,值得学习。峰同学则打算先去听Learning Multi-subspaces的workshop。

sanfransisco/IMG_4706.jpg

Workshop

会场提供免费早饭,早饭并不好吃,不过是硬得很的面包圈夹些黄油和果酱,只能用来填饱肚子。在早 饭时间可以和其它教授或是学生闲聊,或者围坐在电视前看世界杯的比赛。不过要和完全陌生的人聊起 来的确有难度,不知不觉间我们就同几个以前认识的朋友聚在一起了。这确是件挺麻烦的事情,并非是 因为英语不过关,而是出于某种本能的保护性心理,愿意和自己熟悉的东西打交道。

得要慢慢来吧。

sanfransisco/IMG_4714.jpg

会场

sanfransisco/IMG_4715.jpg

会场,某位同学在张望啥呢?

吃过早饭,我和爱德华来到workshop的会场,坐在前几排。workshop的presentation一般有两种,一种 是invited talk,即请该领域的名人过来做演讲,另一种是workshop的文章接受成为oral而上台演讲。 两者的时间限制都比正式会议要宽松不少,前者可以讲一个小时,后者也有25分钟,完全可以说得从从 容容。这次的第一个presentation是invited talk,是关于结构模型的适用范围的,非常非常不错,可 以说是我在这次会议上听到的最好的talk之一。它总结了结构模型在视觉很多领域的应用和进展,尤其 在pedestrian detection(行人检测)及human pose estimation(人体姿态估计)的两个子领域内,它 将结构模型的优缺点及适用范围以明确的语气说了出来:

有效的:

  • star/tree structured models
  • use of margin-based discriminative learning techniques for parts.
  • part detection on densely sampled grid in the images.

不怎么有效的:

  • contextual information
  • object categories with less regular spatial structure, like cat, dog and birds
  • not very good in handling large numbers of categories.

(这里翻成中文实在太别扭了,不如保留英语吧。)从这些条目可以发现,结构模型仍然严重依赖于部 分检测器的准确性,仍然只能应用于简单的,变形不很大的结构如人体;模型本身也不能太复杂,树状 或者星状的结构兼顾性能和复杂度,是最实用的。本质上来说,这个模型还只是十年前就做出来的可变 形模板(Deformable Template),除了使用了新的优化方案(MRF对之,并没有本质的突破。

计算机视觉,毕竟还是太难了。

之所以说我很喜欢这个talk,是因为这个talk以务实的态度把现状告诉了大家。以上列出的条款很大程 度上是在打自己耳光,说大家在这个领域做了很多年可事实上没什么大的进展,然而毕竟还是把现状说 了,比很多只炒概念但事实上在原地踏步的talk要强。

另外,演讲者话音响亮,条理清晰,PPT也做的很不错,直接能让人集中精神去听。像我这样的学生,不 一定能做出有高技术含量很大影响的工作,但是努力传播自己的工作还是可以做到的。昨天早晨的 workshop有一个极坏的talk,演讲人没有整理好PPT,内容组织存在极大的问题,公式列了一大堆,演讲 稿也没有经过排练,上句不接下句,发音又模糊。这些因素直接导致场下所有人都在干自己的事情,没 人理他。演讲的功夫不仅白费,还带来了负面效果。

听完了这个talk,峰从另一个workshop赶来。之后上台的下一个演讲者马上就说context是work的,因为 她做的正是利用context来改变物体识别的性能,台下众人不禁莞尔。接下来的talk是使用结构模型来做 场景切分,遮挡检测,形状匹配,动作分类等应用。其中有人提到了一个叫curriculum learning的东 西,是通过给样本加权来克服分类器训练过程中的局部极小值问题的,据说效果非常不错,有兴趣的读 者可以了解一下。

午饭

我们继续听完接下来的内容,就到了中午时分。我、峰和爱德华在出口处遇到了cmu机器人系的一年级学 生,也是一个印度mm叫娜塔莎,还有来自斯坦福大学的另一个读硕士的印度男生。娜塔莎同学的研究方 向也是计算机视觉,今年并没有文章发表,但她的巴基斯坦老板仍然全额出资,让她过来开会了解最新 动态。都说印度和巴基斯坦不和,经常打仗,然而老板究竟对学生怎样,还要看心性人品,及所处环境 吧。

sanfransisco/IMG_4723.jpg

美国国旗和加州州旗,奇怪的是,州旗上写的是“加州共和国”的字样。

sanfransisco/IMG_4721.jpg

中国城一角

五人出了Haytt宾馆,有人提议去中国城吃饭,因为那里比较便宜,两位印度人也并无异议。于是便向着 中国城进发。走到中国城,众人看着诸多招牌就迷了眼,不知道应该去哪家为好。关键时刻娜塔莎同学 手上的iphone 3GS发挥了作用,定位了我们当前的位置,并且找到了一家网上评价还不错的地方。

sanfransisco/IMG_4724.jpg

街道

然后,郁闷就开始了。这家中国饭馆门面很小,里面是三层阁楼,正是吃饭时间挤满了人。我们被引向 三层楼的一张小桌,五个人围坐非常拥挤,尤其是那位体型硕大的印度男生,颇为不爽。饭馆的服务员 只有一位中年妇女,一直跑上跑下忙碌不停,时而发餐具,时而给菜单,时而上菜,时而收帐。我们等 了好半天才拿到菜单,等到每人决定,又是枯等十多分钟才登记点菜,至于上菜,那更是遥遥无期。可 怜两位印度同学,尽管饥肠辘辘,可嘴上还要装得很客气很有修养,说要体会中国风情。

总算等到上菜的一刻,却缺了印度男生的一碗白饭,我们只得用中文吆喝才拉了服务员把白饭送到。菜 的味道尚可,然而心情已经大坏。众人草草吃完,下去一楼结账。在一楼正撞见饭馆老板苦着脸对着那 唯一的服务员,一旁的厨师脸色也很差,听他们的对话,说是刚才有一桌吃完了就直接走了竟没有付 账,见我们下来,服务员忙不迭把我们拦住算帐。她手上竟没有计算器的,直接拿出一张小纸,用笔算 得出结果,五个人连小费只要$30,是我们在旧金山吃过的最便宜的一次了。

出了饭馆的门,大家都松了口气。刚才的情景实在让人叹为观止,这家店估计是一家人自己开的,完全 没有管理制度,虽然看起来几个人都忙得要死,但效率和客户体验都非常糟糕。两位印度同学仍然很客 气,说菜肴味道上佳,然而几个中国人都是心中有数的。

下次可不能盲信网上的评价了。

下午

一番赶路我们回到会场,继续听报告。麻省理工教授Antorio上台介绍他们开发的一个新的数据集SUN。 这个数据集侧重于建模context,同张照片里有更多的物体互动,看来接下来又会有成编制的有关物体和 场景分类的文章发表出来,然而这样做下去,计算机视觉走到哪里才算个头呢?很多基本的问题都还没 有解决呢。

sanfransisco/IMG_4732.jpg

SUN数据集

不过这不是我们这样的小卒能考虑的问题吧。换个角度说,如果想要做教授立足学术圈,这样的策略是 正确的,与其啃硬骨头闭关十年承担风险,不如自己挖坑或找别人挖的大坑往里跳,才能保证稳定的 “攻击输出”,为自己将来的升职铺平道路。至于有没有突破,那要看全人类的运气;只要还有一群人 从事这个方向,那总是有希望的。

大概就是如此吧。

又听了一阵,下午休息的时候,我们转换阵地去听sparse coding(稀疏编码),这是一个更偏机器学习 的方向,其核心是矩阵分解:通过把数据矩阵分解成两个低秩的矩阵乘积来揭示数据的内在结构,分解 往往不唯一,因此需要放一些附加约束进去,比如说系数的稀疏性条件。我们路上看见有个小间里挤满 了人,一看门口的指示牌,原来是在讲如何在计算机视觉领域创业,开自己的公司。

sanfransisco/IMG_4741.jpg

Sparse Coding的核心就是这个优化式。

回到Sparsed coding,这个讲座我们主要听了一个入门指导,即给定字典(或者说基向量),如何通过 贪心法或L1优化或正则路径得到基上的稀疏系数,及在大量数据集的情况下,如何用随机算法做在线的 字典学习且保证最优性,都是很有意思且很实用的东西。下午快四点的时候,昌同学突然出现,我随即 弃了接下来的Discriminative dictionary learning(“区分性字典学习”?)的讲座,出来和他闲聊。

闲聊

昌同学论辈份要算我的师叔,因为他的老板是我老板的老板-_-。他和我一样都在微软亚洲研究院 (MSRA)做过实习,现在他做的东西更偏硬件偏物理,时常以极简单的物理器件组合,做出最高级的视觉 算法都无法达到的精度和效果,令人叹为观止,大呼牛逼。明天正式开会他有一个oral presentation, 为此从微软总部赶来。我们刚出门又碰上了MSRA的研究员Yasu,三人聊了一阵。昌同学谈及今天的一个 非常精彩的Tutorial,是讨论计算机视觉算法在复原绘画及鉴定真伪上的应用。因为不同时期的画家会 采用不同的颜料,从而有不同的反光特性;同一门派因为师承关系也会用相同的构图技巧和绘画方式, 根据这些,就可以判断一幅画作的年代和真伪,相当有意思。

快五点时,Yasu告别,昌同学也要和其它人一起吃饭。爱德华今天要和我们系的某位已工作的硕士一起 去吃某些高级货色,我觉得昨天已经花掉了$50,今天若再不节制花费恐怕超标,犹豫着就不去了。我找 到峰和威,还有两位学弟沐和晨,又碰到了来自香港的开朗随和的羽同学。六个人讨论了一番,决定去 渔人码头见识一番。

海鲜

我们出了Hyatt宾馆的门,搭乘F线公交车向渔人码头开进。晨同学昨天没能成功拿下iPad,今天中午特 地又去了一次,可惜被告知没有现货,就算现在预订也一周以后才能拿到,但过两天他就走了,于是只 好作罢。众人心头稍觉遗憾,然而一下车,这点小小的负面情绪就随即被海风吹散。

sanfransisco/IMG_4755.jpg

F线上的乘客

sanfransisco/IMG_4757.jpg

渔人码头

sanfransisco/IMG_4758.jpg

渔人码头

sanfransisco/IMG_4760.jpg

诱人的水果,可惜太贵拉。

果然是好地方。

渔人码头不仅仅是个靠船的码头,而是观光吃饭购物一条龙商业街。我们一路走去,路边摆有水果摊 位,各式新鲜水果极为诱人,然而价格不菲;还有各种小吃,大多和海鲜有关。时候尚早,我们径直去 了码头观赏风景,看见海狮成群地趴在码头上晒太阳,不时叫唤两声,闲懒有加。虽然是周一工作日, 但码头上仍然有很多游客,很多金发小男孩小女孩特别可爱,让某位萝莉控看得心跳不已。

sanfransisco/IMG_4764.jpg

停泊着的游船

sanfransisco/IMG_4767.jpg

以佛教为主题的商店,很有特色,enlightment应该翻译成“启蒙”还是“顿悟”呢?

sanfransisco/IMG_4768.jpg

小型游乐场

sanfransisco/IMG_4770.jpg

著名的海狮

sanfransisco/IMG_4772.jpg

著名的海狮

sanfransisco/IMG_4786.jpg

破风追云

sanfransisco/IMG_4790.jpg

游船

sanfransisco/IMG_4797.jpg

六人合影

sanfransisco/IMG_4798.jpg

羊驼制品店,门口一硕大的羊驼画像。看起来挺温顺的动物,竟被冠以“神兽”之名。

sanfransisco/IMG_4801.jpg

这路牌让我们上了贼船

大家逛累了,打算找个地方吃饭。看到一家吃蟹的地方叫Crabhome,于是就进去了。别看外面其貌不 扬,可里面装饰精美,像一艘豪华油轮的内部,我们六人刚进了门,就有点畏缩不前了,可最后还是投 降给了食欲,外加一点点好奇和不甘心。

sanfransisco/IMG_4802.jpg

Crab home

大家要了菜谱,大眼一瞧,才知上了贼船,不扒层皮下来是休想回去了,于是只好硬着头皮点菜。既然 是以蟹闻名,那当然得上一盘大的喽,于是六人讨论一番,狠一狠心,要了个最大份的:六又二分之一 磅,价格是$100。除此之外,我,沐和晨还点了些面条充饥,为什么点面条?因为这是菜单里最便宜的。

sanfransisco/IMG_4809.jpg

餐桌

sanfransisco/IMG_4807.jpg

吃蟹工具。

这里果然是高档次的餐馆,盛水的壶是锡制的带有古希腊风范,还有服务员亲自帮忙穿上吃饭套装以防 油水污身,每人还发一套专用的吃蟹工具,可惜我们不知道该怎么用。

sanfransisco/IMG_4810.jpg

大盘蟹。

面条先上,然后等了一阵,终于一大盘蟹送了上来,见尺寸比国内大了一倍不止,其形状也与国内不同。 大家见了颇为新奇,都拿出相机拍照留念。尔后,迫不及待地开吃。蟹经过适度油炸,以铁盘盛上,都 是蟹腿,没有国内吃蟹受欢迎的蟹黄部分。剥开蟹壳,里面的蟹肉粒大饱满,一口吃下,大呼过瘾。不 一会儿,整盘蟹就被消灭干净。吃完结帐,连小费人均花掉$30+,与昨天相比又多了不少。

sanfransisco/IMG_4812.jpg

华灯街景

sanfransisco/IMG_4814.jpg

华灯街景

吃完饭,为了消化多余的脂肪,大家决定走回去。一路上众人闲聊,我、峰、沐、晨都来自上海交大同 一个实验室,言语之中,自然便谈及实验室近况。沐虽为学术男,但于八卦一道也颇为精通,说道实验 室里有两对姐弟恋已然大功告成,快要结婚了。待报上名姓,我和峰都大吃一惊,想不到此两人平日行 事低调,不善言辞,可动起手来却如此快法,且年龄差距如此之大。两人左思右想不知所以,只得叹道 是自己忙于学术,太过单纯了。

谈及国内的学术气氛,沐和晨都有些唉声叹气。有一次实验室的博士大师兄去主办一个会议,接收了六 十多篇poster,可只有三十多篇在会场里真正贴了海报,并且质量普遍很差,甚至有的只把文章一页一 页地打印出来贴满了事。大师兄是有追求有理想的,想要真正做些东西出来,可面对这样的环境,时常 一个人呆愣愁思。这次沐和晨都要申请国外的PhD,也是想能出来闯荡,做一番非常事业。

在此祝他们申请顺利。

sanfransisco/IMG_4816.jpg

宾馆房间

足足走了近一个小时,我和峰才回到宾馆。我还是不放心,又将演讲重温了一遍,才上床睡觉。

明天,是会议正式开始的一天,78篇oral,383篇poster将陆续上演。

【六人豪享海鲜宴 完】

Author: Yuandong Tian

Date: 2010-06-29 11:29:53

HTML generated by org-mode 6.36 in emacs 23