CVPR2010 旧金山游记

Table of Contents

⑥ 五路新朋各天方 ⑥

上午

一夜好眠。

峰早早起床,他的老板费尔南多上午要做演讲,把他们的工作展示出来;爱德华则在练习今天 spotlight的90秒钟。他这次做的是厨房间的特定物体识别,但奇怪的是组委会把他的文章放到了“人脸 识别”这一个session里去了,让他非常郁闷。去年ICCV的时候,我投的文章也被放到了会议最后一天的 “其它”这个session里面。

是不是欺生呢?呵呵。

有了昨天我忘带poster的教训,这次没有人再忘。大家乘地铁来到会场,吃了早餐。有一位中国同学碰 到我,认出我是昨天上台演讲的,连连说这个演讲非常不错。演讲收到效果,我非常高兴,和他聊了几 句,原来他是做光流算法的改进,在光流迭代中加入中值滤波这样的非线性操作,发现效果惊人的好, 把很多20年来发展出来形形色色的方法都比了下去。然后他们找到了能导出这个算法的目标函数,并且 发了文章。能一下子比过所有前人的工作,不容易啊。

sanfransisco/IMG_4905.jpg

聚众看球

早餐期间,有许多人围坐在电视机前,在看世界杯的比赛。几个法国人脸色很糟糕,球队内讧战绩又 差,曾经的世界冠军估计是撑不到小组赛出线了。

早晨session的第一个talk,我特意去Structure from Motion(从运动中重建三维结构)这一个 session,听了J. Taylor的演讲,并和作者见了面。他们用了我们文章的方法得到了图像与图像间密集 点的对应关系,在这些对应关系上他们可以更好地使用他们自己提出的三维重建的方法,得到更漂亮的 结果。看见别人在幻灯片上引用自己的文章,还是很有成就感的啊。

听完这一个talk,我回到另一个session和峰等人会合。峰的老板费尔南多正在上面演讲,介绍他们时域 上人脸表情切分和分类的算法。与一周前他在CMU VASC seminar上的练习相比,这次明显是好多了,语 速变慢不少,咬字也清楚,不再带有浓重的西班牙口音,而且肢体语言丰富,很吸引人。只是表情太严 肃了,不像是做演讲,倒像是在传教-_-||。

难道他事实上也非常紧张么?不过在仅仅一周的准备之后,费尔南多就能做出这样水平的演讲。相比之 下,因为底子不好,我的效率实在是太低了。

费尔南多讲完,作为这个算法的一个应用兼缓和气氛的玩笑,他秀了最后一张很有趣的幻灯片:开会时 一群外国人在认真听讲,峰在低头使用电脑,而威则在一旁睡觉,而他们工作的最终目的,是要把这三 类人给分辨出来。台下大笑,鼓掌。然后观众们开始提问,一连问了五六个问题。峰坐在我旁边,神情 相当紧张,因为这篇文章是他一作,老板二作,若是被人揪出问题,他首当其冲。还好这些问题都比较 好回答,费尔南多以西班牙式的优雅姿态一一解答,峰才松了口气。

我拍了拍他的肩膀,哈哈,过关了!之后的一篇文章是有关三维耳廓重建的,如何通过特定人的二维照 片和一个通用的三维耳廓模型以重建出只属于这个人的模型。为了完成这个任务,他们设计了一种新的 特征以进行图像对齐操作。我想这是因为耳廓也属于人脸的一部分,所以才归到人脸这个session去的吧。

spotlight开始,爱德华同学孤独地站在一群做人脸的人中间,上去介绍他的工作。他明显心情不佳,不 过下午的事实证明,就算是被踢到一个陌生的Session里面去,还是会有很多人会被成果本身所吸引的。

上午第二个oral session,峰去了segmentation and group(图像分割与特征组合),因为他的老板费 尔南多是这个Session的chair,但据我和峰所知,费尔南多从来没有做过这方面的工作,不知道大会是 怎么安排的。在这个Session上我碰到了吉同学和林同学,吉同学刚办完离开宾馆的手续,把行李寄放 好,今天晚上就要走了。记得前天早晨他才刚来,今天晚上便要走,真是来也匆匆去也匆匆。

这个Session的第一个talk,是用动态规划算法去做图像分割。众所周知,动态规划只能做一维的情况, 对于二维的图像,必须把它在纵向或者横向上做切分才能应用这个算法。这篇文章的新意在于如何做切 分,及用一些方法把动态规划下的复杂度进一步降下来。

之后我跳过了第二个talk,和吉同学一起去了另一个Session听复杂场景下的文字检测及识别。这篇文章 效果不错,可使用的特征实在是太过“就事论事”了,就是假定每个字母的笔划是同一宽度的,在局部 计算宽度值,并把具有相同宽度值的像素按连通分量聚起来,在各连通分量上完成检测;并进一步假定 同一行文字的大小固定,从而找到一行文字的位置。这个办法可以说是完全没有一般化的能力,但是因 为效果好,所以就成了oral吧。

搞笑的是演讲者非常自信,在讲到性能比较这一节的时候,不仅强调了自己的办法目前性能最好,还特 地点了第二名,要求他们把代码交出来,实打实地跑一遍验证在文章里报告的结果,其态度简直装逼到 了极至。可是到了下午的poster session,这个演讲者并没有出现,也没有把自己的工作贴成海报,摆 明了不接受别人的提问,让人好生失望。

我们听完回到原来的Session,吉同学对这个方法非常不以为然,他指着会议室的地毯,说“这肯定不 work。”我朝地上一看,地毯图案是由相同宽度的小短线拼起来的,不由得点头。很多年了,计算机视 觉很大程度上还处在沿着“按具体问题设计具体特征”的思路走下去,还是东一锤西一棒,没有统一的 整体框架。

或许这是一条徒费青春的死路,或许再努力几年,就能看到黎明——谁也不知道。

中午

sanfransisco/IMG_4909.jpg

旧金山街头

听完上午的Session,我,吉同学,林同学,峰同学,还有宇同学再一次赶赴chinatown吃午饭。吉同学 强烈推荐一家他曾去过的餐馆。由于记忆有偏差,来来回回走了一些冤枉路还是没有找到,很多人饿 了,提议随便找一家填饱肚子算了,可吉同学一定要找到它。

sanfransisco/IMG_4915.jpg

旧金山街头

sanfransisco/IMG_4917.jpg

中国城里的庙?

sanfransisco/IMG_4923.jpg

中国城

sanfransisco/IMG_4928.jpg

风水

sanfransisco/IMG_4931.jpg

又一个中西合璧的例子

sanfransisco/IMG_4934.jpg

中国城街头

sanfransisco/IMG_4937.jpg

午饭的目的地——文仔记

其间我们路过一副为修葺房屋所搭的脚手架,我特意看了看它的结构,全金属的,接头处都有安全装置 固定,看起来比国内拿竹竿和丝线绑起来要牢靠多了。我们大约找了一个小时才找到这家餐馆,是一家 广式餐厅,口味非常不错,我们不禁为吉同学坚定的心志所折服,之前的牢骚也无影无踪。席间我才得 知峰同学那里得知宇同学刚拿到了UAI的最优论文。原来宇同学竟如此厉害,平时他却总是低调憨厚地 笑,丝毫也没有大牛的架子呢。

大家吃完饭一路赶回会场。我和峰同学讨论明天出游的事宜。因为是周六晚上的红眼航班,明天我们有 整整一日的旅游时间,如何安排是个问题。原则上当然想逛遍旧金山的两所著名的大学——伯克利和斯坦 福,但考虑多日忙碌,明天未必能早早起来,最后商定还是只去斯坦福一所。吉同学本科时曾去过,可 惜他今天晚上就要走,不能当向导了。还好我在斯坦福有两个同学,少不了要叨扰他们接待一下了。

sanfransisco/IMG_4939.jpg

中国城里的学校,更像是以前的私塾。

下午poster session

因为是最后一天的缘故,今天的会议议程特别短,下午只有一个oral session,从下午两点之后就是 poster的时间,一直到晚上五点。我们午饭吃得晚,赶回时第一个talk差不多结束,我想了想,决定干 脆先去贴海报的地方瞧一瞧,乘着人还少,多看一点。

这次的poster session有挺多有意思的东西。很多出人意料地和我的研究方向(非刚性扭曲)相关,只 是归在医学图像处理这一块里面。近年来虽然说美国经济不好,政府给的研究经费在减少,但是有两个 方向的资金仍然是相当充足的,一块是医学,另一块是安全。安全的重要性自不待言,而医学则造福全 人类,因此没有哪个人会极力反对。

在三楼医学图像处理这一块里,我遇见了很多人,有一位佳同学是交大校友,在去年的ICCV就认识的, 今年他又有两篇文章入帐,毕业近在眼前。还有一位也是以前去过微软亚研院实习的同学,现在在南加 州大学做机器学习,我们聊了一会有关流形学习的研究方向。另一位并不认识,是用“Beltremi数”来 建模球面到球面的可微映射,给定球面上三个点的映射关系能唯一确定一个保角映射。而任何的非保角 映射则可以用Beltremi数来唯一刻划。我当时觉得他做的东西很有数学味道,回去查了作者,天啊,原 来他的导师之一是丘成桐-_-|||。还有位极漂亮的中国mm是做医学图像分类的,和我的研究方向一样要 处理图片的非刚性形变,可惜本人过于胆小,没要到联系方式(捶胸顿足状)。

sanfransisco/IMG_4954.jpg

数据集!数据集!

sanfransisco/IMG_4958.jpg

佳同学的poster

sanfransisco/IMG_4959.jpg

poster

sanfransisco/IMG_4960.jpg

峰同学很受欢迎

sanfransisco/IMG_4961.jpg

峰同学很受欢迎2

sanfransisco/IMG_4964.jpg

爱德华同学

sanfransisco/IMG_4971.jpg

吉同学

三楼的另一侧poster是做人脸、表情和物体识别的。峰同学躲在角落里,介绍早晨费尔南多向大家展示 的工作,一堆人围着他在问各种问题,有个土耳其人非常有兴趣,当即询问他们实验室是否招实习生, 还有公司代表问他是不是愿意来实习,把他高兴坏了。爱德华同学也不孤单,虽然被分到这个Session里 面,可仍然有很多人对他的工作感兴趣;吉同学则和他的老板在一起,他做的是显微镜下的细胞跟踪和 计数,用的是CRF。我在那里再一次碰到了林同学。

在底楼,我遇见了另一位交大的学弟阳同学,面前站着好多的人在询问问题。他和我是同一个交大的导 师,只是最近我们的导师忙着系里的教学工作,实在没有空,于是就让他一个人过来了。他做的是如何 有效地抽取图像特征以利检索。图像检索在最近的几年里相当热,我想主要是因为这项技术可以做成产 品,有市场前景吧。另一位北大的由同学已经拿到了cmu robotics master的offer,将要成为我的师 弟,他做的是在大规模数据库检索中如何实现更有效的KD树(任意超平面切分,而非沿着坐标轴切 分。)另一位同学做的是利用information geometry的框架做形状匹配,我看到这个内容觉得很熟,一 看作者,哇,乖乖不得了,原来我以前交大导师的导师赫然在目。

还有很多有趣的poster,就不一一列举了,诸位读者要是有兴趣,可以细品今年CVPR的文章。

晚饭

五点半,人群渐渐散了。这一年一度的视觉盛会,到今天为止,其主会议也就结束。回味起来,好像挺 平淡的呢,不停地看文章,不停地听报告,就在忙碌中划了句号。我在会场找到了若干同学,大家商议 一下一起去找个地方吃饭。有人说网上推荐过中国城一个叫“晴天酒楼”的所在,一行十人都表示没有 异议,就出发了。

林同学晚上要开车回实习的地方,于是我随她去拿车。可能正是周五晚上的缘故,我们开到晴天酒楼, 附近几条街都密密麻麻停满了,我们整整花了十多分钟才找到一个车位,待要停进去时,又被人用巧妙 的手段抢了先,只得再找。饿到饥肠辘辘才停完车,我不禁感叹,身在大城市还是不买车的好。

sanfransisco/IMG_4980.jpg

琳琅满目的折纸

sanfransisco/IMG_4984.jpg

擎天一柱

sanfransisco/IMG_4983.jpg

好吃!好吃!

我们找到酒楼,仰头一看,原来不叫“晴天酒楼”,而叫“擎天酒楼”,哈哈,之前的温和闲适的心 情,突然间扭成昂扬激烈,还一时有些不适应呢。一进酒楼,便看见“擎天一柱”四个阳刚大字,上了 二楼,一桌人已经开吃了,里面有中午才见过的宇同学,下午碰到的佳同学,还有在国内非常有名的嵘 同学和他的导师,这两年可谓文章无数;还有几位从附近公司跑来开会的台湾同胞。饭桌上大家终于用 不着一本正经说英语,于是畅所欲言谈天说地,分明是新交的朋友,却如多年的老友,一直聊到晚上九 点多才打住了。吃完了美味末了结帐,十人竟然只花费一百块出头一点,确实是经济实惠。在此我强烈 推荐。

出了酒楼,外面已是冷风嗖嗖,吹得一众短袖猝不及防,连连叫苦。旧金山就是这样的气候,白天热, 早晚冷,可惜林同学的车毕竟小,载不了那么多人,大家又都不好意思抢车,于是彼此告别,道声珍 重,都自己走回去了。

这一别,也不知何时再能相见。

回头见擎天酒楼的招牌,已隐在都市众多霓虹之中了。我和峰同学上了林同学的车,一路回到宾馆。我 从林同学的车上下来,挥一挥手,看着她的车开远,忽然有一种苍凉的伤感。

人生么,大概就是这样的。

沿街的路灯亮着,两个人顶着寒风回到旅馆,我打了电话给我在斯坦福的同学,约好了明天下午见面。 按理说明天仍然有Workshop可以去听,不过好不容易来加州一次公费旅游,还是乘着最后一天待在这里 的日子,去欣赏一下吧。

Author: Yuandong Tian

Date: 2010-08-31 14:05:52

HTML generated by org-mode 6.36 in emacs 23