CVPR2010 旧金山游记

Table of Contents

⑤ 三尺高台歌声扬 ⑤

准备

六月十六日,端午节,早晨六点。

我已经睡不着了,从床上起身,轻轻拨开落地窗的窗帘。窗外已经大亮,然而没有什么活气,压抑的高 楼,萧索的街道,零落的车辆,一派阴冷。仅仅几秒钟,我已然从这平常单调的景色里嗅到了紧张而不 安的气味了,便把窗帘重又拉上,把阴白色的毫无表情的光挡在外面。

似乎躲在黑暗里,更能感到些平静吧。

我去洗手间刷牙洗脸。大概是声响惊动了别人,峰,威和爱德华都陆续起床。我从洗手间出来的时候, 峰问我是不是昨天没有睡好,我摇摇头——其实竟然是睡得不错,十一点躺下,五点五十九分醒来,并没 有怎么胡思乱想。

六点半,打开笔记本电脑,一眼撞见的又是看过无数遍的幻灯片和讲稿。我导师曾说过在演讲的当天早 晨一定要再练一遍,然后才能上台。我觉得这主意不错,但是在这之前,我想要做些别的事情——

想像。

想像豪壮,酷烈,如大江千丈奔流,纵万人阻挡,无止其步,无挫其锋;

想像从容,淡泊,如瀚海百里波蓝,纵斗转星移,不移其色,不改其容。

于是热血便起来了,起来了——六点五十,最后一遍练习,不能看幻灯片,要对着空白的落地窗,记得窗 后,就是千人会场。我的速度控制得可以,音量也不小,旁若无人地完成了最后一次练习。三人在一旁 静静听着,都没有说话,等着我把十五分钟的演讲练完,然后四人出门。

旧金山的早晨还是那样的冷。我们披上外套,下了地铁口,上了班车。我不知道那时我的表情是怎样 的,或许是严肃认真一言不发,或许是反常地多话,poster还在宾馆,我忘记拿了。五分钟后,我们来 到Hyatt宾馆。去地下一层吃完早饭,我小别三位同学,自己乘自动扶梯去演讲大厅做前期准备。迎面正 碰上昨天一早刚见过的那位年轻的助理教授。他笑着招呼道:“你导师正在找你呢。”

我心里一惊,上到一楼,正看见我导师在拨电话号码。他见到我,掐了电话,招了招手,我走到他跟 前,问道:“你找我?”

“是啊,你说我还能找谁?”他回答道。

sanfransisco/IMG_4883.jpg

演讲前,技术人员正忙碌着。

两人相视一笑,进了演讲大厅。老板问我昨夜是否睡好,我点点头。此时是七点五十。几个工作人员正 在演讲台上忙碌着准备,我是第一个到的演讲者。我沉下一口气,上台主动要求试机。笔记本电脑插上 去之后,大屏幕投影仪有些问题,字体变形,三原色里的绿色显示不出来,后来换了一条电缆,改了分 辨率才好。这本是日常做演讲都会发生的事情,只是这回的调试,显得格外有些漫长。调试完毕,我站 在讲台上,说了几声“喂”,见话筒反应良好,就想下台。

老板摇摇手,说道:“你把第一张幻灯片试讲一下。”

第一张幻灯片是标题,并没什么内容。我照着他的话,试讲了两句,突然发现藏在心底的紧张跳起来 了——说话又开始变快,含糊不清,音量也不够大。

“把声音放大些,慢一点。”

我又试了一遍,这一回比刚才好多了,控制住了节奏。又有一个演讲人出现了,他是一位和我差不多年 纪的韩国小伙子,抱着电脑走过来,脸上毫无表情,我把投影仪的线塞给他试机,一切无错。两人同时 坐回第一排休息。CVPR每一个session都是如此安排的,所有要上台的人都坐在第一至第二排,其中四位 oral的演讲人更是一马当先。

我老板见一切顺利,最后叮嘱我到时候正式上台的时候,笔记本电脑的电源一定要接上以防断电,便走 了。我们两个坐在第一排等候,他是第一个演讲者,我则是第二个。我们聊了两句,他是国立首尔大学 的博士生,是做复杂场景下物体跟踪的。我主动问他要不要帮他照相,他同意了,也没有高兴,也没有 感谢的表情。他的老板来了,拍拍他的肩膀,说了几句韩文,他只是一个劲地点头,一句话也没有说。

也许,他也是第一次上台吧。

不得不承认,我主动要求给他拍照,其实是为了在他第一个上台讲的时候,我能有事可做,不至于过分 紧张。不一会儿又一位演讲人出现了。他是中国人,以前竟然也是上海交大毕业的,现在在香港。几句 简短的交流之后,我惊讶地发现他就是我的某位硕士同学一直在嘴上念叨着的牛师兄,一直无缘得见, 想不到竟会在这里相遇。时光荏苒,我同学已经工作去了,我们还在继续着研究事业。最后一位演讲人 则到开场前十分钟才出现,他来自瑞士苏黎世理工学院(ETH Zurich),一到场就和其它三人热情地打招 呼,一点也不显拘谨之色,问了两句,原来他已经做过很多次类似的演讲了,兼之性格外向,因此毫不 在意。

过了八点二十,人渐渐多了起来,整个大厅都坐满了,还有人在出入口站着的。这一场的主席(session chair)到了,很热情亲切地给所有的演讲者打招呼,并且问起各是第几作者及名字的读音。我们一一报 了,他边听边在小册子上注明,以便在正式会议介绍每位演讲者时,能正确地发音。我刚报完自己的名 字,沐师弟就来了,他笑嘻嘻地坐在我身后,拿着炮筒般的单反相机,准备在我演讲时为我拍照。他在 这个session里有一篇poster,预备在之后的spotlight上做90秒的演讲。他做的东西比较特别,很有机 器学习的味道,一眼就能在众多文章名里找到。我和他聊了几句,警告他说不许拍猥琐照。沐师弟嘿嘿 一笑,一副“相机在我手里,你还能管得着么?”的表情。

啊,很让人担心啊。

上台

开始了。

主席说了几句简短的开场白,宣布这个session开始,及介绍第一位主讲人。然后韩国小伙便端着他的 Macbook Air上台。我架起相机,不停地按动快门,给他拍照,至于他在讲什么,我一句都没有听见。

十五分钟是很长的。

主席在一旁一直看着表计时,我放下相机,也不时斜眼瞥着主席。小伙讲了快到十七分钟的时候才停下 来,观众热烈鼓掌,有人举手,走到中间走廊里摆着的话筒前,开始提问。我向主席看了一眼,带着笔 记本和电源,低头猫腰,轻轻地上台,挪到韩国小伙身边,伏下身把电源线和投影仪线连好。一分钟后 提问结束,观众又一次的鼓掌,韩国小伙拿起他的笔记本,一脸疲惫而又轻松地下了讲台。我打开笔记 本,抬起头,走到他刚才在的位置上。

深深地吸一口气。

一口气。

“Good Morning Everyone, My name is Yuandong Tian……”

sanfransisco/IMG_2974.jpg

上台演讲

sanfransisco/IMG_2975.jpg

上台演讲

要自信,要大声,要响亮——要让所有的人都听见,我在做些什么。之后的十五分钟,我基本上已经忘记 自己讲了些什么了,只是把记忆里的东西翻出来大声地说,一个词一个词地说。记得最清楚的,是第五 张幻灯片没有照着剧本,一时脱线了还好又拉回来;在阐述本文的贡献时说话特别慢特别响亮,几乎是 为了证明什么似地在吼叫;在放第一个视频的时候两秒钟之内它没有动起来,把我吓得半死;最后两张 幻灯片时主席在台下示意时间快到,让我的语速一下子变快。啊,还有,我的眼睛自始至终一直看着天 花板,因为那里有最耐心最和谐的观众,从不嘲笑,从不离席。

大约只有这些记忆留下来了吧。

或许是因为我之前的韩国小伙用掉了太多的时间,给我的问题只有一个,并且是很容易就能回答的。当 我下了讲台,我不由得暗自庆幸自己的好运气;其实后来才发现,我的运气比这还好——

我发现自己忘记关手机了。

要是老板知道了这事,一定会杀了我的吧。下次再要上台,可千万不能犯这样的错误了。

我捧着电脑下台之后便轻松了,连续听完第三位和第四位演讲人的报告。瑞士同学做的是利用物体周围 的信息(称作supporter)来跟踪物体,其想法和利用context来做物体识别异曲同工。而我师兄做的则 是利用高分辨性的特征来做种子,用高级的优化算法(QPBO)以改进光流(optical flow)估计的精度, 从而解决遮挡及阴影的问题。而韩国小伙做的,据我事后了解,是用稀疏子空间模型加上改进的粒子滤 波来做复杂场景下的人体跟踪。

sanfransisco/IMG_4888.jpg

沐师弟

这个session结束之后,我惬意地走出演讲大厅,老板笑着出现了,他拍了拍我的肩膀,连声称赞说讲得 不错,只是声音实在是太大了,比扯开喉咙吼差不了多少,前几排的人可能会听得刺耳。然而他还是肯 定地说:“声音大总比声音小好,最后一排都能听得清清楚楚,演讲的目的就达到了。”最后,他提及 了一个细节,那就是在演讲完之后,我在讲台上大大地舒了口气,全场都目睹了——可是我自己却一点都 不记得了。

这就叫当局者迷吧。

午饭

上午的第二个session,我和沐师弟去听了low-level vision。这一块主要讲的是图像去噪和稀疏编码。 第一个演讲是有关贝叶斯框架下图像去噪,研究什么样的梯度先验和目标函数能得到更好的结果。第二 篇是研究如何在流形上使用mean-shift去噪,其解决方案就是估计流形的局部切空间,在垂直于切空间 的方向上收缩,这样便不会破坏流形的结构。第三个演讲是三菱研究所的,他们做的比较工程,是用 compressed sensing以减少测量的次数,用最高的效率来三维重建大脑结构。

听完这个session,我和沐师弟一起走出演讲大厅,虽说中午因为TC meeting的缘故有免费午餐供应,但 是见那么多人在会场外排队,我们便没有兴趣了,打算出去搓一顿。沐师弟打电话给久违的娟师姐,她 又拉了自己的老板及其它两位在加州实习的朋友。娟师姐是以前同在微软亚洲研究院(MSRA)实习的同 事,现在在德州某大学做助理教授,和沐师弟关系很铁。一行六人去一家泰国餐馆吃饭,昨日午饭时遭 受牡蛎沉重打击的我,又开始担心自己填不饱的肚子。不过事实证明这泰国餐馆是非常公道的,平均下 来一人十四块钱一份餐,可以吃到很多东西。

sanfransisco/IMG_4892.jpg

泰国餐馆的大餐

sanfransisco/IMG_4890.jpg

娟师姐和她老板

席间众人闲聊,两位加州的实习生都在公司里实习,这次前来参加会议,主要是想了解当前计算机视觉 的走向。娟师姐谈及自己的助理教授职位,抱怨工作辛苦,因为学生不多,很多时候自己还是要像个学 生一样干活完成项目,写文章,申基金,全要自己完成。我依稀记得几年以前在北京,还是和沐师弟娟 师姐一起在微软亚研院一旁的饺子馆吃饭,师姐戴着一只戒指不时地转啊转,说是这样便可以让自己转 运;两年后的她终于当上教授了,又想要更好的生活呢——啊,当然了,当然了,工作总是很辛苦的。

sanfransisco/IMG_4893.jpg

会场外

吃完饭,我们顺路去拍了些照片。加州阳光名不虚传,来这里四五天了,天天都是晴的。我们回来之 后,见TC meeting仍在召开中,就去听了一下。TC meeting就是会议委员会讨论下一届会议的各项事 宜,但任何与会者都可以参加,并且可以参与举手表决。去年的ICCV讨论的主题是2013年的ICCV要在哪 里举办,结果大部分与会者(我也算一个吧)都选择了悉尼而非费城,是不是因为大家都想要去出国玩 呢?这次我们听到的议题有,下一届会议需不需要从三天延至四天,是采用双轨制还是三轨制等等,然 而表决结果是五五开,因此便留待委员会在不久的将来作最后决定。

sanfransisco/IMG_4894.jpg

TC meeting

开完了会议,下午的session接着就开始了。我则把一身行头托给沐师弟,自己匆匆赶回旅馆。因为早晨 过于专注及紧张,晚上要用的poster忘在旅馆,只得回去拿。

下午

半小时后,我带着poster返回原来的会场,却已经找不到沐师弟他们了。我猛然想起他们都从国内赶 来,自己手机里没有他们的联系方式。不巧的是,三点整我要和一位来自微软总部的研究员碰头开会, 介绍自己的工作,可是若没有笔记本电脑,要怎么介绍呢?

这下麻烦了。

我漫无目的地在会场各处寻找着,见到了在三楼等着老板费尔南多的峰,他们要商量明天演讲的事情, 费尔南多称赞我早晨讲得非常不错,现在轮到他们了;又见到了晨师弟正在准备下午的spotlight的讲稿。 两人都没有沐师弟的手机。后来幸好碰到了娟师姐,通过她找到了沐师弟的电话——原来沐师弟并没有离 开会场,而只是嫌坐在后排听不清楚,干脆坐到了第一排。

呼,虚惊一场。

在沐师弟把包递给我的时候,我第一次感觉到这里面的东西对自己有多么重要。

三点整,我来到公司展示区,在约定的地点等候。这里主要展示的是各公司一些已有的可用产品,前来 参观的人出乎意料地多。我老板也在那里,正在和某人闲谈。我和他打了招呼,擦身而过,听到了他们 的片言只语:“我有学生做图像光照,结果很不错……”

嗯,如他所言,学生自己做感兴趣的方向,而导师帮助学生找到各种外界的机会,则是他们的工作。

我还是有点紧张,并没有去看各公司的产品,而是在小会议室又打开了笔记本电脑,复习了一遍早晨刚 做完的演讲。我等了二十分钟,那位研究员一直也没有来,我只得打电话给老板,由老板转达。不一会 儿,老板终于在一楼大厅的门口,找到了他。我一路赶到大厅门口,他连声抱歉,说微软全球的各大研 究院相对独立,也就只有乘开会这个机会能碰个头交流一下思想,因此公务非常繁忙。

尔后,我们就回到三楼开始一次非正式的聊天。因为他是这方面的专家,因此我不必花十五分钟重新做 一次今天早晨的演讲,而是拣重要的讲,省去了许多口舌。他的观察极为敏锐,往往一两个问题就能问 到点子上,我暗暗庆幸如果是早晨有人这么问,在台上高度紧张的情况下,我真不知该如何作答。

还是受众不同啊。

我一口气把工作说完,他点点头觉得确实不错。我顺便提及明年暑假去西雅图微软实习的事情,他说现 在不能确定,但是到时候我可以直接发信给他,或许比正式的实习申请要快一点;至于研究方向,虽然 没有完全匹配的,但是相似的方向和机会还是很多的。我点点头,两人握了握手,简短的见面就结束了。

明年暑假,会有什么样的合作呢?

我期待着。抬腕看表,已是四点了。我回到会场,下午第二个oral session正在进行中。我正在犹豫要 去哪里,先在场外遇见了一位来自天津大学的mm,她硕士二年级,今年在会上有一篇poster,准备申请 出国。我和她聊了会儿,就我所知对申请提了些建议,然后便看到session的最后一个talk开始,演讲者 是林同学。想来今天一天都没见到她,估计是躲在哪儿反复练习吧。

我走进会场,迎面便看见一个硕大的麦当劳巨无霸汉堡占据了幻灯片的左边,而一些特征和统计分析 (比如说直方图)则占据了幻灯片的右边。会场内所有人都在专注着听林同学的报告,见不到打瞌睡的。 在讲到实验部分时,林同学介绍了一个新的数据集称作“匹兹堡快餐数据集”,共收集了30多家快餐店 的300多种快餐食品的图片,并在上面做了物体分类算法的测试。听到这里,全场都发出了会心的微笑。

sanfransisco/IMG_4902.jpg

林同学的演讲

我想大家都会记住这次演讲的吧。严格地说,这个问题很新,而且实用,是典型的挖坑文,虽说其使用 的技术并没有什么突破,但只要给大家一个有趣且没人涉足过的方向,也就够了。事后林同学自谦,说 这是因为临近晚饭时间大家都饿了,所以见到汉堡都精神振奋——不过事实上还是林同学幻灯片做得好, 讲得也很好。

下午第二个session结束,五点多了,接下来就是poster的时间。

晚上poster

我告别林同学,拿着poster贴上三楼的指定位置。一旁的韩国小伙也在那里,我把早晨拍的照片给他。 然后我就站在poster的边上,向感兴趣的人解释自己的工作,并回答别人的问题。

从下午五点站到晚上九点,除去中间和爱德华一起去吃饭的时间,我反反复复说了二三十遍,非常热情 非常激动地回答了各种问题。虽然极累,但确是值得的。

有很多人过来称赞我早晨的演讲,说条理清晰,步骤明确,结果也很吸引人,在众多演讲中可算得上印 象深刻。我笑着点头,历经半年的准备和五十多遍的练习,一次一次地改演讲的组织结构,改每张幻灯 片的细节,如今总算是有了回报了。我还遇见了做相似方向的同事抱怨说:“你上次ICCV那篇文章的代 码跑得太慢了。”我只好苦笑点头,当然他也承认跑出来的结果还不错。也有人不信在非凸函数的条件 下还能得到全局最优,对文章里的理论证明频频发问,我都一一耐心解答,虽然不能现场说服他,但是 相信他若是回去细看,还是终究会了解其中的关窍,轻轻地拍一拍桌子叫一声好的吧。还有位教授在海 报面前足足和我讨论了二十分钟询问技术细节,最后终于全盘了解清楚,很认真地和我握手,对我的工 作表示认可和祝贺。最振奋人心的是,另有两位教授过来说,我这篇应该是本次会议的最佳论文——当时 我听到了这句话,双眼都在放光吧。我想这一篇论文,也确实是我自从从事计算机视觉研究以来,自己 感觉最满意最漂亮的一篇了;不过说实话离最优论文还差得很远,也不能奢望——这不仅仅需要百倍的努 力,还要有上佳的运气。

我导师也过来了,因为这篇论文,有人愿意与我们合作,完成一个有关大气湍流的项目,因为那样的物 理过程同样也能导致局部扭曲,这篇论文的方法或许有用,可以试一下。

九点半,人流渐渐散去,我也终于收拾了东西,回宾馆。躺在宾馆的床上,可是前所未有的舒服。遗憾 的是只顾着说话,却没有将poster的盛况拍下来留作纪念。

这是一个疲惫却又兴奋的夜晚,不仅仅是因为这篇论文漂亮的数学建模,不是因为上台演讲的大获成 功,也不是因为有那么多的人前来称赞夸奖,而是因为,二十七岁的我终于开始相信只要一点一滴地把 事情做好,那些以前习惯性的“我不擅长的东西”或许会变成第一次的成功,以前一成不变的自己,也 终于能够慢慢地改变。

而裹挟着我奔流向前的命运,或许也能避开注定的暗礁和险滩,悄悄然走上一条新的道路。

sanfransisco/river.jpg

Author: Yuandong Tian

Date: 2010-07-11 23:05:39

HTML generated by org-mode 6.36 in emacs 23