[图文]10位微软工程师烹制“互联网信息搜索”盛宴
-
研究生记者团
-
创建于 2006-06-15
-
3224
【新闻网讯 记者 洪佳】令人无比向往的夏季学期终于到来了,6月14日下午1点20时,离上课时间还有10分钟,中科院中关村教学楼S101教室里已是座无虚席,更有不少同学(青年学者)还从小教室搬来了凳子,插在教室的过道中间,大家都怀着无比兴奋的心情等待聆听微软亚洲研究院互联网搜索与数据挖掘组 (Web Search and Data Mining Group at Microsoft Research Asia)的著名专家们给我们带来的“互联网信息搜索与挖掘”专题讲座。笔者选了此次讲座课程,有幸窥见了微软MRSA组专家们温文尔雅、严谨认真的研究风范,领略了大师们卓越的学术风采。
今天的课程有两讲,第一讲是由微软亚洲研究院互联网搜索技术中心的主任研究员马维英博士带来“互联网信息搜索:历史,现状与未来”;第二讲是微软亚洲研究院的副研究员史树明带来的题为“信息检索模型”的讲座课程。
微软工程师烹制“互联网信息搜索”盛宴
毕业美国加州大学圣芭芭拉分校(UCSB)获得电气和计算机工程系硕士和博士学位、并曾在在惠普实验室工作过的马维英博士,在2001年加入微软亚洲研究生院后,就任互联网搜索和挖掘组主任研究员。
马博士在他完成博士学习的1994年到1997年间,在所参与的UCSB的Alexandria数字图书馆(Alexandria Digital Library)项目中开发的互联网图像检索系统Netra,被认为是最具代表性的图像检索系统之一,被广大研究人员广泛引用,这个系统是第一个采用图像分割技术并实现基于区域检索的大规模图像检索系统。马博士在惠普实验室工作的四年中,从事多媒体自适应传输和移动因特网的分布式多媒体服务系统的研究,他所开创的多媒体自适应服务网络后来成为惠普实验室的研究重点之一。马维英博士于2001年4月加入微软亚洲研究院,担任网络搜索和挖掘组的主任研究员,领导在信息检索、文本挖掘与搜索、多媒体管理和移动信息浏览方面的研究。在2003年至2004年间,他领导的研究组在ACM SIGIR上发表了9篇论文,在WWW会议上发表5篇论文,在ACM Multimedia会议上发表8篇论文,所发表论文占这些会议的总接收论文数的5-10%。 马维英博士目前是ACM/Springer多媒体系统期刊的编委以及Kluwer出版的多媒体工具和应用期刊的副主编。他还是许多国际会议的组织和程序委员会成员,如ACM Multimedia, ACM SIGIR, ACM CIKM, WWW, ICME, CVPR, SPIE Multimedia Storage and rchiving Systems, SPIE Multimedia Communication and Networking等等。他还是International Multimedia Modeling Conference (MMM) 2005和International Conference on Image and Video Retrieval (CIVR) 2005的大会联合主席。他撰写了若干已发表书籍中的5个章节,并在国际期刊及会议上发表论文100余篇。
在接下来的五周时间里,我们将聆听到由马博士带领的互联网搜索和挖掘组的各个前沿领域的专家们为科院学生带来的丰盛的“搜索技术”盛宴。
第一讲 互联网信息搜索:历史,现状与未来
主讲人---- 马维英 男 主任研究员 微软亚洲研究院 6月13日下午
第二讲 信息检索模型
主讲人---- 史树明 男 副研究员 微软亚洲研究院 6月13日下午
第三讲 链接分析技术和网页排名欺诈
主讲人---- 刘铁岩 男 研究员 微软亚洲研究院 6月20日下午
第四讲 互联网信息抽取
主讲人---- 李航 男 研究员 微软亚洲研究院 6月20日下午
第五讲 基于机器学习的搜索排序研究
主讲人---- 张磊 男 研究员 微软亚洲研究院 6月27日下午
第六讲 互联网图像搜索
主讲人---- 李明镜 男 研究员 微软亚洲研究院 6月27日下午
第七讲 移动搜索与基于位置的搜索
主讲人---- 谢幸 男 研究员 微软亚洲研究院 7月4日下午
第八讲 对象级别的垂直搜索
主讲人---- 聂再清 男 研究员 微软亚洲研究院 7月4日下午
第九讲 信息检索的评价
主讲人---- 宋睿华 女 副研究员 微软亚洲研究院 7月11日下午
第十讲 发掘互联网中的结构
主讲人---- 文继荣 男 研究员 微软亚洲研究院 7月11日下午
娓娓道来 引人入盛
马博士的授课是娓娓道来,语调语气谦和温润,举手投足自然平和,这些无一不散发出令人愉悦的书卷气息,弥显出他温和而沉静的学者气质。
在向邀请他过来讲课的老师表示诚挚感谢后,马博士表示很高兴能够来到中科院来开一系列这样的讲座,这是目前他们在北京这一带的高校和研究单位的第一次尝试。接下来他又谦和地表述了开设此次课程的原因:“大家知道,在搜索这个领域,当然在工业界,是非常非常的tough,但是因为它还是一个正在发展中的技术,而且因为它本身的很多的机会,大部分当然在工业界(相对应于学术届),把它系统的、完整的整理出来,我想这个呢,还在进行当中。所以我们希望能够借由这样的机会能够在中科院开这样一堂课。这堂课的目的也是希望让我们能够整理我们的知识,能够和同学们一起分享……在接下来的五周时间里,我们会有机会在搜索这个领域,方方面面地来看这个技术。”
马博士说,要在在全世界找出一位老师能深入地讲述,是很不容易的,因为搜索是个非常大的学科和领域。此外,他希望选课的同学都不要错过这五周的十讲课程,因为是很少有这样的机会能够对搜索的技术来方方面面的了解。他会就第一堂课的讲述机会,带着同学们在高层面上来俯视搜索这个领域,看看不论是在工业界还是在学术界的这个领域里,所面对的挑战与机遇。
马博士首先以一个“为什么搜索今天这么重要?”的问题,拉开了第一讲的序幕,他提问道“我们今天来谈搜索,我想问问在座的同学,我们一定要回答这个问题,为什么搜索今天这么重要?……其实搜索并不是一个新的领域……但是有一阵子,工业界很认为的搜索已经没有什么发展的机会,所以冷却了,但后来为什么又被google给做活了呢?这个搜索好像今天突然间又变得,人们都觉得非常非常重要,为什么呢?有没有哪个同学能够尝试回答这个问题?”
在场的同学都纷纷举起手来,有的同学回答说搜索的产生是因为现在非常巨大的信息量,导致用户需要一个有用的工具来有效地获取他所需要的信息。马博士肯定了同学们的观点,认为同学的回答从技术层面,回答了有这样的一个需要。并进一步阐发“但一件事情重要的话,在公司里面,一定有它的business reason……微软和google的整个竞争,一个fundamental竞争的本质,其实是软件产业的竞争……”
图文并茂 形象阐述
马博士在讲述了发展互联网搜索技术的必要性后,接着介绍了互联网搜索技术的发展过程,并为同学们理清了全球互联网搜索技术从Relevance(相关性)到Intelligence(智能化)过渡的发展脉络,并提出未来的互联网搜索技术将是朝着更加智能化、人性化的方向发展的观点,如移动搜索、深层互联网搜索、互联网挖掘等。接下来马维英博士概括介绍了微软亚洲研究院互联网搜索与信息挖掘组各位研究员在该领域所作的工作。
马博士和史博士的讲座中运用了大量形象的图片和Demo演示来讲演他们正在研究开发的技术以及信息检索模型的实例。马博士还介绍说,最近两年,微软亚洲研究院互联网搜索技术研究组在互联网数据搜索领域取得了非常优秀的技术突破与研究成果。2005国际信息检索年会(SIGIR 2005)接收了微软亚洲研究院的12篇高质量论文。后者以15%的比例蝉联了这一信息检索领域最具权威性的世界级学术盛会论文获选率的冠军。
马博士在介绍他们的正在开发的学术搜索引擎时说“这样一个自动的搜索引擎”可以帮助学生、老师以及各个研究人员获取在计算机科学领域内的各种关于论文、科学家、会议、期刊和学术兴趣圈的信息,这样可以帮助他们能更准确地找到所感兴趣的论文、某个学术领域内的顶尖科学家、会议和期刊等。
其后并开玩笑道“将来美国的学术系统,可能在评比他们教授,可以……用我们这套系统来决定他们要不要升等……”同学都笑了。
在课程结束时,留下了几分钟,同学们都非常踊跃地向马博士提问,向他咨询搜索领域的发展、挑战等各种问题。
聆听了由马维英主任研究员带领的微软专家MRSA团队给科院学子带来的精彩的课程讲述,诸多科院学子深感收获颇深,大家在课间时间还纷纷围在马博士身边询问自己对搜索领域的各种问题,马博士则一一给予详细的答复,并鼓励大家多努力,多学习。
责任编辑:研究生记者团