冉冉升起的网络科学

  • 沈华伟 (2014年以后的旧数据)
  • 2478
作者:沈华伟

从八年前走出大学校门、计算所求学、博士毕业有幸成为计算所一名员工、在网络重点实验室与网络科学这个新兴的学科共同成长,切身体会到了科研的苦与乐,从身边的老师和同学身上领略到了他们对科研的激情和执著,也逐渐成长为一名科研工作者。我谨以此文记下网络科学在计算所的冉冉升起之路,感谢计算所和网络重点实验室对该学科的支持,并与共同参与奋斗的各位老师和同学共勉。
启航
2005年的夏天,计算所的新科研楼还没有落成,网络重点实验室的前身——软件实验室还在蓝靛厂办公,我刚刚从中科院研究生院完成课程学习阶段,进入实验室。和其他硕士生一样,被分到一个课题组,开始熟悉课题组的工作。原本以为,我会像自己预期的那样两年后硕士毕业、就业,但一个偶然的机遇改变了这一切。
一天,担任实验室主任的程学旗老师召集实验室几位员工和学生,讨论成立一个新的兴趣小组,思考Internet和Web的迅猛发展对计算机科学和信息科学带来的全新挑战,探索这一背景下大规模内容计算、海量信息检索、面向万维网的舆情分析和信息安全所面临的共性问题、基本规律及其解决方案。非常幸运,我是这个小组的一员。
事实上,对这一科学问题的思考和探索在国际上也才刚刚起步,但已经引起了包括社会学、数学、物理学、统计学、生物学、计算机科学等很多学科的学者们的热切关注。不同学科对于这一问题的思考角度不同,所关注的应用问题也千差万别。例如,SARS等传染病是如何在人类或动物中传播?计算机病毒在Internet上是如何扩散的?如何解决Internet高效路由和提高Internet的抗毁性?北美地区电网的瞬间瘫痪是如何造成的?城市交通堵塞是如何引起的?人类大脑是如何工作的?等等。这些问题的背景千差万别,背后存在着普遍的特征和表示形式——网络,包括WWW、Internet、社会网络、经济网络、电力网络、交通网络、神经网络等。更重要的是,人们的经验研究和观察表明,这些来自不同领域、为了不同目的形成的、看似互不相关的网络却呈现出惊人的共性特征。另一方面,以高性能计算、并行计算为代表的计算能力的提升,以Internet和Web为媒介的海量数据积累,为我们研究网络提供了工具和对象。这些最终催生了一个新的学科——网络科学。
就这样,一颗网络科学的种子播种在了我们这些刚刚进入实验室的研究生心中,等待它的将是成长的烦恼和艰辛,它的开花结果还将面临心血和汗水的洗礼。
不管怎么说,我们迈出了第一步,我们起航了。
成长
常言道,万事开头难。老实说,那时候我们根本不知道从哪儿开始,手里只有这个方向的几篇开创性论文。印象最深的四篇是:Barabasi和Albert发表在Science上的论文,Watts和Strogatz发表在Nature上的论文,Newman发表在SIAM上的综述,以及Albert和Barabasi发表在Rev.Mod.Phys.上的综述。尽管一开始我们都觉得无从下手,但我们选择了坚持和探索,这四个字便是科研留给我的最初印象,至今仍然是我科研之路上的宝贵精神财富。
我们反复阅读着这几篇论文,不断进行讨论。这些论文中,有的只有二三页,有的长达五六十页。最终,短的被我们读长了,长的被我们读短了。现在回想起来,这一过程对我们是次极其重要的磨砺,我至今仍在受益。伴随着论文阅读和研讨,我们的视野开阔了,思路活跃了。逐渐,我们明白了这一研究方向的基本问题、基本方法论,也熟悉了该方向的国内外主要研究团队,摸清了发表该方向论文的主要刊物。
我们初步确定研究的几个问题包括:大规模社会信息网络的建模、网络结构和功能的关系、网络的涌现现象、网络信息扩散演化、网络中观或介观结构——社区结构等网络基本问题,还有面向Internet的流量优化、网络抗毁、网络节能、新兴网络业务构建等和面向Web舆情分析及内容安全的诸多实际应用问题。
我们在一点一滴地进步。
与此同时,一种质疑声始终困扰着我们:这样的研究出路何在,如何与现有的工作结合,又能产生什么样的价值呢?这一质疑的冲击力如此之大,几乎让我们开始动摇,甚至打算放弃了。面对这样的局面,程老师多次召集我们讨论,鼓励我们。他说:科研允许失败,年轻允许失败,我们如果不敢正视质疑,不能勇于大胆尝试,怎能对得起自己的博士生涯?“人生能有几回搏!”这一充满激情和坚忍的豪言壮语,使我们最终走了下来。现在想想,如果不是程老师的极力支持和耐心,我们根本走不到今天。
没有坎坷,谈不上成长;没有质疑,谈不上成长;没有坚忍,谈不上成长。
经历了这一切,我们的团队成长了。
团队
记得,NBA著名球员代言过这样一个广告宣言:无兄弟,不篮球。这直白地告诉我们,团队是多么的重要。
我们的团队是一个奇特的队伍,除发起人程学旗老师外,全部由学生组成。我们年轻,无畏失败。朝气是我们这个团队最典型的特点,每个人每天都充满激情、充满能量,朝着我们的目标前进。在见证我们团队成长历程的周三讨论班上,我们每一个人都挥洒过青春的激情,一个个思想的火花迸发着、碰撞着。常常,一个十几页的PPT讨论三四个小时,在这一刻,每个人都似乎不知疲倦。可是,铁打的营盘流水的兵,我们这支学生军,流动性非常大,虽然从没超过五个人,却进进出出十几个成员,他们至今都同我们保持着密切的联系,他们和我一样,难忘我们拼搏的历程,难忘我们这个团队。
我们另一个突出的特点是专业多样性。几年来,曾在我们的团队里奋斗过的成员,有数学专业的,有物理专业的,有机械专业的,有通信专业的,当然还有我们计算机专业的。多样性使我们在探索网络科学这个交叉学科的过程中,始终保持新鲜的思维方式,保持不竭的后劲。
这里不能不说说我们团队的学科带头人——程学旗老师。程老师作为网络重点实验室的主任,日常工作非常繁忙,仍然坚持每周参加我们的讨论班,与我们一起在学术的浪尖上冲浪。除此之外,程老师关心我们团队每一个学生的成长进程,善于调动学生的积极性和主动性,耐心听取学生的声音,因材施教,充分发掘学生的潜力。程老师对我的教诲和培养,是我不断努力取得成绩的重要支柱,我至今无法忘怀和程老师一起修改论文到凌晨的那些经历。
我为我能在这样一个团队里成长感到幸运和自豪!
艰辛
作为计算机行业的研究队伍,从事网络科学这样一个交叉学科,面对众多来自物理专业、数学专业、统计专业的研究同行,我们难免面临学术上的水土不服。这里,以我们团队发表论文的点滴经历,回顾一下我们成长的艰辛。
由于网络科学的论文大多发表在PNAS、Physical Review Letters、Physical Review E等物理刊物上,我们缺乏投稿经验,屡屡受挫。我们的第一篇物理刊物的论文就先后被拒过四次,但幸运的是,每次审稿人都给出非常详细的审稿意见,帮助我们提高论文。期间,我们反复修改,屡拒屡投,论文质量也随着被拒次数的增加而逐步提升。
说起修改,真是感触良多。其中一篇论文,程老师和我一起先后修改过11次。程老师日常工作繁忙,修改论文的时间大多安排在晚上,修改非常投入,很多次不知不觉就到了夜里三四点钟。由于时间太晚,好几次,我都索性睡在实验室,由几个椅子搭起简单的硬板床,和衣而眠。程老师有时候几乎不休息。记得有一次,收到论文审稿意见,已经是晚上10点钟,我转发给程老师,便回青年公寓了。不一会,手机响起,程老师约我修改论文,尽快返回重审。一个通宵下来,论文提交进行二审,下午便收到了编辑的意见,论文被录用了。那种身心俱疲后的欣慰,让人久久不能释怀。
写论文固然艰辛,形成论文的思路更是不易。多少次苦思冥想,多少次废寝忘食,多少次无功而返。记得程老师在讨论班上说过:做研究,就要心无旁骛,专注在一个问题上,每天脑子里都思考着自己的研究问题,才能有所突破。我体会颇深,好多次想法的迸发都发生在吃饭时、睡觉前、回宿舍的路上等。没有全身心的投入,怎会有科研成果的产出?
可以说,每一篇论文的背后都有一个故事,每一篇论文的字里行间都饱蘸着我们的心血和艰辛。
收获
“有志者,事竟成,破釜沉舟,百二秦关终属楚;苦心人,天不负,卧薪尝胆,三千越甲可吞吴。”这是我的座右铭,也是对我们网络科学研究小组的最好写照。
艰辛的付出浇灌着收获的鲜花。五年来,我们从无到有,从小到大,一路走来,终于收获了回报。
下面以我们在社区结构方面的几篇代表性论文作为缩影,回顾一下我们的科研之路。
发表在PhysicaA上的论文首次提出了复杂网络的社区既是相互重叠的、又具有层次化的结构,这一观点目前已得到国际同行的高度认可。截至目前,该论文已被引用十余次,其中,意大利著名学者Fortunato发表在Physics Reports(影响因子18左右)上的综述性论文对我们的工作进行了重点引用。这篇论文的录用标志着我们团队被物理领域的刊物认可,我们迈出了第一步。
发表在New Journal of Physics上的论文,研究了Web、科学引文网络等文档网络的结构聚集特征和文档内容间的关系,首次提出三角聚集性,有效地刻画了文档网络中三角形形成和文档间相似度间的关系,并据此给出一种网络模型,很好地再现了文档网络的生成过程。这篇论文的录用标志着我们的研究成果绝非昙花一现,而是具有持续的创造力。
第一篇发表在Journal of Statistical上的论文,被审稿人高度肯定,称本论文提出的方法“优美地”解决了重叠社区的发现问题,使得任何基于经典modularity优化的方法均可直接应用于发现重叠社区结构,对于社区结构的度量和发现具有重要意义。这篇论文是我们在没有和任何非本团队人员交流的情况下独立完成的,对我们具有非常重要的意义。
第二篇发表在Journal of Statistical上的论文,考察了信息扩散这一发生在网络上的动态过程,揭示了扩散过程中存在局部均衡态,据此提出扩散过程与网络的社区结构紧密关联,并提出一种基于网络传导率的社区发现方法,很好地刻画了网络社区结构和诸如信息扩散、谣言散布、病毒传播等动态过程的关系,推动了网络结构与功能之间关系的研究。这篇论文最为艰辛,前后持续近半年,但它的录用对我们团队意味着什么,我们每一个人都非常清楚,因为这篇论文所解决的问题是困扰我们团队达四年之久的问题——网络结构和网络功能的关系问题,这一问题的解决标志着我们的研究思路突破了瓶颈,开始进入高产期。
最近被Physical Review E 录用的论文被审稿人充分肯定,其中一个审稿人一周便返回了审稿意见,称该论文对于网络社区结构的研究具有重要影响。这篇论文的录用过程是最顺利的,充分表明我们的研究思路和研究水平得到了国内外同行的肯定,也表明我们的研究开始达到本领域国际领先水平。
想起这些论文,我如数家珍。每篇论文的出炉,我都历历在目,印象深刻,因为它们饱含着我们坚持不懈、努力奋斗的艰辛,是对我们不抛弃、不放弃精神的最好回报。
几年来,我们共有几十篇网络科学方向的论文发表在国内外的期刊和会议上,特别需要指出的是,我们已有十几篇论文发表在被SCI索引的重要物理刊物上,包括Physical ReviewE,New Journal of Physics等,论文累计被引用数十次。我们在网络社区结构方面的研究近年来进步较大,得到了国际主要研究团队的肯定和认可,且上升势头很好,并与国内外同行保持着良好的合作和交流关系,包括瑞士弗里堡大学、伦敦大学学院、中国科技大学、中科院理论物理所、电子科技大学、北京师范大学等。
宝剑锋从磨砺出,梅花香自苦寒来。没有耕耘,便没有收获!
未来
如今,网络科学在计算所网络重点实验室的土壤中正茁壮成长着。科研成果层出,不仅体现在学术论文上,网络科学的研究成果正在逐步应用于网络舆情分析、社会搜索、网络靶场、Internet路由优化和抗毁等实验室重要项目和课题中,发挥着越来越重要的作用。网络科学正逐步成为网络重点实验室乃至计算所的一颗冉冉升起的新星。
一切成绩只代表过去,不变的是我们对网络科学的孜孜追求,不变的是我们团队奋发向上、永不停息的脚步。
坚持,我们的未来不是梦!
(沈华伟,中科院计算所)