当前位置:首页 > 文苑·摄影 > 文苑 > 正文

爱丁堡求学记

2010年11月12日  来源:互联网 
  

九个月的时间匆匆而过,在我从北京机场坐上回天津大巴的那一刻,甚至有放了个寒暑假从家返校的感觉。九个月的时间不短不长,回过头看,一切就像昨天历历在目。细细想来,感觉收获良多。英国九个月的他乡生活使我更加成熟自信,在爱丁堡大学信息学院数据库研究组九个月的学习则让我在学术道路上又有了一个新的起点,而在这九个月里结识的新朋友也让我受益匪浅。真的非常感谢陈老师和中心给我这次宝贵的留学机会和对我这次留学的大力支持。同时也要感谢国家留学基金委的资助,他们新增设的“建设高水平大学公派研究生项目”使包括我在内的每年约五千名中国学生有机会赴海外访问学习。

爱丁堡是苏格兰首府和历史上苏格兰王国的首都,城市历史悠久,依山傍海,风光秀丽,其新旧城区被列为世界文化遗产,素有“北方雅典”的美誉。但不同于我通常印象中庞大喧闹的首都省会,爱丁堡市区面积不大,开车半个多小时就能走个对角。而且除王子大街,皇家英里等几处热门旅游景点外,其他地方都显得极为安静祥和。我每天早晨从位于新城区的家中出发,步行穿过最繁华热闹的王子大街和皇家英里,伴随着把格子裙和全套配饰穿戴整齐的苏格兰风笛手吹奏的高亢的风笛,一路远眺爱丁堡城堡,亚瑟王座山和北海福斯湾的大海,最终到达位于旧城区的爱丁堡大学George Square校区,每天半小时的观光可谓美不胜收。

爱丁堡大学始建于1583年,是全英六所最大最古老的大学之一,也是久负盛名的世界一流学府。其在四百多年历史中培养造就出的世界级科学家,思想家,文学家,政治家,等等家,仅是家喻户晓的名字就可以列出一长串:达尔文,大卫?修谟,柯南?道尔,麦克斯韦,贝尔,以及现任英国首相戈登?布朗。爱丁堡大学与中国也颇有渊源,远的辜鸿铭,近的钟南山等也都是爱丁堡大学的杰出校友。

大学古老,其新兴学科的发展却也是生机勃勃。爱丁堡大学信息学院由原计算机科学系,人工智能系,认知科学系等整合在一起组建而成,是世界公认最好的计算机科学研究机构之一,在计算机程序语言、算法、计算机理论、人工智能、自然语言处理、数据库等多个领域位于世界领先地位。信息学院相当庞大,下设有8个研究所和实验室,我所在的数据库研究组只是基础计算机科学实验室(LFCS)中的一个小组。

数据库组现有三名教授,一名讲师,五名博士后和九名博士生,规模并不算大,但却是目前国际公认的欧洲最好的数据库研究组和世界前十的数据库研究组之一。研究组虽身处英国学府,但却是一个国际化的美国风格的研究团队。学术带头人Peter Buneman教授,英国人,当今数据库领域的世界顶级专家,曾在美国宾西法尼亚大学工作二十余年。樊文飞教授,中国人,现同时还是美国贝尔实验室科学家和哈尔滨工业大学长江学者讲座教授。Leonid Libkin教授,俄罗斯人,曾在加拿大多伦多大学工作多年。讲师Stratis Viglas,希腊人,美国威斯康辛大学麦迪逊分校博士。值得一提的是,樊文飞教授和Libkin教授都是Buneman教授在宾西法尼亚大学时的博士生,他们在来爱丁堡之前,也都已经是数据库领域的国际知名学者了。此外,五名博士后分别来自美国,比利时,德国,意大利和中国,九名博士生也来自五个不同的国家。和我们中心一样,每年也有众多学者学生来此访问。作为一个英国的研究组,成员中却只有一个英国人,人员构成非常国际化,这是我对数据库组的第一个深刻印象。事实上,爱丁堡大学乃至整个爱丁堡市都有着一种很浓烈的国际化氛围。由于之前一直想做数据挖掘和信息检索方面的东西,所以我在信息学院的众多单位中选择了数据库组,也很有幸能在Buneman的指导下进行学习研究。现在回过头来看,非常庆幸自己当初做了很正确的选择。

按照之前与陈老师商定的计划,我留学的主要任务有两个,一是系统的学习和了解爱丁堡大学信息学院的硕士研究生课程,还有就是针对一个合适的课题开展计算机科学方面的研究。

很可惜,由于英国签证政策的突然变化,我们这一批公派赴英的留学生走得都很晚。我最终在爱丁堡大学信息学院研究生院院长Don Sannella教授的帮助下,以爱丁堡大学正式访问学生的身份来到英国。当时已经是11月份了,而爱丁堡大学的上课时间一般是9月中旬到12月初,以及1月中旬到三月底。这样第一学期的课程我只赶上了最后一个月的,第二学期才终于有机会完整的上下来。事先咨询Buneman教授,他给我推荐了数据库方面的一些课程,如Database Systems, Applied Databases, Advanced Databases, Database Systems Implementation, Querying and Storing XML, Topics in Distributed Databases,此外我也给自己加了点量,旁听了一些计算机方面的基础课和自己感兴趣的课程,如Algorithms and Data Structures, Object Oriented Programming, Advances in Programming Languages, Algorithmic Game Theory and its Applications, Data Mining and Exploration, Learning from Data, Language Semantics and Implementation。这些都是信息学院开设的一年制硕士生课程,而博士生则不用修任何课程,也没有任何学分上的要求,当然如果愿意,博士生也可以旁听这些硕士生的课程。

信息学院对教学非常重视,教学工作由一个专门的部门ITO(Informatics Teaching Organisation)负责管理。ITO现任主任高级讲师Stuart Anderson去年3月份曾和Sannella教授一起来我们中心访问。我11月份旁听Anderson的Processing Natural and Formal Languages课时,很高兴他还记得我,跟我热情的打招呼。信息学院的网站建设非常发达,从有关课程的模块就可见一斑。ITO会把所有课程的信息组织整理,在学期初将所有课程列表,课程表等信息发布在网站上,同时还为每门课程设立简单的主页,简单介绍该门课程的学习内容,教学大纲,选修要求,参考文献等信息,要知道信息学院的硕士生课程多达120余门,搜集整理信息可真不是一件容易的事情。而每门课程也都有各自的网站,由各授课老师负责维护更新。通常各课程的网站上都会列出每次上课的授课内容,并提供课件和参考资料下载,有的还有考试信息和以前的考试题目,一些最新的消息也会在课程网站上发布。网站上的信息几乎覆盖了课程的方方面面,让人甚至可以足不出户,抱着参考文献看着网站上的内容就可以自学了。

信息学院参与授课的师资队伍可谓相当强大,所有活跃在科研第一线的教授讲师们几乎都有教学任务。像Buneman教授就带了研究生的Applied Databases和本科生的Database Systems两门课。数据库组的其他三位老师每人也都至少带有两门课。一流的师资自然会带来一流的课堂内容。Buneman教授在Applied Databases课上就曾经请天文学研究人员做关于天文数据库的报告,还让组里的博士后Heiko Müller介绍了他们的XML数据库归档原型系统XArch。樊文飞教授是XML数据库领域的世界一流专家,他讲授的Querying and Storing XML深入浅出,在讲基础理论的同时,也经常涉及领域内的一些热门课题和最新进展。而Viglas在Advanced Databases和Database Systems Implementation课上教学用的一个初等的数据库管理系统Attica则是由他自己开发的一个开源系统。这样的课堂信息量当然很大,要想跟上授课进度,课下就必须进行大量的文献阅读和编程实践。每门课通常都会在一个学期内分阶段布置几次大作业,而在交作业的截止日期之前通宵达旦的赶作业,也成了信息学院硕士生的家常便饭。由此可见,信息学院一年制硕士的含金量还是相当高的。信息学院硕士生课程的设置和授课内容的安排目的也都很明确,就是为就业或进一步博士深造打基础,不会讲太深的东西,而是让你对各学科领域有个大概的了解。

得益于我的学生身份,除了专业课的学习,我还参加了一些学校为研究生分学科开设的叫作Transferable Skills的课程,这种课程以提高学生的科研技能和职业素养为目的,课程内容都很有针对性,像为一年级新生开设的Getting Started with Your PhD, 为高年级学生开设的Managing Your Research Project和How to be an Effective Researcher,为提高写作和演讲能力的Effective Writing和Effective Presentations, 为提高支配时间能力的Time Management等等。一般一次课3个小时,也有的要上两天。每门课都配有很丰富的教学材料,有的还设计了很多团队游戏。在这个课堂上我学到了不少新鲜观点,如Manage Supervisor,讲的就是如何与导师沟通,如何准备与导师的会谈等。此外,通过这一课堂,还能得到很多和其他专业同学交流以及认识新朋友的机会。

爱丁堡大学每学期的上课时间只有两个多月,这也使得我有比较充足的时间做课题研究。不得不提的是,数据库研究组理论研究气氛相当浓厚,绝不亚于一个数学研究机构。这是数据库组给我的第二个深刻印象。像Libkin教授研究的逻辑,在我看来已经是纯粹的数学了。还有一个佐证就是,他们写文章都是用的Latex。数据库组不仅在理论研究方面实力雄厚,同时还与工业和企业界保持密切联系,合作单位包括英国数字资源典藏中心,苏格兰国家e科学中心等。像XArch系统已经应用于Swiss-Prot等基因数据库的归档。樊文飞教授和他的学生在Data Cleaning领域已经积累了深厚的理论基础,现已开始着手开发相应的系统并计划将其商业化。

我很有幸能在Buneman教授的指导下进行学习,他虽然已经多年都没有招收学生,但还是欣然同意接受我作他的访问学生。值得一提的是,Buneman教授是实实在在的数学出身,他上学期间的专业一直都是数学,组合数学也是他的研究兴趣之一。与Buneman教授第一次会谈,他就与我交流了关于研究课题的想法,给我介绍了一个他与组里一位博士后Heiko Müller刚开始研究的一个关于XML数据库归档的课题,问我愿不愿意参与进来。这样既有理论研究,又需要系统实现的课题正合我的胃口,我很高兴的表示愿意加入。于是他又拷给我实验用的数据,是美国中央情报局每年发布一次的World Factbook,他从各种途径搜集到了1990年开始一直到2007年的版本,并自己编写Python程序,把文本,网页等各种格式的数据,统一整理成了我们需要的XML格式的数据。顶级大牛还在自己写程序,着实让我肃然起敬。题目确定了,我也就开始恶补所有相关的基础知识,XML,XPath,XQuery,DOM,Python,Java,Eclipse。真的是零起点,虽然很累,但过程很享受。

我们的问题描述起来并不复杂。Buneman教授曾与合作者在一篇文章中提出了一套系统的方法,用于将多个版本的XML文档合并到一个XML归档文件中,在压缩空间开销的同时,实现对某一版本和某个元素变化历史的高效查询。Müller博士则在此基础上开发出了一套原型系统XArch。目前的方法要求输入的所有版本的文档都遵循一个统一的结构,当某个版本的结构发生变化时,现有方法无法在归档时反映这种变化。我们要做的就是对现有方法进行推广,使之能够自动检测这种结构上的变化,并在归档存储时做相应的调整。为了能够更清楚的认识问题和了解可能要用到的工具,我搜集阅读了大量文献,开始时注意力集中在XML文档差别检测的相关工作,整理出了一篇综述文档,还测试了大量XML文档差别检测的工具,但总觉得这方面的方法并不适用于我们的问题。这时Buneman教授提醒我,要结合我们文档中的Key Structure来进行差别检测,受此启发,我发现XML文档的相似度计算和Schema Matching方面的工作对解决我们的问题也大有帮助。在综合这些工作的基础上,我提出了一个初步的用于检测重命名变化的算法,并基于XArch予以实现,对下一步的工作也有了明确的方向。在研究过程中,我每每有新的认识和发现,都会先找Müller博士讨论,然后再向Buneman教授进行汇报和展开下一步的工作。Müller是德国人,博士毕业于德国柏林洪堡大学,给人的感觉,和中心的德国教授Reidys一样serious。和他的讨论让我学会了很多东西,如计算机学科的研究方法,计算机学家的思维方式,此外通过阅读他写的XArch的代码,也使我的Java学习事半功倍。Müller博士也一直在不断的更新XArch的代码,添加新的功能和修改一些bug,而每当有了比较稳定的新版本,他都会给我再拷一份。很高兴的是,在目前的版本中,已经开始有我写的代码了。

此外,我还参加了Buneman教授和Müller博士组织的两周一次的关于数据库维基的研讨。他们想做一个能像维基百科一样可供大家修改的数据库系统。想法很新颖,但谁都不知道应该做成什么样子,以及这个东西可能会有什么用处。于是他们就找来各个领域的人,有信息学院和校内其他学院的,还有一些公司的,这样学术界的讲一讲他们理论上的构想,工业界则讲他们实际工作中可能的需求。信息学院的院长Michael Fourman教授也是几乎每次都参加,我也有机会近距离的观察这位可爱的院长先生。Fourman教授为人和蔼可亲,大大咧咧,在我们的研讨会上,他经常会与另外一位老教授争论的面红耳赤,不可开交。而他这个院长当的更像是一个大管家。信息学院的楼是24小时开放的,这边的论文大多都是投向学术会议的论文集,有截稿时间,所以在截稿日期前会有很多人通宵达旦的赶论文。但有时由于施工会封楼,甚至晚上也不能进入。这时Fourman院长就要群发邮件向大家道歉和解释原因。还有一阵子办公楼换玻璃,风太大也得封楼,Fourman院长则天天给大家转发BBC的天气预报。

数据库维基研讨会刚开始的时候,大家就是介绍各自的背景以及做过的和数据库维基相关的工作,慢慢开始提出各自的一些设想,再后来就开始考虑开发一个原型系统,然后大家基于这个原型再进行下一步的工作。这样的一种科研方式着实让我大开眼界,这也正是我所向往的那种真正以问题驱动而非文献驱动的科研方式,很可惜现在离开了,不能继续参与他们的讨论,但我会经常与Müller博士联系,关注他们的进展。

像大多数中国留学生一样,除了学习科研,我的业余生活非常简单,但日子过得也很开心,一个重要的原因就是数据库组也像我们中心一样,给人一种大家庭的感觉。这是我对数据库组的第三个深刻印象。每天中午组里十好几口人都会挤在一张大桌子旁吃午饭,边吃边操着带有世界各地口音的英语海阔天空的聊天。组里有人结婚生孩子了,大家也会像中国一样给凑个份子。有人过生日,大家会一起开party给他庆祝。有人要离开,也会举办一个party与大家告别,每个访问结束离开的人还都会得到组里送的纪念礼物。数据库组也堪称信息学院中国味最浓的单位,樊文飞教授身边就聚集了一批中国弟子,他们是:刚刚博士毕业现已转为博士后的贾西贝,在读的博士生马帅,吴颖徽,来自中科院的访问学者刘洁副教授,国防科技大学来的访问学生胡艳丽。樊老师对我也非常照顾,像关心自己的学生一样关心我。我在生活和学习上得到了他们很多的关心和支持,尤其是他们在除夕那天的辛勤劳动,使我吃上了热气腾腾的饺子,那种感觉终生难忘。这点上我就比在奥地利过春节的侯庆虎教授幸福,他那边没什么中国人,自然也没有饺子吃。

说起在英国的中国人,那可真是不少,远远超出我之前的想象。不夸张地说,在爱丁堡的大街上,走两步就能看到中国人。而爱丁堡的华人组织也很活跃,与学生有关的最大组织当属爱丁堡地区中国学生学者联谊会,简称爱丁堡学联。有意思的是,我们的饶子和校长,还曾经作过全英学联的主席。爱丁堡学联主席于斌是天津人,于是跟我有了不少共同话题。依靠在中心摸爬滚打练出来的一身本领,我也有机会参与了学联的一些工作,像帮忙做做网站,设计会员卡,参与组织“支持奥运反对藏独”的4?12爱丁堡华人大游行,以及为四川地震苏格兰华人赈灾义演做志愿者工作。其实活倒也没干多少,但能力和责任心却得到了肯定,我很清楚,这与在中心的锻炼是绝对分不开的。虽然曾经在中心干活有时也会觉得很辛苦,但现在尝到甜头了,会觉得受的那份累很值,很感谢中心能提供一个平台放手让学生去做很多事情。像中心每次组织学术会议,都是老师学生一齐上阵,将会议组织的井井有条,并得到与会人员的交口称赞,而对每一个参与组织工作的人来说,也都是一次经历的丰富和能力的提高。通过参加这些活动,也让我意识到在异国做事的艰辛。比如为了制作4?12游行用的横幅,我们从印巴布店买来红布,在电脑上把字制作好,用投影仪投在布上,然后把边描下来,最后再涂上学联高级顾问王方家里装修用的白漆。游行当天用来撑横幅的则是杜塞同学家里床头的长木板。看着我们一堆人忙活一下午做出来的四个大横幅,很有成就感。那次游行非常成功,短短六天的筹备,换来最后2000多人大规模的游行活动,向当地人充分展示中国人团结一心支持奥运的决心。

当然,来苏格兰一趟,不能错过它壮美秀丽的高地风光和绚烂多姿的传统文化。学校和学院都组织了很多活动,尤其是Sannella教授领导的信息学研究生院为组织学生活动提供了大力资助,我也借此机会领略了苏格兰高地风情,还学跳了热情奔放的苏格兰舞,多次参加了苏格兰Ceilidh舞会。数据库组的行政主任Florance Kennedy女士可以算是我的苏格兰舞导师了,他们当地从上小学就开始学跳苏格兰舞了。

洋洋洒洒几千字,很想把所有点点滴滴都记述下来,与大家分享我这九个月的经历,但越写越感觉面面俱到而又面面不到,索性自此打住,就以美丽的苏格兰风光结束我的这篇“散”文吧。



  文章中观点仅代表作者本人的观点,不代表本网站的观点和看法。

编辑:Crystal JI