Monthly Archives: July 2011

最近的独家厕所读物一直是The Rise & Fall of Communism一书。毕竟本人史盲,未免少见多怪。最近读到的是斯大林早年是靠打劫银行发家的。

Although 1906 and 1907 were considered a relatively quiet time, in comparison with 1905, assassinations of officials by the revolutionaries continued on a large scale. Numerous bank robberies took place, some of them led by Ioseb Djugashvili, in order to pay for the upkeep of the revolutionary movement. This Georgian Bolshevik, who had studied in a religious seminary (until his expulsion from it in 1899), was to become better known as Stalin, the name he began using in late 1912. Lenin himself sanctioned a number of the raids and regarded them as a legitimate part of the struggle with tsarism. As his wife Nadezhda Krupskaya put it: ‘the Bolsheviks thought it permissible to seize tsarist treasure and allowed expropriations’. The Mensheviks, in contrast, were strongly opposed to bank robberies.

Taylor与液滴变形

我的师弟要做乳液体系。我一开始的idea是基于高体系分数的乳液,但慢慢发现做液滴变形反而更好地体系我的idea。一开始想着是师弟的课题,要考虑在他的水平力所能及的范围内做,于是我一直都只告诉他要干哪几件大事,看哪几方面的内容,解决哪些问题。但我自己没有跟着去看液滴变形的文献。最近发现这样好像容易发生误解和走偏。主要因为这是我的而不是他的idea,我的最终意图不是说一两次就能讲明白他。所以现在觉得还是我和他一同学习比较好。但我仍然要注意该他懂的东西就算我看懂了还是得他看一遍,再怎么“一同学习”,将来是他答辨不是我答辩——这是最基本的底线。

所以今天上午略微查了一下文献。我就发现新手和老手的区别确实很明显。我让师弟看关于乳液的文献,这么久了,他好像并没有摸清研究的主线。结果我一上午就搞好了。从这个意义上讲,我才发现我N久以前在科学网上写的那个“我阅读文献的做法”确实比较有实际意义。现在这篇东西好像被转来转去,但是原出处随着我删掉科学网帐户也一起消失了。现在我在本博客重新贴了出来,里面作了一些小修改,基本上按当时写的原样保留,以供日后参考。

今天上午看到了关于浮液中的液滴变形与粘弹性关系的理论研究。从Einstein、Taylor、Palierne再到后面的M&M。Einstein的理论那个“2.5φ”的模型当然是只适合单分散硬球体系。首先考虑液滴体系的是Taylor。但我还是看不懂Taylor原文里的推导是怎么“从硬到软”的。这没所谓,可以通过看后人对Taylor方法的复述来看懂。

按照最常见的引用Taylor的原文是两篇发表在Proc. R. Soc. A上的文章。大致上讲第一篇是理论,第二篇是实验。让我大感兴趣的第二篇文章里的各种apparatuses

有两个主要实验仪器,是为液滴变形制造流场环境的。一个是“four roller apparatus”,制造双曲线流;一个是“parallel band apparatus”,制造简单剪切。

Four roller apparatus

Four roller apparatus

 

Parallel band apparatus

Parallel band apparatus

看到这两个apparatuses我就感到一股蒸气朋克的气息。蒸气朋克是一种好科幻,因为它不具体去渲染哪项特别牛逼的发明如何改变世界和人类社会,而是靠各种日常技术细节的描述去烘托一整个技术背景。科幻除了作为文学欣赏之外(很多科幻小说的文学性其实很低),我认为唯一的实际价值就是吸引年青人从事正式科研工作。例如我本人。那种渲染牛逼技术的科幻,无非是宇宙、基本粒子、基因工程什么什么,再不就是玩心理学玩意识,把还没接触实际科研的年青人直接忽悠得不行。现在的科普也无非是这些话题最热门,原因就在于大家已经被忽悠到认为只有这些才是科学了。事实上亲自从事科学研究的感觉更像蒸汽朋克的气氛。你不是所有钢铁怪物的制造者,而是浩浩荡荡的钢铁时代下一个典型的小矿工。你虽平凡到可以忽略,但却似乎所有那些巨大的连杆、活塞和龄轮都是你的杰作一样,你以身为其中一员而十分自豪,兴奋不已地向新来的客人介绍整个工厂的工作原理,并开动机器亲自操作演示……这不就是一个平凡但地道的科学家会有的所有举动么?所以事实上是像蒸汽朋克这样的科幻小说真正地把人引向实际的科研工作。那些什么基本粒子碰撞黑洞虫洞时间旅行抑或什么内含子裁剪RNA信使镜象神经元男人和女人哪个更爱聊星座的话题请统统去死吧!

日本动画《天空之城》就是一个典型的蒸汽朋克,我挺爱看。就连在《泰坦尼克号》电影里偶然出现的大活塞和大连杆镜头也让我感到一时的振奋。Jack和Rose在逃跑的时候曾经经过邮轮最底下的锅炉区,带着Rose穿着最不堪玷污的礼服穿越充满油污的男性世界,很有爱。我甚至很迷那时候的工人阶级服装。卷起衣袖的白衬衫配吊带工人裤,头上带一顶所谓gastby tweed cap……如果其人还是一个金发正太那就更棒了!在Titanic里面Jack的同伴Fabrizio就一直是这种装束:

Fabrizio with gatsby tweed cap

Fabrizio with gatsby tweed cap

还有《雾都孤儿》里的Oliver!

做我儿子吧

做我儿子吧

回到Taylor的文章,除了这两个apparatuses之外,在文末的附录里还介绍了实验中用于测量粘度和界面张力的两个仪器。测量粘度的仪器就是早期的旋转粘度计,而界面张力仪是在水中鼓油滴的形式:

测量界面张力

测量界面张力

这个方法到现在还在用。

† apparatus的复数到底是什么?很多人以为symposium复数是symposia、datum的复数是data,那apparatus的复数就是apparata。例如英语有把octopus的复数写成octopi。还有lamella复数是lamellae之类。事实上,拉丁语归拉丁语,从拉丁语借用过来的英语是英语不是拉丁语。如果按照拉丁语的规则,复数是不能乱弄的。例如英语的apparatus是来自拉丁语的apparātus,这是阳性主格形式。拉丁语一个词就有六种格和三种性别,共18个形式,每个形式自有一个复数。还有时态问题。而在英语里,由于apparatus不是人,单数就一律用apparatus了。所以到了英语这里首先就没必要较真原来拉丁语是怎么个复数法来显示自己很懂拉丁语了。在讲英语的时候故意把octopus的复数写成octopi就是英语人的hypercorrection,以为octopus既然是-us结尾那一定是拉丁的一个第二人称词。事实上octopus来自希腊语,如果按照本来复数应该是octopodes。但由于octopi在英语已经约定俗成了所以也写进英语词典了。中国人有时也会对英语进行hypercorrection,所以在语言学中“Chinglish”是个严肃的研究对象,到底随着中国人讲英语的增多,中国人所做的hypercorrection有没有融入现代英语。例如按语法xx的钥匙应该是the key TO xxx,所以明明本土英语是说the key for the office的,给中国人说多了就变成the key to the office了。

我阅读科研文献的一些做法

2014年11月6日按:本文发表至今已有3年多,当时我还只是个研究生,虽内容我仍然是承认的,但措辞有许多不当之处。但是到现在很多人还会从各种地方点击进入这里,于是我补充一些后来写的类似话题的文章,也许会有新的经验和体会,或者至少表述更好些。

以下是原文。

本文分三节,第1节主要是讲搜集文献的整体步骤,第2节主要讲具体得到一些Paper的资源,如何去整理,第3节是讲在查找和阅读文献时如何记笔记。以下的方法可能只适用于外文文献,因为我基本上不看中文的文献。中文期刊的编年惯例、CNKI和维普等数据库的功能等等都有些不一样。

1. 文献的“主流化”

刚开始读研究生,不管是导师给你的题目也好,自己上网看到的也好,一开始你手头上有的只是一两个代表着你兴趣点的关键词(Keywords)。也许如果题目是你自己找来的,你还会有少数几篇paper。

你现在的任务还不是决定你自己具体要解决什么问题,而是先了解这个小领域的研究历史,目标是从整个研究小史中看出大家为了理解这一问题都做过什么努力,现在到达了一个什么程度。只有在这个基础上,你所提出的新想法,你所做的贡献,才会“入流”,将来才会好发文章。所以,你必须要从几个关键词开始,最后获得大量文献。而且希望所找到的这些文献都是处于或围绕着该领域研究历史的主流的,而不是一些trivial的工作。以下是我的做法。

我的课题最初得到的关键词就是“物理凝胶化”,再加上从专业上讲,我是搞高分子的,凝胶又必定是高分子网络-小分子溶剂的二元体系,因此我要找的文献应该关于“高分子”、“溶液”和“物理凝胶化”。我一开始是在Google.com上搜索这几个关键词的。在此我先要讲讲我对搜索引擎的看法。

1.1 一般搜索引擎

很多同学用百度搜中文的东西,搜外文的东西也充其量用Google.cn(谷歌)。但根据我的使用经验,百度搜索技术十分差劲,或者说它对搜索结果进行了人为的调整,导致你无论搜索什么,所出来的东西离你真正想要的相差很远。Google.cn的搜索技术虽然基于Google,但由于中国审查和中国的营利模式的原因,其搜索结果也经过了人为的调整。在Google.com搜索中文和英文信息都令人满意,绝不会像某些同学所想象的那样,认为用英文的Google.com搜中文会有很多该搜到的搜不到——反倒百度会如此。在大多数的电脑上,键入www.google.com后自动会转入www.google.cn(谷歌),需要在页面下方点击“Google.com in English”才会进入真正的Google.com。使用英文的Google.com的另一个好处是,你能使用Google所开发的所有工具和功能,因为Google仅有部分工具进行了汉化并在Google.cn(谷歌)上发布。

1.2 搜索的技巧

关于Google搜索技巧的文章在网上有很多了,但是我看了都等于没看。除了用空格隔开关键词之外(大概是and的效果),我只懂用表示or的符号“|”,还有用双引号表示精确对应。再就是点开advanced options了,里面可以有更多的搜索选项。就算是这样,我都懒得用这么多技巧。

回到我自己的例子,我搜“physical gelation”,看看出来点什么结果;然后再搜“polymer physical gelation”、“polymer solution physical gelation”等等,换变换着关键词的组合,以刺激搜索引擎的智能,让它尽量给你新的东西。在搜索结果中会直接出现一些科研文献,甚至是pdf。但是从Google上搜到的这些文献往往是不太主流,但目前也只能先打开来看看了。通过看这些文献的Introduction部分,你会:

  • 知道更加相关或准确的关键词。然后回到Google.com搜出更加相关的paper
  • 通过Introduction中的讲述和引用,知道一些局部的研究历史,并得到主流的文献

不要急着看文献的Introduction的具体介绍,先尽量得出更多的关键词,穷尽Google.com所能得到的东西。直至最后其实关键词也无非那几个,在Google上,你已经无法获得什么新的东西了。这时,由于你毕竟浏览了好几篇paper的Intorduction,大概对本领域的以前研究有些模糊的印象。

1.3 科学研究工作的类型或地位

我又要暂时离开主线,单独讲讲另一个问题。因为和仅仅在Google上瞎搜索不同,接下来你将会找到大量的文献了,这时你需要对这些文献有所取舍。因此,最好脑中要对科学研究工作的类型或地位有清晰的认识。武夷山老师的博客里已经说过:

表现于理论,可以是提出新概念(可以是小概念)、发现新现象(可以是小现象)、引入新方法、构建新模型、改进旧模型,等等。表现在实证,可以是搜集新数据、从一个新的角度或采用新的方法去分析新数据或老数据、根据分析结果提出理论建议

以上引文我把最后四个字“政策建议”改为“理论建议”,因为我做的是基础研究,无非是就是在理论与实验之间倒腾。

1.4 Introduction+参考文献

现在回到我的例子,经过不断Google,我已经搜到的一些Paper。现在的任务就是按年代往前搜索文献。现在,通过手头上有的Paper的Introduction部分,会得到一些参考文献,这些参考文献的Introdcution又会提供更多的参考文献。在一开始,这样的搜寻方式会导致你的文献数量以几何方式增加。而且,尽管我清楚要进行取舍,但在我对这一领域还很模糊的情况下,我基本上没有怎么去“舍”。但是,还是有几个原则要记住:

  • 任何一篇文章的Introduction部分,都可以分成两部分,第一部分就是吹大牛,第二部分就是具体到本文的方法、材料和元素的具体介绍。“吹大牛”部分所引用文献一般都比较重要比较主流的文献,但是第二部分在讲具体方法具体材料时的所引用的文献,就要看情况了。如果这篇文章所用的方法、材料等等是本领域经常用到的主流,那么这部份所引用的文献也是需要看的;如果这篇文章所用的方法、材料等等在本领域来说是很次要的,完全是补充性的,甚至是没事找事的,那你就不用管它引用的参考文献了。不过,也许在一开始你连这个问题都判断不了,那就只能照单全收了。
  • 这一阶段的目标是尽量找到最老、最原始的那些研究。因此如果你想减轻你的负担的话,可以在年份上跳跃一下。比如,如果一下子找到了20年前的一篇paper,那么这十年间的paper的introduction就可以都不看了,直接从20年前的那篇paper的introduction开始,重新向更早扩展。这十年间你所跳过的paper,将来有机会找到的。

1.5 ISI Web of Knowledge

ISI Web of Knowledge(下简称ISI)的用处有两个方面:

  • 在上面按topic搜你的关键词,可以找到更多相关的文献,其意义上面已意讲过了,前面讲过的搜索的技巧此处也适用的
  • 在上面搜某一特定的paper,可以查到这篇文章发表之后的被引用情况

要在ISI上查某特定的文章,可以直接按title搜标题,也可以通过期刊名、发表年份和作者结合起来找。值得注意的是,由于具体单位购买权限的不同,你上的ISI收录的文章有可能是不全的,例如Macromolecules只从九十年代之后开始收,而且每一期都不是全收。所以就算搜索得当,也不一定就能搜出实际存在的文献,尤其是比较七十年代以前的。刚才我说过,通过paper的introduction引用文献,不断在年份上进行回溯,目的是为了找出整个研究历史主线上的研究工作。其基本意图就是搜出少数年代久,但是比较重要比较核心的经典paper。然后,就要通过ISI,找到引用这些主流而且经典paper的文献记录,并进一步查找引用这篇老文献的文献列表。根据这些文献的标题,你就可以选出一些比较主流的文章来,这样就能从老到新地回到研究历史的主线上来。但是由于刚才说了ISI不收很老的文章,所以你不要等到回溯到五六十年代之后才用ISI,而是到了七八时年代就先用ISI查找一下引用情况,部分回到主线中来,然后再利用从ISI找到的这些比较接近主线的文章往早期回溯,找到更加主流的经典paper。
有一些比较老的文献如果ISI没有收,那就可以看看该文献的期刊所属的出版商网站上的这篇文章的页面。现有一些大的出版商网站,每一篇文章的页面都会自动显示被引文章。

1.6 要多次反复

所谓要多次反复,就是说你查到一定的文献,就可以先认真阅读了。阅读的时候按年份从早到晚的顺序。在阅读的过程中,你会:

  • 对本领域的基本问题更加清晰
  • 发现本领域内一些贡献比较大的牛人
  • 发现很多该找到的文献之前没找到

这样,不管是哪个原因,你都会觉得你又必要再花时间去搜集文献,走回刚才所讲的步骤。一直到最后,你就会发现这个领域从最开始一直到现在的整个脉络的文献你基本上都有了。

2. 查找Paper的资源

上一节说的是一般的步骤,在这些步骤中所遇到的一个具体问题是:

  • 根据paper的什么信息,如何搞到该paper的全文
  • paper多起来了怎么去有序地整理

2.1 大量文献的管理

几百上千篇的paper,怎么去整理呢?这就一定要使用文献整理器的软件。现在主流的文献管理器软件基本功能都差不多,也足够了。我就以EndNote为例。安装EndNote,事实上就是安装了一个数据库。从数据库的角度上说,所有不同领域不同主题的文献,理论上用一个库就可以搞定。领域上的差别可以利用每条信息项的属性进行区分和检索。但是,有一条原则是,从大量信息中查找特定的子集,最好能不用Search就不用Search,因为Search的精确查找方式太笨;模糊查找方式又怕还是有些该找到的找不到。所以,比较满意的方法是够按一定的排序方式排序,然后人工按照顺序往下检。这样的话想找到什么就必能找到什么了。但这种方式不允许总信息量太大。所以不要试图把你有生以来所做过的课题所有文献都用一个数据库来管理,而是应该按照课题所涉集的领域,分开不同的库来管理。不过,分得太细也不好,相关的领域,或者说思维方式一致,在你脑中有某种统一性的领域,不要分开不同的库。不要造成你研究一个问题需要在好几个数据库文件切换的这种状况。

用数据库的另一个好处是,当你已经有很多文献了,遇到一个新文献,你怎么知道这篇文章你有了没有呢?通过数据库一查就能查到。

我做的课题是高分子凝胶化过程的非线性流变学研究,因此,关于高分子凝胶化的文献要看,非线性流变学的研究要看。此外我具体采用的化学体系是聚丙烯酸,因此关于聚丙烯酸乃至聚电解质的理论和实验方面的文献也要看。我把凝胶化和非线性流变学的文献用一个数据库管理,把聚丙烯酸方面的文献用另一个数据库来管理。在EndNote中,同一个数据库下面还可以建立群组(Groups),你可以按需要建一些群组。

要在数据库中录入文献,可以通过导入功能。现在各大文献数据库中,查到的paper页面都支持导出成RIS或者EndNote的格式,EndNote、Reference Manager还有Note Express等软件也都兼容导入多种格式。所以,查到的paper点一下导出,在EndNote里点一下导入,文献的标题啊作者啊之类的信息都不用自己输入了,很多时候连Abstract也自动导入。只有少数文献数据库不支持导入功能,那就要自己输入一下。

至于文献的PDF文件,存在一个“文件名”的问题。很多同学都用文献的一长串标题来作为文件名。如果PDF文件多起来了,就多搞几个目录。总之他们好像要求自己起码要记得自己都有什么文献。我往往一个课题的文献阅读所涉及到的文献数量是上千的,我不可能知道事先我都有什么文献,它是什么文件名,放在哪个目录,所以我是这么做的:刚才说了,我的数据库是按领域来分的,于是在我电脑上我也建一个相同领域的目录,相应的数据库文件放在该目录下面,所有该领域的PDF也都放在这个目录下面。这样一来,某一个目录下的那个数据库文件里的paper的pdf文件就在同一目录下面找。其次,我的PDF文件名是按照“期刊名缩写 卷 首页.pdf”这样的形式取的。例如Chem. Mater. xx xxxx.pdf或者ACIE xx xxxx.pdf(ACIE是德国应化,正确缩写是Angew. Chem. Int. Ed.,还是嫌太长,干脆ACIE,美国化学学会很多人也是用JACS的。但是不要全都这样搞,以防将来自己都不知道是啥)。这样的话,我在EndNote里看到哪篇文献的标题或者作者,想看全文,就只要在该数据库文件所在目录,按文件名一排序,按照EndNote里所指示的该文献的期刊、卷和首页信息,就能找到相应的PDF文件了,就算pdf文件再多,按文件名排个序,拉一下滚动条,也是一秒钟都不到的事情。

此外,不一定所有搜到的文献都要下载PDF文件,有时只要把信息导入数据库就行了,尤其是当你很怀疑这篇文章的价值的时候。等到阅读文献的时候,随着你宏观认识的加深,很多你当初搜集到的文献这时会觉得没必要看。真有什么有必要看的文献没下载到PDF,根据上述的整理方法你也很容易发现,到时再下也很方便。也有的时候,有些paper中引用的参考文献感觉好像很有信息量,谁知一搜,看了一下标题,发现原来毫不相关。这时就连导入都懒得导。

2.2 找不到全文咋办

我目前能想到的情况有以下:

    1. 不知道期刊缩写的全称/在网上找不到相应的期刊
    2. 找到相应的期刊了,但手头上的文献信息有误,没有这一年/卷/页的文章
    3. 在网上找到这篇文章了,但是所在单位没有购买,没有权限

有很多期刊在它发展的过程中名字就改来改去。欧洲在一体化过程中很多期刊都进行了合并。所以有很多年代比较久远的文献,它按当时的期刊名字来引用它的参考文献,你在今天就不一定能直接找到。因此,平时除了看文献之外,还要对本领域期刊的发展历史进行研究。我一直想写一下我这个领域中我所知道的一些期刊的发展史,但是后来发现近年来至少很多知名出版商的网站都对自己旗下的期刊的历史进行了比较清晰的说明,这个念头就没什么意义了。我建议大家根据自己的领域都相应了解一下,不光了解更名的历史,还了解一下各任主编(Editor in Chief)的历史,这些主编很多都是一定时期的牛人,知道他们名字之后,还可以Google一下,上Wikipedia.org搜一下,看看他们的传记,和发表的重要文章。

扯远了。回到主题上来,问题是我们事先只知道一个过时的刊名,怎么知道它今天什么名字,在哪个数据库呢?这时就要靠Google(本文提到Google,都指英文Google.com,理由前文已经说过了)。在Google上,键入期刊的缩写,运气好的话就能在一些搜索结果中直接看到这串缩写所代表的全名。再改用全名搜索,就能了解一下这个名字的期刊的信息,它是什么候用这个名字的,现在用什么名字,在哪个数据库。如果知道了期刊全名,除了在Google搜索之外,还要向大家推荐一个网站JournalSeek。在JournalSeek上面搜索期刊的全名,就能直接看到该期刊的信息,尤其是它目前是哪个数据库旗下的,网址等等。如果该期刊没有网络电子版,JournalSeek也会告诉你。依我的经验,JournalSeek说没有电子版的,就真的没有;JournalSeek所提供的网址,也基本上是对的。因此JournalSeek还是比较权威的,可以说是童叟无欺。

JournalSeek上面不能直接输入期刊缩写来搜索。因此如果直接在Google输入期刊缩写,看不到全名的话,就要使用进一步的技巧了。在这里我顺便讲一下,期刊全名的缩写其实是有规则的。例如,Journal of Material Chemistry的缩写之所以是J. Mater. Chem.,而不是JOMC,或者J. M. C.或者J. Mat. Ch.等等,并不是由RSC或者该期刊自己决定,而是遵循着一个标准。这个标准就是ISO 4。至于具体的期刊缩写和全名对照表,在ISSN的官网上提供了一个按照ISO 4的列表The List of Title Word Abbreviations (LTWA),以下是其他期刊缩写的强大资源:

如果遇到很老的化学期刊,这些期刊现在已经不存在了,有可能上面的资源会找不到。化学领域的,还可以看这篇1937年的文章:Annu. Rep. Prog. Chem., 1937, 34, 535-540。这篇文章里提供了很多古老偏门化学期刊的缩写和全名。

以上主要是解决找不到文献的第一种情况。对于第二种情况,即“找到相应的期刊了,但手头上的文献信息有误,没有这一年/卷/页的文章”。那就要继续努力了。一般来说,文献中引用一个参考文献的方式至少包含以下几个信息:作者、期刊名缩写或全名、年、卷(volume)、期(issue or number)、页码。最容易出错的就是卷、期、页码。页码打错一个数字就让人很郁闷了,卷和期也会经常错调。但是,年份和作者一般是不会搞错的。如果已经找到了相应的期刊网址,那么搜索年份和其中一些,作者名,看看这一年,这个作者在这个期刊上都发表了哪些文章,从中看一下哪一条比较像你所要的那篇,就能找到,而且还能发现卷期页的错误在哪里。如果搜不到,有可能是这个网站的搜索功能比较烂,也有可能是人名的搜索规则不对。换几个作者名,或者只打姓不打名,缩写不要加句点等等,反复多试几次。如果还不行,那就只能人工浏览这一年这个期刊每一期的文章了,如果这个期刊不会像现在的J. Appl. Polym. Sci.这么变态的话,浏览一整年的文章工作量不会太大的。尤其是年代久远的时候,那时一年世界上的发表文章都比今天要少得多。如果年代不很久远,可以不用该期刊所在的网站的搜索功能,试试ISI Web of Knowledge,因为ISI的人名搜索规范比较名确,该搜出来的基本上都能搜出来,只要ISI收了这篇文章的话。另外,不要忘了Google,很多数据库的搜索智能还比不上Google。如果各种方法都不行,那就没撤了。也别介意,如果你要找的这篇文章真的比较重要的话,也不止一篇文章会引用它。这篇引用错了,还会遇到下一篇去引用的,不可能所有人引用它都是错的(有时候好几篇都是用错的引用,你看看这几篇文章是不是同一个课题组发的)。如果你发现不同课题组,发的不同的文章,都同时用错的方法引用一篇文章,那很可能就说明根本没错,也许是你把期刊搞错了。那就要根据上面说的资源,重新搞清楚期刊的全名。

最后,就是没有权限的问题。没有电子版的权限,那就看你所在单位的图书馆。图书馆的外刊室有收有很多期刊,很古老的都有,问题是经常中间有缺卷缺期。因此,要充分利用图书馆网站的检索功能,看看馆藏的具体情况,把所要找的期刊的架号,卷页等信息记在小本子上,再跑一趟图书馆,省得白跑,跑一次图书馆很累的。在图书馆里就可以复印,不用外借。如果你所在的图书馆没有收藏你需要的期刊,或者缺卷缺期,那就要通过图书馆的跨馆索取服务了。图书馆的跨馆索取服务应该是有专门的办公室和职员的,他会联系国内的其他图书馆,哪里有就向哪里求。对方图书馆会帮你扫描成PDF,发回到你单位图书馆,你就拿个U盘去拷。跨馆一般费用比较贵,按页收费,一般每页要一块钱。一篇paper如果十页的话就要十块钱了。因此如果是跨馆的话,你就要尽量利用期刊网站,看清楚该文章的Abstract,真的需要,再去求。求的时候,也要求尽量把文献的详细信息确认好,一旦求错了,文章不对,你单位图书馆是不会帮你垫这笔费用的。在跨馆求文献之前,也可以先自己看一下中国有没有——跨馆职员一般首先是利用中科院国家科学数字图书馆的联合编目服务系统来查找哪个图书馆有你要的文献的。你也可以上这个系统:全国期刊联合目录。具体的跨馆查询业务情况,大家可以咨询自己所在单位的图书馆。很多图书馆还可以到国外跨馆查,价格当然不菲,我就没试过。一方面,一两篇文献不看不会严重影响你对一个领域的认识;另一方面,如果这篇文章这么难被查到,一般它里面的工作或内容后来会在另一篇更好查到的更著名的期刊里发表,无论是该研究者自己一稿多投也好,还是其他的研究者在不知情的情况下再次发表同样的工作也好。

只有纸版的文献,要自己把标题等信息输入到文献数据库里,而且文献还要用对应的文件夹整理好,首先按年份排好,其次依次按期刊名和页码排好,方便查阅!

3 关于阅读文献

文献查了是要看的。本节主要解释查到了成百上千的文献,怎么个看法。首先当然是进入你的文献管理器的相关数据库,然后按年份排序,从最早的一篇文献开始,看标题、期刊名和卷页,找到相应的PDF文件。你会遇到以下的问题。

3.1 精读、略读和不读

当你面对几百篇文献,怎么去精读略读呢?这就要依靠你在查阅他们的时候所建立的宏观认识了。在查阅文献的时候,你看了大量的Introduction。而且你在“文献主流化”任务的时候,经过了多次主流化的反复,所以你才具有了宏观的认识。什么样的宏观认识呢?

  • 本领域最初是要解决哪些基本问题?后来随着认识的深入,原来的问题又转化成了什么新问题?目前大家主要想解决什么问题?
  • 对于各个问题,理论方面提出过哪些模型?实验上主要有哪些方法?

对以上问题,应该只是模糊的认识,或者只能具备一些关键词。但足以使你判断哪篇文章有利于回答上述问题,哪些文章是主流,哪些文章不主流了。主流文章要读,不主流的文章不是略读,而是不读。

在阅读文献的时候,你的任务就是要具体回答上面提出的宏观问题,将来写综述是要站在那样的高度去写的。但与此同时,你还要完成知识积累的任务,那就是本领域所涉及到的具体知识,基本概念基本原理等等,在阅读文献的过程中要建立起来。这些具体知识包括一些专门提出的名词概念,本领域经常用到的理论方法(包括数学)和实验方法(包括合成和表征的方法及其原理)等等。因此,凡是包含这些知识的文献,你都要看。当然,还是那句,主流的知识要精读,非主流的就直接不读。

那么,什么时候略读呢?这里说的略读其实应该叫做“扫描”或者“一目十行”。在文献数据库的列表里你只能看到文章的标题,根据标题去判断这篇文章主不主流,或者猜测里面会不会包含有用的知识。为了保险起见,你会尽量猜测它“有”。但还是要打开PDF文件之后才能知道它到底是有还是没有。这时就要扫描了。阅读英语要具备有一目十行,迅速定位的能力。就我个人而言,我的英语阅读能力是比较奇怪的。读New York Times之类的文章速度很慢,但是看Paper就很快,甚至比看中文还快。现在我看中文的科技文献会觉得看不懂。通常一篇非主流的,“没用”的文献,扫一下就能看出来了。当然是先扫Abstract如果有些文章的Abstract只讲了它做了什么,没讲结果或结论,那就直接找Conclusion。如果是Communication,既没有Abstract又没有Conclusion,那就比较郁闷,就要在正文的第一自然段或者第二自然段找类似“Here, …”“In this papaer, …”“In the following …”之类的句子,起码看看这篇文章的意图。如果以上扫描发现这篇文章“还有点意思”,那就扫一下结果讨论部分,看看都有什么图,什么结果,慢慢地具体精读。

可见,自己看paper看多了,就会理解审稿人是怎么审稿的。Abstract回答不了问题,Conclusion又回答不了问题,Intorduction又写得很烂,审稿人就会非常抓狂。很多同学写出来的文章给我改,就让我有抓狂的感觉,语法错误倒是很次要的事情。这就扯远了。

3.2 记笔记的方法

成百上篇的文献,就算非主流的统统不读,还是要读很多篇,读了都怎么记住呢?一定要记笔记。要正而八经地准备一本又大又厚的笔记本。而且对笔记本的使用也要系统化。

做一个课题,你可能要阅读不止一个领域的文献(也就是不止一个数据库)。比如我,就既要看聚丙烯酸、聚电解质方面,又要看凝胶化和流变方面,涉及到两个数据库。同时,我还要看书学习张量分析,看书也要记笔记。如何用一本笔记本,记三个领域的东西呢?很多同学就把笔记本分成三部分,第二和第三部分是从中间记起的。但是由于你不能预计每个部分的用量,以及你看每一部分所花的时间,因此总会有一部分记得特别多,把笔记本的其中三分之一用完了,另外的两个三分之一还有很多空白。这样的使用方法非常不科学!我的做法,可以在笔记本上从头记到尾,三个部分的笔记在空间上没有区分开,但是在逻辑上是区分开的,一直记到笔记本的最后一页。

首先,笔记本的开头两页留出来,用作目录用。从第三页开始,你就记某一方面的笔记。例如,恰好我是先看流变学方面的文献的,于是第三页开始记流变学方面的笔记,在该页写一个类似“流变学笔记”之类的几个大字以示开始,并在页边角上编上页码“1”,以后你每写到新的一页,都顺便给该页编上页码。现在,笔记本开头用作目录的那一页就可以写上“流变学笔记——1”了。如果我看了几天流变学,笔记记到了第14页,这时我又看聚电解质方面的文献,那就从第15页开始,写上“聚电解质笔记”几个大字,直接开始记,同时笔记本开头的目录就可以加上“聚电解质笔记——15”。别忘了在第14页末尾加上“下转 页”的字样,“页”字之前留个空白。将来如果我又回头看流变学的文献,但是聚电解质的笔记记到了第41页,那就在第42页开头写上“上接第14页”,接着就直接记流变学的笔记,同时别忘了在第14页末尾的“页”字之前的空白填上“42”。按照以上的方法,你可以爱看什么文献就记什么笔记,而每一个方面的笔记都可以从笔记本的目录找到起始页,通过“下转”“上接”的方式形成连续的整体。这样就算你有十个方面不同的笔记都可以在一个笔记本里搞定。一个笔记本写完了,就换一个新的笔记本,给笔记本编上号“笔记本1”“笔记本2”,老笔记本上每个方面的笔记的“下转”“上接”只要加上新笔记本的编号就行了。

3.3 笔记的内容

按照数据库年份升序看文章时,如果遇到“不读”的文章,或者没有什么需要记笔记的文章,一定要在数据库相应的记录上做点记号。一般文献数据库的记录都有一些用户自定义的属性,要利用一个属性来作为自己的“备注”,专门用来表示该篇文章的阅读情况。“不读”的文章,就在“备注”里打个“x”。以下的内容也将会利用到这个“备注”属性,所以下面提到“备注栏”,都是指你自己找的一个自定义属性作为自己的备注栏,而不是说文献管理软件本身就有一个叫“备注”的属性!

如果看到一篇文章有需要记笔记,而且根据备注得知该篇文章没有看过(备注栏是空白),那就先在笔记本上写上这篇文章的期刊名缩写、卷、页、还有年份(年份就算是多余的不能省略,有用的),然后才把你关心的内容记一下,至于你要关心什么内容,上面已经说过了。

在记笔记的时候要注意,如果有些论断不是文章作者自己说的,而是有参考文献,那就不要把这些论断记为这篇文章的笔记,而是把它的参考文献记下来。每篇文章只记下这篇文章原创的东西。将来你写综述的时候,是要以你的笔记本为蓝本的,你的笔记本上记的最好全是原始论断,这样你将来写综述的时候,对某一论断的引述,所引用的文献就是原始的,不会出现“转引”、“转述”等很不professional、很低俗的情况。

每篇文章的笔记记完之后,要记得在文献数据库相应记录的“备注”栏中记上这篇文章的笔记开头所处于的页码。这样的好处是将来你任何时候在文献数据库上找到这条记录,你就会知道这篇文章你看过,记过笔记,页码是多少,马上就能翻到你当初记的笔记。如果你在日后觉得你以前看这篇文章的时候笔记记得不够,重新看了这篇文章有新的认识需要记,那就找回当初的笔记,在该篇文献笔记的末尾加上“下转xx页”,然后在本大方面的笔记的最后,重新把这篇文献的期刊名、卷、首页和年份写一遍,就好像开头一样,但是后面加上“上接xx页”,表示这并不是该篇文献的笔记的开头。这样,每当你看篇文献的最初笔记的时候,绝不会漏掉日后新加的笔记。如果翻到日后新加的那一页,也会知道这不是最开头。总之,要善于利用“下转”“上接”功能!

在看文献的时候有时又会遇到有新的文献要查找。这时,如果不急的话,就先把引用的文献记下来,到一定程度了再花专门的时间查找。引用的文献信息也可以记在笔记本上,随时遇到有,就在当前页的空白处划上一条竖线,在竖线右边临时记这些引用文献信息,左边作为笔记正文照写不误。但是这个左右之分要一贯。如果待查文献积累到一定程度,你集中进行了查找、下载、导入信息,那么文献数据库里就会有新的记录了。比如,我好容易从1950年代看到了1980年代,在此过程中又积类了很多待查文献,查完之后,从1940年到1980年代都有新的没有看过的文章。那就再按年份排序,看备注栏:凡是备注栏空白的,说明这篇是没看过的文献;打x的是看过了觉得没用的文献;有一个数字的是看过且记了笔记的文献,数字是笔记页码。没看过的文献接着记笔记,登记页码就是了。在笔记本上是不用按年份记笔记的,看到哪一篇就记哪一篇的笔记。

3.4 如何利用你的笔记写综述

如果所有的文献都看完了,也没有新的文献需要查找了,你就可以开始写一篇本领域的综述了。因为你已经可以回答(上面讲过了,这里再列一遍):

  • 本领域最初是要解决哪些基本问题?后来随着认识的深入,原来的问题又转化成了什么新问题?目前大家主要想解决什么问题?
  • 对于各个问题,理论方面提出过哪些模型?实验上主要有哪些方法?
  • 专门提出的名词概念,本领域经常用到的理论方法(包括数学)和实验方法(包括合成和表征的方法及其原理)等等

你可以按照大致的研究历史,或者理论和实验分开,或者按照不同的问题,先列一个综述的提纲。然后根据你的提纲的每一部分的焦点,翻你的笔记。笔记中的每一篇文章,它是属于提纲的哪一部分的,都做个记号。以我的课题为例,理论方面,主要有两种理论,实验方法上又有三种。那么在笔记上涉及到理论1的就写个“理论1”,同时在文献管理器的再加一个备注栏(例如“备注2”)里输入“理论1”,涉及到实验3的就在笔记上写个“实验3”,同时也在文献管理软件中类似地记上。这时,只要在文献管理软件中先按“备注2”排序,再按“年份”排升序,那么你综述提纲的每一部分所涉及到的文章就分别按年份汇总了,而且在备注1中还显示了在笔记本上的相应页码,你就对着这些页码翻你的笔记本复习就行了,边复习就可以边打你的综述草稿,边打就可以边形成综述的“参考文献”列表。各大文献管理软件都支持在Word编辑的实时智能形成“参考文献”列表,以一定的格式,又不重复。就算你的综述有上千篇参考文献,都可以做到有条不紊,而且就算你从综述的中间部分开始写起,最后写完之后,参考文献的序号也能从[1]开始,不会说一开头引用的就是[328]号,[1]号在第4.3.5节的第8行出现这样。

我为什么会想到这样做

以上已经把我能想到的都说完了。现在我简单解释一下我为什么会想到这样做。当我看到别人的好法的时候就会反思我自己为什么想不到。因为我坚信人与人之间的IQ是相等的,所以别人想到我想不到一定是其他后天的原因。因此,当我自己介绍我的想法的时候也会连带把我为什么想到也介绍了,以供其他跟我有相同想法的人参考。

我所具有的思想一个是数据库的思想,另一个是电脑编程的思想。我曾经学习过数据库和电脑编程。数据库方面,对于不同的“表”之间的“关系”,以及为了防止重复错漏所提出的“第一范式”“第二范式”等等,其实都是很好的具有普遍意义的思想,我搜集和整理文献的时候,就非常强调文献管理软件的信息记录、PDF文件、纸版文献以及笔记之间的一一对应关系,把维护的工作放在平时、放在每一条新记录的下载、导入和添加上。而且,数据库的“表”的“属性”也可以根据你将来检索的需要来进行设计,例如我会想到新增两个“备注”栏来方便文献的整理。数据库编程的经历,也使我喜欢排序和枚举,不喜欢搜索(即SQL语言的Select语句),其实这在编程上是错误的,枚举极为耗时!但是如我文中说了,现成的文献管理软件的Search功能远不及真正的Select语句那样可靠,在记录不太多的情况下,人工枚举反而可行。而关于写程序方面,不管学习什么语言,都要熟悉循环分支结构,以及模块化的思想,这就是为什么我一本笔记本记好几方面的文献,利用“下转”“上接”来实现一本笔记本从头写到尾。

一定要提高获取信息的能力

不管是不是做科研,无论在各行各业,具备“获取信息的能力”是非常吃香的。我就经常发现很多同学想了解一个问题,搜来搜去搜不出什么资料来。有些小事,就搜一下的工夫,别人跟我说“搜不到啊”,我一搜,就搜到了。这其中的主要差别是:他们用百度,我用英文Google.com(搜中文的也一样);还有,他们不搜英文资料,我搜。所以我很注意一个中文的关键词,英语怎么说,怎么搜。这也同时是积累日常英语知识的方法。遇到这种情况,不要去查你的文曲星或者金山词霸的汉英词典,文曲星的这方面功能非常烂,50%的情况是误导人,金山词霸好一些。还是相信Google吧!Google Translate的中译英可以简单地解决问题,它的译义都是可以经全体网友审改的。第二个方法就是在Google.com上查找访中文词汇有没有Wikipedia.org的中文词条,例如在Google上搜“高分子 Wikipedia”,就会出现“高分子物理学- 维基百科,自由的百科全书”这一个搜索结果,点进去就是Wikipedia.org的相应中文词条页面,在页面的右边有语言列表,点English就会进入相应的英文词条,知道这个中文名词英语怎么说了。Wikipedia.org只存在英语词条没有中文版的情况,不存在中文词条没有英文版的情况。如果Wikipedia.org没有所要找的中文词条,那还是可以在Google上直接搜,例如搜“琥珀酸 英语|英文 怎么说”,你就会搜到“琥珀酸酯”的单词是succinate,那么根据有机化合物的英语命名规则,琥珀酸就可能是Succinoic acid,但你怕具体拼写有误,那就大可以在Google.com上搜“succinoic acid”,Google会有自动纠正拼写错误的功能的。同时,经常出现在英文搜索结果最前面的会是Wikipedia.org的相应词条,你顺便就能点入succinic acid的Wikipedia.org词条里,什么信息都有了!英语信息比中文信息丰富多了,尤其是学术和专业信息。因为外国很多教授和老师都喜欢自己做的网页。平时上网不要整天上youku.com看电影啊之类的!随便找几个关键词,先译成英语,再Google一下,就有很多有趣的东西可看。就算看视频玩,也多上上youtube.com,体会一下西方人的草根文化和西方人的幽默感。将来自己做了导师了,出国参加seminar什么的,也能在洋鬼子堆里混得开。

就算你将来是去企业工作,中国企业的特点就是不搞研发,不培训,也不建立技术档案,以为招几个高学历的就可以。因此这些企业遇到什么专业问题,就会找你这个“研究生”高学历人才来解决。但是你离开学校了,上不了文献数据库,光靠公网上的现成信息如何认识问题和解决实际问题呢?这时候,谁获取信息的能力强,谁就是赢家。经常有出去工作了的朋友,在qq上问我一个专业问题。我叫他Google一下,他说百度过了。正式叫他Google一下,一会儿他说还是找不到(也不知道他是用的谷歌还是google.com)。由于这个问题我也不懂,我也Google一下,往往却能找到很多信息,把网址发给他,他说:“英语的,看不懂!”其实,获取信息的能力当然不止以上所说的在网上Google一下,Google谁都懂,能Google到的东西都不会是什么难找的东西。关键是你在获取信息上要具有不折不挠的精神,同时要注意积少成多。其次,如果说不同的人用google水平有所不同,那也不会是技巧上的差异。上述的技巧,用多了谁都能形成。真正的差异是在于英语,尤其是快速阅读的能力、长时间扫描式阅读的耐心、以及根据每一次的搜索结果来把握信息的位置,不断变化和收窄搜索条件的那种“第六感”。

结论

一、许多人认为学生就写不出真正的综述来,但这些人同时又清楚,Chemical Reviews上面发表的权威综述,作者署了两个的,非通讯作者的那个人多数是通讯作者的PhD candidate。这说明,博士生写出好的综述不是不可能的。也不要神化国外读书的效果,我认为我在国内也不是很落后。做研究生,要有自己当自己导师的勇气,要假定将来自己也要当导师,当职业科学家,要了解职业科学家如何生存,如何想问题,要了解牛人本质上牛在哪儿,为什么能这么牛。学生写不了综述,但你不可能永远是学生撒!为什么有一天你就变成了“老师”了,你就突然“能写综述”了呢?不写永远不知道自己写得有多差,也就永远提高不了。等你当了导师才写,写出来很差你也不知道,没人理你。只有在当你是学生,有个导师的时候就写,才会有你的导师告诉你写得很差,差在什么地方,叫你重写!何毓琦老师某一篇博文里讲到过,博导指导学生就是要把学生指导成导师,而不是把学生指导成“博士毕业生”。但是我国大多数博导的目标是把学生指导成“博士毕业生”。我的导师除外。这就是为什么我强调研究生要有自己当自己导师的勇气,要假定将来自己也要当导师。不管你现在的导师好不好,靠自己才是最可靠的。

二、不要抗拒英语。用英文版的Windows,英文版的软件。看英文版的教科书,用英文记笔记、写实验记录、博客,跟外国研究生和老师交朋友和交流,了解西方文化,参与全球科研社区的讨论。因此,我也就杜绝了使用百度或者中文谷歌,远离了网络病毒和恶意软件。我的WinXP基本上不重装,还很清爽(当然这也跟我使用上的其他技巧有关)。有很多同学老是要重装系统,浪费不少时间。就算是Ghost,ghost来ghost去也根除不了系统不稳定的根源问题,这里就不扯远了。

三、武夷山老师的博文里讲到的一句话,也可以作为本文的结论之一:

  • 要无比重视查阅文献
  • 研究生们千万不要嫌搜集数据过程(或实验过程)繁琐、累人

本文至少体现了我个人的重视程度。另外,本文也意在以一个学生的角度,切实地就“2009年的研究生如何利用2009年的资源和手段”进行交流。技术发展是很快的,互联网不断涌现出新的工具,使得我们得以重新定义日常的workflow。

四、要提高获取信息的能力!