Category Archives: 关于科研的文章

汤森路透的年度报告

今天看了好几个Thomson Reuters的2014年总结或盘点。

首先是Research Fronts 2014报告。原来这个总结的数据分析是由我国科学院文献情报中心做的。

所谓Research Fronts,是先识别出近五年内引用率最高的论文(高引用率论文highly cited papers的选取另有方法,此略),然后找出这些论文中经常被同时引用的组合。本身是高引用率的文章,又经常被一起引用,说明就是一个研究方向中的重要论文(core papers),它们的集合也定义了一个研究前沿(research front)。一个research front的core papers数量和总被引数量可以表征这个research fronts的规模;平均每篇core paper被引数可以表征这个research front的被关注程度;core papers的平均发表年份及其分布可以表征这个research front的“热度”,即这个前沿增长多快,有多近期;总结这些core paper中出现率最高的keywords,可以定义出这个research front的内容。

Research Front 2014报告,是先将21个ESI领域的9700个research fronts划分成十个研究领域,然后按照总引用数,把每个研究领域中前10%的research fronts选出来。在这10%中,重新按这些research fronts的core papers发表的平均年份来排序(core papers集中在越近年的,就认为相应的research front越Hot),选出前十名的research fronts,总结在报告里。这些被选出来的被称为Hot Research Fronts。另外,报告还选出Emerging Research Fronts,即core papers平均发表年份在2012年下半年以后(>2012.5)的research fronts才被考虑,然后按总引用率排序,选出总引用数超过100的有44个research fronts,作为Emerging Research Fronts。这个排序是跨越所有十个研究领域的,所以有的领域的Emerging Research Fronts很多,有的领域一个都没有。Hot Research Fronts每个研究领域有10个,十个研究领域加起来有100个,再加上44个Emerging Research Fronts,这个报告一共选出了144个research fronts。中国科学院文献情报中心进一步在这144个research fronts中选出19个Key Research Fronts,选取的指标叫CPT,即考虑了core papers的被引用数(C)、core papers的篇数(P)以及引用了core papers的文章年份范围(T),构造成CPT = ((C/P)/T)这个比例。C/P其实就是平均每篇core paper的被引用数,用这个再除以T,就表示这些引用在年份上的集中程度。按照报告的原话就是,“it measures how extensive and immediate a research front is”。

在十个领域中,我主要关注的是Chemistry and Materials Science和Physics。首先是Chemistry and Materials Science的结果:

Hot Research Fronts in Chemistry and Materials Science

Hot Research Fronts in Chemistry and Materials Science

其中灰色高亮的是Key Research Fronts,即Functional metal organic frameworks。在研究功能MOFs的国家中,中国排第三,前两位是美国和韩国。如果按研究机构来排序,浙江大学与其他12所机构并列第1。MOFs前沿的8篇core papers,分别由8位通讯作者发表,其有中国浙江大学的钱国栋(Qian, GD),贡献了1篇core paper。按citing paper来排序(即引用了core papers的论文数量),中国排名第1,占49.0%。也就是说,这8篇core paper,近半是中国人引用的,引用机构排序中,中科院排第1,南京大学排第2,南开大学和吉林大学排第4(3个机构并列),浙江大学排第7,北京化工大学排第10(2个机构并列)。

由于core paper和research fronts本来就是根据引用率和共同引用率来选出的,MOFs领域能够跻身Hot Research Fronts乃至Key Research Fronts,很明显就是我们国家的研究者“自给自足”、“自力更生”的成果。相比之下,我们应该更愿意看到,由中国人贡献的core paper,主要被国外机构引用,这才显示,我们并非靠举国体制和人口优势把本来只是“自娱自乐”的课题推为“世界第一”(最后变成类似乒乓球运动的境地),而是真正的融入了世界科学界共同关注的研究领域当中去。

除了MOFs,10个Hot Research Fronts中,graphene出现了3个。跟高分子有关的只有一个,是高分子半导体和光伏器件的研究。

化学与材料科学领域还有14个Emerging Research Fronts,是十个领域中Emerging Research Fronts最多的领域:

Emerging Research Fronts in Chemistry and Materials Science

Emerging Research Fronts in Chemistry and Materials Science

报告选择了第一个Polymer solar cells with enhanced power-conversion efficiency进行了评述。事实上第3个Bulk heterojunction polymer solar cells、第12个High performance perrovskite-sensitized solar cells也是相近的研究方向。这些方向也已经是所有跟聚合物有关的Emerging Research Fronts了。在评述中,提到了华南理工大学的吴宏滨设计的反转结构器件,光电转换效率达到了9.2%(10%是商业化的门槛),最新的纪录已经被UCLA刷新到了11.55%(2014年7月)。

接下来是Physics领域的情况。Key Research Fronts当然就是Higgs子的研究了,尽管只有区区2篇core papers,分别由ATLAS和CMS。在这一领域中,中国在top countries中名列第7,机构是中科院,排第4。Thomson Reuters的统计没办法区分中科院下面的分所。

Hot Research Front中属于凝聚态物理的,主要都是高温超导相关的研究方向,此外,graphene和silicene各占一个。没有非晶态或者软物质的方向。

除了Research Front 2014报告外,汤森路透还预测了2025年科技如何影响我们的生活,做了一个The World in 2025的报告,总结出了10个方面的革新。其中跟化学、物理和材料科学有关的包括:物联网(涉及到传感器技术,跟化学、物理和材料科学有关)、解决粮食问题(结合了照明技术、转基因技术等)、以电为动力的飞机(涉及到电池技术和轻质复合材料技术)、纤维素衍生物代替合成塑料、太阳能、量子传输等等,占了十个中的六个。其中,纤维素衍生物的研究应该是最原汁原味的高分子研究了,是传统高分子化学(高分子的改性)、高分子物理(溶液和熔体、力学性能)和加工工程的用武之地,同时也很可能是不久的将来的经济增长点——假如按照汤森路透的预测,2025年将完全替代石油化工来源的塑料的话,那在这十几年之间应该就会看到生物质资源的产业化和商业化过程。

感想

汤森路透的统计,只是对过去的科研动态的研究结果,可以用来预测。但是所有的研究都只停留于现象学。它不能回答为什么是这些而不是那些研究成为了热门研究,不能归纳出能够成为热门研究的方向的特点或者规律性。因此,如果想通过汤森路透的数据来决定自己研究什么“最划算”,是不靠谱的。汤森路透只能选出core papers,然后统计这些core papers是如何被引用的。但是,哪怕从功利的角度去想,我们的目标并不是要去做引用core papers的工作,而是让别人服去引用我们的工作,使自己的工作成为core papers。但是这些core papers是怎么出现的,为什么这么多引用,汤森路透的数据是无法回答的,这恰恰体现了科研发展的自发性。

科学研究的潮流有起有伏,前几年甚至几十年是高潮的研究,后几十年就会是低潮。人一辈子,做不了几件事。正是因为我们往往都不可能是core papers的生产者,不可能当时代的弄潮儿,所以,能够做几件自己感兴趣的事才是我们平凡人能够追求的幸福。当我退休的时候,自问我这短短二十年的研究工作,想必不甚伟大,恰好也不太热门,文章的数量很少,impact也很低。那么,至少我是否真正感兴趣?我感兴趣的问题,做出答案了吗?我想认识的现象,认识到了吗?基金是向单位交差的,文章是向基金委交差的,孩子穷有穷养富有富养,钱是带不进棺材的。把自己感兴趣的事情作出了一定的成果,才算不枉此生。

化学专业学生学习电子知识的必要性

Journal of Chemical Education上刊登了一篇文章,介绍了一门给化学专业学生开设的微控制器应用课程。建议大家看看。

今时今日化学和材料学实验研究手段已经几乎100%电子化了。很多年前,在实验室做实验,各种测量是通过肉眼读刻度的。测量仪器的设计就是如何通过机械和光学上的设计,把待测量转化成可以通过刻度来读的信号。例如温度计就是通过热胀冷缩原理,把温度转化为体积变化,通过刻度来读数;机械分析天平通过机械和光路来放大微小的位移,也是打在一个刻度上。哪怕不是通过刻度,也很大程度上通过人眼辨别,例如阿贝折光仪。今时今日,没有什么量是不能通过传感器转化为电信号的了,所有测量都变成了测电流和测电压。我们直接看到的是显示在荧光屏上的读数。很多年前,要完成一个准确和精确的测量,我们要做的工序非常繁杂,每一步都必须十分仔细严格。例如,粘度法测分子量、密度瓶法测密度。但是在今天,也是拜传感器和电子技术所赐,很多仪器都能非常好地恒定或控制几乎所有物理量,免去了使用者的麻烦。所以,今天的研究生,无论是测量操作还是读数,都已经十分傻瓜;仪器商也是尽量把仪器做成这样,目标就是让用户一按按钮就出结果。

这种时代潮流,是不可逆转的。实验课的应有的意义已经不存在了。在刻度时代,实验课上一个实验的步骤本身就能够起到培养作用;现在必须另外开一门课去培养。很多人甚至还意识不到,进入了电子仪器时代之后,学生缺了的到底是哪方面的培养。也许在本科实验课,由于教学经费有限,学生学习的还是刻度时代的实验操作,不断地被强调“平视”、“估读”等肉眼使用技巧。可是当学生本科毕业,进入真正的科研实验室工作的时候,面对的是一部部具有fancy的ABS外壳和炫酷控制面板的仪器。之前实验课所培养的注意事项似乎跟这一现实是完全不相关,学生实际上是要重新建立实验测量原则。而在这一阶段,研究生往往没有机会重新受这方面的教育,而是在仪器商设计的傻瓜面版和Quick Starting Guide指导下变成一个傻瓜机用户。

我想列举一下哪些基本知识是必要的,但也未必全面。

首先,一些基本原则是一贯的。本科的普通物理实验课头两节课都不是具体实验,而是在课堂上介绍误差、准确度、精确度等概念,包括有效数字的四则运算等。这些原则,在刻度时代,学生可以在具体实验操作中体会,因为那个时代一个测量工具的精确度已经体现在刻度上了,学生得不出更多位有效数字,而且学生必须亲自把每次测量结果记录下来,列表,手算统计出均值和方差,对于准确度和有效数字的运算的印象可以被加深。可是在电子仪器的时代,学生失去了这种在实践中体会精神的机会。仪器可以给出计算机能够支持的任何浮点数,学生如果没有有效数字的概念,就会照抄仪器读数,所以这些基本原则是需要再次强调的。

我本科时代的普通物理实验笔记

我本科时代的普通物理实验笔记

其次,电子仪器的出现,一些老的问题已经不成问题了。例如,由于读数是直接显示在屏幕上的,所以就消除了人用肉眼读刻度带来的误差,两个同学读同一个读数,就不会受不同人的“眼神儿”差异的影响。甚至,在电子仪器时代盲人也可以读数。但电子仪器也带来新的问题,这就是信号处理的问题。分辨率、取样率、信噪比、模数转换、Nyquist频率等概念和原理变成了最起码的常识,但化学专业的学生不要说没有学这门课的机会,甚至不知道这些知识的存在。

再次,从刻度时代到电子时代的传换,一些物理量的测量基本原理其实并没有变,但是条件控制内置在了仪器内部,学生不用自己去担心诸如恒温、恒湿、恒容等问题,也不清楚仪器在这些问题上是否达到了要求。学生甚至不知道原来需要这些控制条件;而有一些物理量的测量原理变了,例如测密度,以前是用密度瓶、密度计,电子化之后是U型管振荡法,这些新的原理也需要学生去学习。总之在电子仪器的时代,只有对仪器的测量原理十分清楚,才能做好测量实验。但是现在的仪器所附的说明书往往不介绍或者只是简要介绍仪器的测量原理。要求仪器说明书达到理想的要求又很难。因为仪器的测量原理,往往涉及到至少以下几方面的内容:1. 学生不熟悉的物理效应,这往往本身就是大量的研究论文的知识储备,例如,有一种新仪器通过NMR弛豫测量胶溶剂分子状态识别处于胶体粒子表面的溶剂分子,得出其数量,从而计算胶体的比表面积。这一仪器的局限在什么地方?是不是什么样品都能测?哪怕我拿一个不三不四的样品放进去,仪器反正也能出个电流电压,不会没有读数,那到底可不可信?不仔细翻阅相关的原始论文去研判仪器的测量原理,是无法回答这一问题的。回答不了这一问题,这一仪器也就无法使用。可是仪器商来推销这一仪器,当然是无法好像原始论文的作者那样跟你讨论交流(他们甚至对自己仪器的认识还不如你凭你物理知识所估计出来的那样深)。他们推销的重点往往就是仪器的快速和易用性。这种推销思路,只能针对那些只出数据交差的研究生,忽悠不了导师们。2. 电子电路知识,一个现代测量仪器的设计,除了核心的物理机制之外,肯定最终要把信号进行处理和以一定的形式(电流?电压?)输出。这也是化学专业的学生不具备的知识。甚至说,有些核心元件需要保护,在使用时注意什么问题,学生也是一无所知。这种知识,一要解释,免不了涉及这一元件的构成和工作原理。例如,同样是测密度,学生在本科实验室的时候,好容易搞懂为什么密度瓶要这样设计,平时要怎么保护密度瓶,测量的时候要避免什么情况。到了实验室测试原理变成了U形管,该注意的问题,完全不一样了。

最后,也是更高的要求,就是还需要知道一些微机原理、一些机械设计原理、一些光学原理,懂得用微控制器DIY简单的测量设备。在研究中,要证实原创性的想法,往往需要的测量是没有现成仪器的。要测什么东西,自己DIY,应该是一种常态。可是中国的研究生思考课题的时候,往往是站在已有商用仪器的能力基础上去想的。甚至很多研究生只懂一个仪器,他想的就是这个仪器能测什么,我就研究什么。如果你叫一个化学专业的学生自己想办法把一个什么东西测出来,他甚至不知道有微控制器这种东西能够帮到他。有些测量需要一些简单的机械,学生也不知如何实现。更不用说很多测量是利用光学原理来实现的了,学生搭不了光路。你如果不开课,叫学生自学,他们会以为这是一个不可能的任务,以为你是叫他们把自动化专业、机械专业和光学专业的本科重新再读一遍。事实上这些能力是只要学过普通物理学就能上手的。开一门课,也未必需要把所有涉及到的能力都培养一遍。既然已经是研究生了,课程内容完全可以挂一漏万,关键只要传达一个信息,让学生对这些不熟悉而又十分重要的知识和技能改观,建立一种自信,从心理上把这些纳入自己该懂、能懂的知识范围,然后发挥研究生应有的自学能力补全知识即可。

讲演:《怎样查阅文献》

前几天说我要在课题组会上作一个怎么查阅文献的报告。做了。为了好玩,我重新录了一遍旁白,用一个插件转化成了HTML5的网页,可以播放,声音有点小,要把音量开最大。整个报告大约1小时。

以前我在博客上都曾经写过很多类似的主题,但这一次是整理得比较成熟的。那些对于大多数研究生来说不那么必要的(例如去图书馆查阅18xx年的文献的方法),我就不故意显摆了;讲的都是一些对其他同学也有益的经验。

也许只有材料学领域,才会需要阅读这么巨量的文献。说中国发表论文数世界第一、引用数世界第二,其实都是做材料、纳米的人推上去的。做数学的人根本不可能这样去管理文献。数学的论文不是扫两扫就看懂的,他们一篇文献都可能要看一个月。所以这个报告的内容可能也就只适用于我同行。

如果上面的视频看不了,可以去优酷看