Category Archives: 个人文集

知乎:为什么学术杂志论文很贵,而作者又没有从论文下载中受益?

原问题地址: http://www.zhihu.com/question/20692550

受邀。但本人一向答非所问。

一、

有很多这类问题:文章署名为什么是这个原则?为什么研究结果一定要发到那些期刊上?直接在网上放出来不行吗?什么是同行评议?现在的同行评议还有效吗?影响因子重要吗?为什么?……然后也包括本问题。

在仅有6平方米的小屋里,陈景润坚持埋头于哥德巴赫猜想的研究,经过艰苦的努力,终于取得了震惊世界的成就。在“文革”刚刚结束的那个“科学的春天”里,陈景润成为激励广大青年向科学进军的旗帜。
http://www.gmw.cn/01ds/1998-03/25/GB/191%5EDS609.HTM

这些问题的产生原因是今时今日科学研究的建制(infrastructure)已经跟法拉第时代很不一样了。它发展到今天这一步,也可以说是“悄悄地”,因此公众(尤其是深受八十年代“科学的春天”报告文学影响的中国公众)并不了解这个发展过程。研究生是从公众角色进入科研角色的一个过程,但是,很少课题组会正式地给新进来的研究生概述现代科学研究组织模式的全貌。我们都明白,很多行业都有理想与实践的区别。但是,对于医生警察律师扫大街等大众十分熟悉的行业,理想的情况是什么,大家都很清楚。因此,一旦身为医生或警察,虽受制于现实的不完美,但心中至少很清晰那个尽量要达到的理想状态是什么。但现代科研事业的情况有点不一样。研究生们很可能一直都没有被正式的呈现一个完整的是非观和分寸(理想的),他们只能看自己的导师和别人的导师、自己的师兄师姐、其他课题组的同学等等来模糊地定位。因此就造成了,研究生群体中关于科研事务和与科研有关的人际关系的是非价值观非常混乱。他们向导师提出的期望和要求,很可能自己都不清楚理由在哪儿;同理,他们想拒绝导师的期望和要求,也不清楚是否有理。对于不同的研究生,觉得怎样算合理,十分依赖于他们的经历和见闻。的而且确,科学研究的优良传统的传承非常依赖于导师到学生这条路径。往往导师在大谈科学研究之道时,引用最多的还是他当初的导师如何。尤其是在科学研究的模式严重异化了的现代,那种旧时的传统的传承就更加脆弱了。因此,优秀的研究生院和实验室,都会撰写一些当前科学研究模式和角色扮演的常识性内容,供初入科研大门的研究生学习,并作为一种是非参考座标来比对他们将来在实践中看到的人与事。例如中文网络上一度流传甚广的麻省理工大学人工智能实验室编写的“如何做研究”:How To Do Research In the MIT AI Lab。你可以看到作者是“a whole bunch of current, former, and honorary MIT AI Lab graduate students”。这说明,在新的形势下,到底怎样做是对的,怎样做合适,无非不过是大家形成的一种共识。固然有一定程度的空间可以供你问“为什么”,但无限问到底的话,也就只能是“共识”而已。凡这类资料,里面很可能会包括“发表论文”这一章,“导师”这一章、“师兄师姐”这一章、“会议报告”这一章,其实是一些FAQ,用于回答本文开头列举的那一大堆“为什么”。

二、

现代科学研究的一个非常重要的特点是:它是一项职业。是职业,就要考核绩效,就要评级分高下。于是,影响因子、H因子等等事情就都出来了。因此,在当今科学研究圈子里,publish or perish是一个无奈但难以破解的主题。其实,若不是因为这个,论文大可以一稿多投,而且也应该一稿多投。我发现了一个新现象,为了最多的人能够最快看到,不就一稿多投了么。我一稿多投伤害了谁吗?无非是因为发表的论文数是评价科研能力高下的重要参考——于是也是决定科研人员升迁的重要参考,所以才使一稿多投行为变成一种不公平的行为,变成拼升职可以不拼原创工作积累,而是去把一稿N投的N最大化了。事实上,科学论文的读者只关心论文的内容,及其真实性,它并不关心作者本人能力是否高,是否教授——这无非是作者本人才关心的事情。

科研的职业化还造成很多其他的无奈的扭曲,但这些扭曲都还没严重到危害科学研究的结果。因此大家在目前的科学研究模式中都处一种两难中找平衡的状态。这就更要求从业人士对科学研究本身的宝贵传统和理想情况十分清晰,否则很容易失衡(中国的情况)。

三、

现在才稍微谈谈本问题的话题。期刊是从纸时代发展过来的模式。在当时,你必须订阅,才能看到发表在期刊上的论文。为节省金钱,既有课题组集体订阅,也有图书馆订阅的方式。个人订阅也是可以的,特别是像Science这种。

科学研究成果很讲究尽快发表,所以从传统上除了full articles之外还有letters、communications等体裁。这是害怕自己失去了第一发现权。为此除了要快之外,也希望能尽量广地宣传,让大家知道这个已经做出来了。所以从科学研究的初衷(理想)来讲,为何更倾向于论文能发表在Science或者Nature,最初都是因为这些期刊的发行量够大。而作为这些期刊的编辑,自然会比其他发行量少的期刊收到更多的投稿。很自然,期刊是要以保住订阅数为第一原则的(这跟电视台要保住收视率相似),因此,遴选稿件的原则就是选择足够重要的研究成果予以发表。何谓“重要”,据JACS主编的说法,那就是具有“broadest interest”的研究成果,越是能让更多其他研究方向的人对你的研究成果感兴趣越好;那些具有深入的analysis但只兴趣范围局限于行内的paper,非常好,鼓一百个掌,但不够“重要”(JACS主编观点,相信也代表着很多高影响期刊主编的观点)。可以看到,这样定义“重要”,是纯粹有利于期刊的一种定义,broad interest的结果直接就是订阅数量的提高。订阅数量提高了,就使得更多人愿意把稿件投到该杂志,该杂志能够选出更“重要”的研究,“档次”于是也越来越高了。

假如科研没有职业化,没有publish or perish定律的统治,这样的情况也无甚不可。扎实的,对本专业研究有基础性贡献的常规研究成果,虽没办法发表在Nature/Science,但也不会对作者造成什么损失。在很多研究领域的内部,一些发表此类常规论文的期刊,更受业内人士的尊重(例如高分子领域之对于Macromolecules)。但是在publish or perish的统治下,情况就有所扭曲了,特别是在中国。因为大家不得不尽量使得自己的研究成果不是更深入,而是更花哨。商业期刊也乐于发表这样的论文。影响因子上去了,是作者和出版商都皆大欢喜的事情。但是这就带动了一大批参考性有限、为发表而发表的论文充斥在当今的论文海洋中。我们发现,发表的paper真是越来越多,还真幸亏有了RSS和Google Reader,且哪怕如此那个inbox的计数还是长期显示1000+——已经坚持每天敲空格消灭一批了。所以我们今天是很难想象在那没有网络和搜索引擎、更没有RSS的时代,研究人员如何进行literature survey。只能说在那个时代,大家只会关注行内几个重要期刊,也只希望自己的成果发表那几个期刊上,至于在世界的角落还有哪个论文可能已经论述某问题,人们实在关心不了,也就等于没发表了。

四、

所以,期刊的存在,帮助了研究人员更快更广地宣传自己的研究成果。满足了这一需求,就相应收一笔钱。收多收少,完全看市场。这也是无可厚非的(我的经济观念比较右倾)。还要考虑到期刊还承担了同行评议过程的组织工作,校对、排版、印刷都要人力和物资成本。所以是不能要求免费白干。问题只能是为何今天一些大的出版商能够把这笔费用收取到如此高的地步。这里有几个原因。

一是,无论费用多低,大家都愿意省钱。

由于论文与论文之间的内容差别会非常大,所以一本期刊,你很少是以从头逐篇读到尾的形式去阅读的,往往是直接了当地去翻到那篇论文,看完就放回去了。这样的阅读模式,使得期刊更适合大家集体订一份。你看你要的那篇论文一般不会与我看我要的那篇论文发生冲突(不像书,你要看福尔摩斯,我也要看,就必须有两本才不冲突)。这甚至可以全校师生只靠图书馆订的那一份,只要图书馆提供复印机。这对出版商是不公平的,但又是公益性的(“科学研究”是一个很难抵毁的道德高地),所以只能提价来补偿。今时今日,要看论文是只有通过图书馆购买权限共享才划算的。学术圈之外的人士贸然想看什么“学术论文”,看到单篇下载价格,当然要吃惊。

二是,出版商帮作者推高了期刊的影响因子

在publish or perish的统治下,很多(中国)作者投稿对期刊有着超出专业之外的选择性,那就是纯看影响因子。大的出版商在经营高影响因子期刊方面有着丰富的经验。ACS、RSC这几年新开了这么多期刊,都无往而不利。这得益于他们不断投钱建设和紧跟互联网发展潮流的电子期刊网络系统,以及他们为期刊的宣传做的各种公关活动,这些都提升了期刊的IF,是高价值的服务,这些钱当然也是要收的,问题是向谁收。以往都是向读者(图书馆)收。现在许多期刊都尝试Open Access,改向作者收。其实,无论向哪方收,都有说不通的道理。你把影响因子抬高的努力,满足的是作者的利益,大可以向作者收费啊,肯定是作者才愿意回报你这方面的努力,怎么会是去向读者收?但如果向作者收费,也有问题。一个高影响因子的期刊,拒稿率也会很高。如果收益是来自作者,一个期刊就不必要维持过高的影响因子,即无需维持过高的论文质量。可以使影响因子降低,只要不低到影响投稿量就行了。如果都是这样的期刊,市面上只会充斥着清一色的平庸产物。不用等到所有期刊全变成Open Access,自觉的科研工作者对仅存的传统模式期刊的青睐程度,就已经让OA寸步难行了——这也是目前真实情况。所以,压力还是只能落在高校图书馆这头。

有很多幼稚的口号,例如纳税人交钱投资科研,成果不应该再收费。其实,你完全可以嫌已有的出版商要价过高,自己组织一些同行办期刊,维持相当的同行评议,然后不收费(假设你有足够的办法)。但是有一点:影响因子上不去,你就没有好的稿源,大家都更愿意投到高影响因子的期刊上。说到底,这个出版商的超高价格,其实是publish or perish造成的代价,也就是当今科研职业化的并发症。谁让大家为了职业生涯不得不选择高影响因子期刊来发表最重要的研究成果呢?你单单指责科研成果要收费查阅,不去指责科研人员拿纳税人的钱来做科研又以研究成果来挣生活,那就是片面的。如果后者合理,你就很难指责前者。这是不能再问“为什么”的地步,如我前文所说,到了一定程度,就是大家的共识。学术圈仍然是一个自治色彩浓厚的圈子。圈内觉得这样没问题,圈外人就不应多加指责。虽说纳税人纳了税,但这个钱只是用于支付成本和代理的劳务费,不是用于购得专业上的控制权。专业人士代公众完成专业性强的公益性工作,收取劳务费;但专业人士的专业操守,只能靠成立行业协会(如律师协会)来有效监督,公众至多去监督行业协会在专业问题之外的程序问题之类。

四、

以上道理,现在的公众也不是不清楚了。但是,他们会继续直接攻击科研职业化本身。似乎科研是否要职业化,是可选择的;竟然走向了职业化,代表着人的一种腐朽和堕落。诚然,publish or perish长期以来也是科研工作者讨论的热点,但无论怎么讨论,这么多年了,没法破。毕竟这是一个近百年来历史发展的结果,提到战争的因素也好也好,国家转变发展战略的重点也好,互联网的出现也好,这些因素,都是硬梆梆的历史,而不是某人的自私自利。公益性事业到底是私营还是公营的问题,实在是太大了。但凡涉及到这一问题,争论是不会休止的。总有人希望打着公益性的旗号让一切免费,也总有大资本家尽倾创业艰难史和强调贡献与回报。如果在认识到前文介绍的一切之后,还要继续讨论要不要“全民免费PDF全文下载”的问题,那就相当于明明深谙“看病难看病贵”体制症结之后仍然还要继续讨论要不要“全民免费医疗”一样——耍赖。不是说看病难看病贵很合理,但也不等于说必然要搞全民免费医疗。

Arron Swartz是个大帅哥,我确实为他的自杀而伤心。但若论他的主张,我是不同意的。我也是萨切尔夫人的支持者。所以这个问题如果是讨论到了左派和右派互骂的层面,就完全可以停止了。因为这样的互骂网上已经很多,不需要在这里又重复。

五、

无论如何,还是要承认目前的现状是不理想的(虽合理),如何稍微理想一点?跟所有无法破的大局一样,只能自欺欺人地、无力地倡议所谓的“从我做起”了:尽量不要追逐影响因子,尽量逃开publish or perish的统治。尤其是,当你拿到tenure之后(在国内,似乎可以对应为拿到“杰青”之后?),请做扎实的研究,投在受众兴趣比较集中的专门期刊上。你的研究努力,应该是致力于满足研究领域内的好奇,回答领域内的问题,优先为本领域作出一点贡献;而不是去追求所谓的broad interest,做一些力求让不同领域的人都能理解、但却没有什么贡献的论文,只为了发表在高影响因子的期刊上。假如每个人都这么做,那么市场的供需重点就不再在于影响因子上,在出版商的优势就不那么明显,它自然就没有继续维持高价的市场资本了。当然,跟所有其他的“从我做起”们一样,这只能是一种理想。你不扔垃圾,不闯红灯,并没有改善卫生和交通,说到底这只能算是自我修养。同理,前面说的做研究的原则,也只能说是自我修养。跟所有人的修养一样,它的培养是不可能仅靠社会历炼的——恰恰相反,社会历炼只会不断地为抛弃个人修养提供强大理由。修养的形成最依赖的,还是在成长初期长辈的教育。挪到科研方面来讲,那就是研究生阶段导师的言传身教。如果导师本身不追逐影响因子,不受publish or perish的束缚,一贯专注于研究课题的内在价值,那么学生将来也才能形成足够强大的信念来坚持这些。这就又回到我文章开头说的,要先对什么是理想情问十分清晰,才能在现实中努力地找到平衡;什么是理想都知道,必然会失衡。

我之所以这么认为,是因为我的导师就是这样的导师,又因为他的导师是这样的导师。因此,我个人甚至有一种偏见,那就是读研不要选择年轻教授。tenured都不算,最好emeritus!

知乎:对于搞科研学术的研究生而言,究竟该专注于平心静气做好研究工作,还是应该为以后找工作早做打算?

原问题地址:http://www.zhihu.com/question/20949946

看了本面其他人的回答,我想补充两点。反正我的回答已经长得不行了,再长点也就那样。

一、我相信这个问题答案不应该是直接让提问者做哪个选择。再加上,我在知乎上回答问题都是借问题来表达一个观点——即那种既适用于具体这个问题,又有点普适性的道理。因为,我希望自己是一个讲原则的人(或者说读书读傻了人死板),我做这个选择的理由,跟我做那个选择的理由,要能够同时符合一个自洽的价值观体系,而不是见利忘义,此一时彼一时,见人说人话见鬼说鬼话……如此各般等等。不是说现在这么做对我有利所有我这么做,而是我一向信奉什么所以我这么做。成功学畅销书也许能帮你分析利弊,但不能强加你一个哲学。人生不是一场生意,不要去做人生的商人。

做同样一个选择,可以基于很多理由。我不赞同你做这个选择的理由,不等于我不赞同你做这个选择。我批评那具理由,不等于我批评那个选择。若要问“那你到底认为该做何种选择呢?”我当然不说,也不应该说,选择就是应该自己做的。我的任务就是摆一通理由,而不是直接说,你就选A吧B是错的。

读了这么多书,至少要形成“知其然知其所以然”的习惯,而不是还停留在“肚子饿了要吃饭,困了要睡觉,来性子了就撸一撸,地上有钱了就捡,枪指头上喊救命”的本能反应水平。只有未成年人才公认不具备承担责任的能力。成年人就是要为自己的选择负责。

在硕士和博士阶段认识“科研是什么”,完全不晚。我想不到有什么方式可以更早地认识这个问题。只是人完全可以选择压根不去认识这个问题。既然你对这个问题产生好奇,你去认识了一番,那就不应该又去抱怨问题的答案让你失望,更不应该说是什么“社会上专家学者”忽悠了你。我天天说哪个歌手很好听,你觉得我从小弹钢琴懂音乐,于是你自己买了张演唱会票,回来你能怪我么?只要我没直接叫你去买演唱会票,我又没有收那歌手的钱违心地宣传他(真心觉得好听),我就没有过错。这不能说是我狡猾,也不能说你被忽悠了,而完全是个正常的代价。

二、我的答案的重点在于“要和先导师商量、讨论”。这也是匿名用户建议的第一条。主要是由于我估计跟导师讨论之后的结果多半就是只能维持做实验的强度,我的答案才会显得好像在叫他将来选择做科研。但我不排除你和导师商量了之后导师就放你跑了这种可能。匿名用户的结局就是这么好。至少,你先跟导师说一声,导师会有所准备,假如在课题项目上安排得过来,说不定也可能允许你缺勤。匿名用户所谓的:“和你的导师谈。他能接受你不做学术,你的朋友有什么好质疑你的?”换个说法就是,只要你有本事说服你导师接受你不做学术就万事OK;即如果说服不了的话就只能自己兜着走。

这跟你不先商量自己跑了是两码事。我十分想强调的是诚信。可是我发现很多中国人的心态就是,如果明知跟你商量了结果对我不利,我就还不如不跟你商量(哪怕道义上我不应该)。即诚信如果对我有利我就讲诚信,如果对我不利我就不讲了。我首先不赞同这种做法。正确的做法是:明知跟你讲了八成对我不利,不跟你讲我就自己完成了;但我还要跟你讲,然后就真的吃亏。这就叫做“不要见利忘义”。

现在我谈谈这里面有什么“义”。我刚才已经说了,并没有谁忽悠你来读研。既然是研究生,那么就不仅是学校的学生,还是课题组这一团队的成员,按照学校和课题组的规定来做事。例如每天八点半到实验室之类。跟导师商量好的实验计划,导师当然有理由定期追问,你当然被假设是所有的工作时间都在课题事务上,因为你读的是全日制研究生。当初要进课题组让你进了,结果你实验不做,实验室不去,要找你你去了别的城市,明天才能回来,突然连续一个月失踪,原来参加了企业实习生……我认为这不能拿你的前途问题来当借口。你嚷嚷着说科研就是个大忽悠,你被骗了,你根本不喜欢科研,你后悔了;但这些都是在你读研之后,体验过了解过之后才说的话。假如这些是你读研之前就知道的事,那你就更恶劣,你故意假装想读研而考入本课题组,主观上就故意来混学历么?你可以选择将来工作,但就读期间你只能完成导师和你讨论商定的实验计划和其他科研任务(写论文投稿)。而且我特别要说的是在这方面你跟导师讨论的余地不多,你没有太多的理由要求导师因为你将来不做科研而让你现在就消极怠工。

在很多现在的研究生看来,这简直要立马上论坛大骂这个导师了。在他们眼中,读研时做不做实验天然就是可做可不做。因为不同的导师不一样严,显得好像也没有一个准则到底要多努力才算合格。自己要多干事,无非是这一个导师特别严。自己到底是多花点时间在实验上呢,还是不做实验去搞找工作的事呢,完全看自己的选择(于是有了本问题),而不用考虑别人。其实不管严也好,松也好,研究生是课题组的一员,是为完成课题组的研究目标而来的。哪怕所谓“自由探索”,也只能是渗透在课题实施的各种环节,不是说整个课题就是“自由探索”。因此,研究生是完成导师所立科研项目的主力。这并不是“免费”或“廉价”劳动力,而是一个完全不惧公开的“行规”。科研经费申请书形式上是要求写明参与的研究生姓名、身份证号码,一年工作时间(多少个月)等信息的。也就是说公认了课题项目是导师立项研究生去完成的,研究生有这个义务。相应的科研酬金以学生三助的形式发放给研究生。但由于项目和经费不同导师不一样,我们学校的做法是学校统一从财政出一部分,然后导师从经费中出一部分,保证每个研究生的补助金额一样。没经费的导师于是就不能招生。这只是避免不同学生补助金额依赖实际参与课题的起止时间的技术性做法。但道理上是因为你参与了课题你才拿到补助。研究生在课题组还有别的义务,例如维护常用仪器,实验室安全,药品管理等等。你突然有一天后悔了,“醒悟”了,然后就不管不顾了,这对整个课题组都是不负责任的。

骂中国的高等教育是一回事,骂社会上的“专家学者”,骂奇葩导师、骂四六级、骂那些你鄙视的书呆子们、那些“万般皆下品唯有读书高”的傻子们,是一回事。“诚信”和“责任心”是另一回事。这些不要说研究生了,从本科生开始就已经很缺乏。本科申报学生科研计划进实验室,来找老师。问他:你每周都哪些时间有空?答曰:周五晚,周六晚和周日下午。课这么满吗?哦,我XXX时间做家教、XXX是预备党员组织生活、XXX协会每周X例会,XX又是家教。我说,你每周忙到只剩这点时间了,还不休息?来实验室,时间也不够啊。他说:参加这个加很多份,而且不用做实验,只要跟着师兄的论文挂个名,将来能评奖……大四的毕业设计,凡是不读研的,基本为零。老师都只能理解一下因为这也是现在的大环境逼的,但这也是做坏了规矩,恶性循环。有的老师要求严一点,学生拍桌子翻脸。其心态就是,凡是我有什么需求要实现,世界上就不应该有别的事可以挡着我。现在我要考公务员,这才是最王道的。其实,这样的学生,我还真希望快点去工作几年,千万别继续留在学校读研。早几年认识到什么才是王道更好,要是一直留在学校,导师又很好说话,那说不定还真的是读到博士毕业30岁了还是这副德性,人生真毁了。

以下是原来的回答。我的回答中有一句话:要想就业好,就要就业早。不知道为什么,似乎还是给人感觉我是在“为学术多说了几句”,甚至是建议提问者将来去做科研。翻了一下我其他问题的答案,发现,叫年轻人早点接触职场早点实习的观点我不止一次表达,例如如何让注意力集中在单独一件事上?但是,知其然要知其所以然,重点是理由。是理由让我跟别人的观点不同,我之所以为我。
====================================
我觉得匿名用户的答案比我好,不想看长篇大论的,看了他的答案基本就了解我的观点了。

一个人怎么取舍,除了利弊的衡量之外,还有个人性格气质方面的因素。哪怕明摆着有利的选择,你就是不喜欢,也可能不做。你因为自己不喜欢而不做这个有利选择,很可能事后也不会后悔。思考的方法大概就是先客观地分析利弊,再主观地掂量一下。后者是很容易的,自己还不知道自己么,但前者对于阅历尚浅的学生来说往往很难——他太不知道人家。

为以后工作“早”作打算的“早”,是有多早?你读书读了十几年,最后两年才为工作做打算,算不算早?为以后工作早作“打算”的“打算”,又是什么“打算”?好吧,现在你可以不做实验了。那你会做什么呢?每天做的什么事情,才属于“为以后工作早作打算”呢?现在你马上要做什么事情与做实验冲突了吗?毕业工作不好找,你是已经想到什么事情,现在去做,你毕业工作就会好找吗?

现在学生普遍存在的问题,一个是高谈阔论(这其实不仅限于“现在的”学生,而是年轻人普遍喜欢)。二是只做能立马兑现成果的选择,说“功利”已经不够准确了。问题是,这两个问题之间就是矛盾的。真要追求做每一个选择都立马兑现,最要不得的就是高谈阔论,而是要变得非常实际和通透才行。如果你的水平只限于高谈阔论,你休想做什么选择能立马兑现,乖乖地走弯路碰钉子去吧。

做导师的当然会抱怨,现在的学生全都不是来做科研的,都是为了拿学历,至少缓冲就业。做导师抱怨这个,是因为于是他们就没办法对学生要求太高,课题的质量和档次就提不上来。做导师抱怨这个也是很无奈,说到底也是不能怪学生的。因为他不喜欢的话完全可以不招学生,现实是他也必须招,因为生源的普遍情况就是这样,没学生干活不行。这是买方还是卖方市场的问题。

但学生不是完全没有考虑这个问题的义务的。在读研甚至读大学之前,我们的学生太习惯于老师必然是无私奉献的,以教育学生为自己全部的职责的,所以读研之后大多数会对研究生导师不大满意,跟自己以往对老师的印象反差很大。事实上,读研是一种合作。学生要获得培养,导师要完成课题。于是你问:导师为什么就没有培养学生的义务?本来是有的。但现实是,导师只能把学生培养成为独立的科研工作者,培养成企业主管不是导师能力和责任所在,但大多数学生并不愿意接受这样(科研)的培养,所以只好退到“合作”这一步。如果连“合作”都谈不拢,就干脆别选择这个导师了。

可是有很多人事先没有跟导师谈过这个问题,都按自己的想象行事。最后毕业成问题,才突然撕破脸皮。所以,如果你要为你将来就业“早做打算”,第一件事要做的就是问你导师,你毕业的条件是什么。学校的要求满足了是不是就足够了?导师是否有自己的要求。其实你现在谈都迟了,很可能你会发现这个导师的要求很高,你如果要完成他的要求,还真没有时间做别的事情。说不定你导师会说,你现在这个反应做不出来就别想毕业(你做熟手了,毕业走了,上来的学生又是生手。如果你不把成果做到发表那一步,决不放你走是很有可能的,但也不是绝对)。具体,要你自己跟你导师谈。由于现在谈是迟了的,所以谈出来什么结果,你都只能自己吃不了兜着走,只能说是你现在事后了解一下,不是真正的谈判。总之,你处于学生的状态,毕业是首当其冲的重要问题。没有顺利的毕业,就业什么都是浮云。你早做任何其他打算都属于无用功。

不知道你在什么学校,什么城市,什么专业背景,什么研究方向,你的师兄师姐就业就如何“不理想”。你能排除你自己对“职业”的理解还很幼稚这一因素吗?硕士刚毕业是想要有多理想?我不是想深入到这个话题。而是提醒你,如果要为将来就业早做打算,首先要理解就业本身是怎么一回事。你如何制定你的职业规划?职业规划不是凭空制定的。一开始你需要了解很多别人走过的路,例如刚毕业他什么情况,两年后他怎么样,五年后,十年后他又怎么样;从中你发现一些疑问,就能加深你对你这个专业在社会上对应的行业的理解,从而自然而然地形成你自己的职业规划。这些信息,课题组里应该是能了解到的。你先要认识这个行业,了解你们这个专业出去的人,在这个行业中发挥什么作用,扮演什么角色。只要保持对行业持续加深理解和实践,毕业刚开始差一点影响不大。

我不知道你了解完之后,会有什么感觉。我的经历告诉我,除了英语和学历之外,在学校里基本没有什么可以为将来就业早做的“打算”。想要就业好,就要就业早(但你又想要学历,所以去读个研)。工作之后的事情,有八九成是在学校里很难培养到的。千打算万打算不如早点进入社会。有的专业研究生阶段很闲,会去实习。但化学专业要做实验往往还要通宵,这个是谈不上的。不过,你心理也要平衡:为什么要做那么多实验还要通宵?无非是怕毕不了业。而刚都说了毕业是首当其冲的,这你没办法。既然如此,还不如专心把这学历和学位拿到手。

你是否觉得现在做实验,无非是读研阶段要做的事情,将来一辈子都不会再做化学实验了,加上这么困难,所以你现在也不想好好做了。如果你阶段性的事情你就不好好做,培养这种气质属于“为将来就为早作打算”吗?那么用人单位会把你放在一个永不升职、永不调换、永不超生的岗位去——这种老实人只有长期做一件事才愿意好好做,就让他在这个岗位上做一辈子吧。我敢保证,你毕业后的第一份工作一定是不好的,你肯定要换;我也敢保证,你换的第二份工作也不好,因为那时候你有男朋友(女朋友),他她很远,他她这个他她那个不对付;我也敢保证,你换的第三份工作也不好,因为你小孩上幼儿园在XX区要接受,你妈生病了每周四要去XX医院挂专家门诊你必须开车送她,你工作脱不开身要换……但是,如果你第一份工作做得不好,你甚至连第二份这样能不定期支付给你女友搞点小惊喜的工作都找不到,更不要说你的第三份工作那样虽然地点远但是能养活你妈你小孩你全家的工作了。那个时候很可能你早就忘了你研究生课题那个反应物重结晶的温度了。但你把每个阶段性任务做好的素质正在默默地为你的人生保驾护航。我现在讲的还只是做事的素质的其中一个小小的方面。你还在学生时代都嚷嚷说实验很忙百忙之中抽不出时间来做别的,我看你离好的就业单位也比较远。

一个人是生活在一定的人际关系和体制环境之中的。并不是说因此你就人在江湖身不由己,而是说自由就不是天然获得的,而是要寻求,甚至争取的。坐在哪里又不寻求又不争取,只会觉得所有门都是关着的。现实就是你不能全不管你的课题要求又不去实验室跑去参加EF商务英语课程考公务员注册会计师考驾照做企业实习生,但又不能好像永远都读研一样在一个100%不可能拿诺奖的课题上挖掘你自己都不知道是啥的深度结果其他素质全部停留在应届本科生的水平就没提高过。现实就是你必须宁为瓦全不为玉碎。现实就是被迫要做那种妄图鱼与熊掌兼得努力。想法不能停留在怨天尤人或者高谈阔论的层面。到底你在现在这种阶段,要为将来就业做哪些准备?要占用多少时间?你如何安排你的工作和生活去适应?问题具体化,做决策,执行计划,成果管理,培养一下这些事情,也算是“为将来就业早做打算”吧。

最后讲一句:学生的知识面和眼界太窄,没有资格去做那些能立马兑现的打算——这种欲望是毛头小孩都有的,但能力是军师级别人马才具备的。学生能做的基本上都是那种长远起见的积累,读书啦,参加社团啦,学外语啦什么的。不要去鄙视这些事情,因为你只能做得好这些,乖乖地把这些都做好来。麦子成熟的时候,果实饱满的麦穗是低头弯腰的,直杆的都是空壳。

我用过的文献管理软件

接着上一篇的势头,我再谈谈文献管理方面的应用软件或网站。

离线软件方面,我很早的时候,用过一段时间Reference Manager,当时我试用过Note Express,后来转到EndNote之后,就一直用到现在了。其实我很早就听说过EndNote,之所以一直用Reference Manager这么长时间,其实是懒得搬数据。所以我原本认为,其实用户转换文献管理软件的门槛是很高的,新软件很难抢到老用户。事实是不是这样呢,我没有统计数据,但我就很不明白为什么这么多人喜欢用Mendeley(Zotero我也用过,觉得不错,但是自从我浏览器改用Chrome之后我就不用Zotero了。我对它的喜爱不至于像某些人那样“装Firefox完全只是为了用Zotero)。

我还用过CiteULike、Connotea等网站,也都很快就弃用了。最近ACS出了一个ChemWorx,我也试用了一下。还有ReadCube我也用过。由于上述说的软件我很久都没用了,现在的情况是如何,我也不大清楚。

先讲所有这些应用最大的问题。EndNote的老用户往往已经把文献分成不同的Group了。所以,除非有软件能够直接破解EndNote的enl文件(以及同目录下的.data文件夹),实现“完美导入”,否则只要换软件,原来的Group分组信息就一定要丢失。我从读博士开始到现在,几乎所有文献,都放在一个库中,叫做gelation.enl(凝胶化)。它包括了流变学方面和胶体物理方面的所有文献。我也分了很多Group。不把这个库全导出来的话,我是没办法真正更换一个新的文献管理软件来工作的。但是,估计破解EndNote的文件格式是违法的,所以那些遵纪守法的老外是不会动这个心思,所以Group信息是永远无法顺利地导出的了。当然,有一些权宜的办法。例如对于Mendeley,可以先在EndNote里给同一个Group的文献添加相同的label(可以一次批量操作),再导出成bibtex格式。导入到Mendeley时,label项会导入成tag,然后在Mendeley中按tag来filter就可以看到原本属于同一个Group的文献了,这时再把这些文献搬到Mendeley相应的folder里。这个工作量至少是还可以接受的。

第二个也很普遍问题就是字符。这也应该是EndNote本身的错。EndNote导出的文本格式没有办法处理带重音符号的拉丁字母(很多人名会有,而且我还有一些文献是德语的),在EndNote软件里是正常显示的,但导出成文本文件之后就会变成一个中文乱码。这个中文乱码就会被导入到任何其他文献管理软件中。

第三个问题就是排序。除了Reference Manager、EndNote和NoteExpress(印象中)之外,其他的管理软件的排序功能都很局限。可能是因为我学过一点数据库原理,我明白无论界面多么傻瓜,文献管理软件其实都是一个数据库。一条文献包含这么多的属性,都是可以用来排序的,可以先按属性一升序、再按属性二降序、再按属性三升序……可是,除这三个软件之外的其他软件,最多只支持一按一个属性排序,而且只能在年份、作者、题目等属性中选择。

我在EndNote里是会使用Label项来进行一些标记。最常见的方式是标记了笔记本的页码。由于我阅读文献会有记笔记的习惯,在笔记本上会有页码。因此,一个文献记录,如果label上有个数字,就说明这个文献我看过,当时记过笔记,可以翻开笔记的相应页码来快速回顾,就不用重新看全文了;如果label上是空的,就说明我没有认真阅读过。所以,如果先对Label排个序,所有没记过笔记的文献就会全部集中在一起;再按年份排个序,这些没记过笔记的文献就会按年份来排序,我可以按此顺序一篇一篇地阅读和记笔记。

再有,由于我从读博开始的近三千篇文献都放在一个库中。如果我在阅读文献的时候,看到一篇被引文献我也需要,首先就要判断我是不是已经有这篇文献了,因为这么多篇文献我脑子是记不得某一篇我是否已经有了的。这时我就要在EndNote里,先后按期刊名、卷和页来排序,这样我一拉scroll bar就很快能够找到相同期刊相同卷的地方,有没有这一页就一目了然了。

总之,我会经常善用属性排序(而不是search)来查找定位,这也许是数据库的思维习惯使然。在添加条目操作时就具有一个杜绝重复和冗余的机制,而不是等产生了冗余之后再查重,这一原则可能也来自于数据库原理。因此对那些光有个search功能但排序功能很弱的文献管理软件我都觉得不适应。

有的文献数据库,文献多起来就反应慢,这是数据库引擎比较低级的反映,这些都比不上EndNote。

接下来就是关于PDF文件的管理问题。我一直都很不明白为什么这么多人会青睐这一功能。稍微有点常识的人就会知道这一功能是超出目前技术水平的,是绝对做不好的。首先,PDF文件有两种情况,一种情况就是里面的文字和图象都是基于元数据重新渲染的,另一种情况就是完全是未进行OCR的图象。要从PDF文件中识别出年份作者标题等信息,就需要PDF文件是前一种情况,能从中读出文字信息。而我这个人是喜欢看上世纪中叶的文献的,这些PDF都是影印版或者不良OCR版。再加上,这样的过刊很多时候网络数据库没有全文全限,我都是通过中科院文献互助系统从别的图书馆影印回来的,连字都是歪的,很难指往有什么OCR能把这些字识别好。光这一条满足不了就基本没戏了。我的库可能有一小半都是这种情况。ReadCube的设计似乎是要让用户完全依赖于从PDF识别来导入信息的。它的PDF导入功能确实比我想象中的要出色(主要是它充份利用了PubMed和Google Scholar的api,只要能从PDF中识别出任何最少的足够信息就直接可以在PubMed或Google Scholar上获得其他信息),但也难免有很多无法识别的PDF。ReadCube对这些PDF的处理方式是:仍然要用户从PubMed或Google Scholar上找到相应的条目来应用到PDF上,不允许自己输入!问题是有很多PDF,我自己在浏览器上Google Scholar是能查得到条目的,但是在ReadCube里面上Google Scholar却查不到。我猜这可能是Google Scholar的API有问题,但ReadCube就自愿受API问题的限制了?事实上,如果ReadCube对这类PDF可以支持像Zotero那样,访问文献网页抓取信息,就能够很好地解决此问题。除了PDF识别问题之外,识别出来的信息,也需要分类编排。学术文献是有很多种的,有Book、Book chapter、journal、patent、dissertation等等,这些都以是PDF文件。ReadCube的PDF识别好像默认了这个库里只能有journal这一类型的文献。可是至少我在写论文的时候我不会只引用journal。假如我工作完全用ReadCube,我要引用book的时候我岂不是要另外再打开我的EndNote?要求一个软件把PDF的文字识别出来之后,从排版和页眉页脚信息的特征识别出这是一个book还是book chapter还是journal还是dissertation,要求实在太高了,在可以预见的将来这一点都肯定是做不到的。无论如何,想要直接从PDF中识别信息,愿望很美好,但只要它不是接近100%可行,我就不想依赖它。为什么说这个愿望很美好而又要求它100%呢?因为,假如能从PDF中识别所有信息,我下载任何PDF就不用重命名,也不用记得同时导出RIS并导入到EndNote库中以保持一一对应了,以上的好习惯一旦不遵循,我的PDF文件夹将会是一团糟,这时就真的要完完全全地依赖数据库的PDF识别功能了。假如这一功能还不是100%有效,想想我有几千篇文献(和PDF),有个那么1%我就要手动输入十几篇了,还找不到源PDF在哪儿(因为命名全是乱的)。正因为如此,我根本就不会对文献管理软件的PDF自动识别管理功能抱有任何期望。像ReadCube这种完全依赖在这个功能上的产品,用处就相当于零了。

至于像Mendeley这样(以及EndNote X5以上版本),把已有文献数据跟硬盘中的PDF文件链接起来,可以直接在文献数据库中打开PDF文件来阅读的功能,我觉得也没必要。我对一个PDF阅读器产品本来就另有要求。首先,你有没有给我的电脑添加一个PDF打印机?如果没有,我岂不仍然要另外再装一个Acrobat Professional吗?假如我反正要装一个Acrobat Pro我有啥为何不在那儿看?Acrobat Pro支持画下划线(而不仅仅是高亮。我讨厌用高亮,偏好用下划线),而且还可以设置成波浪形的下划线。Acrobat还支画圈画框画箭头,有时一个公式我框一下,曲线有一个转折点我用箭头指一下。Acrobat还支持基本的窗口操作例如把同一个文件的窗口分成两半,这样的话,我上一半看正文,下一半看参考文献列表,那就不用在正文和参考文献头尾两种来回拖动了。如果可以的话我恨不得分三半,第三半看图,解决文中说“see Fig. 3(b)”结果Fig. 3(b)在下一页的问题。对于一些较新的PDF文件Acrobat还可以进行搜索。可以对PDF进行修改。例如有的paper会另外有一个supporting information文件,我就会把原文和supporting information合并为一个PDF文件,类似这样的操作在Acrobat里都可以解决。相比之下,那些文献管理器附带的PDF阅读功能实在是鸡肋,不明白为什么这么多人青睐,还作为一个卖点了。是不是像我这种哪类软件都成为深度用户的人就注定不幸福,可我也不见得是什么深度用户啊?果粉们不是说,品味高的用户必然会不约而同地选用苹果产品吗?我都没有选用苹果产品,用Windows用得这么爽,我一定是个坏品味的吊丝。为什么我仍然不满呢?我还要补充一下,学术文献的文件格式,不仅仅只有PDF文件。中文文献会需要用CAJViewer来阅读(就算期刊论文在CNKI可以选择下载为PDF格式,但博士和优秀硕士论文只能下载为.nh格式文件,必须在CAJViewer里看),光整合PDF阅读功能,也并没有100%。不是100%的话,我就不敢全依赖在它上面。

为什么我反复提到如果不是100%我就不敢全依赖呢?所谓“依赖”是什么意思呢?我在知乎上说过,我的工作思维是,先花专门的时间把规则设计和定义好,然后不加思索地按规则办;先编程再运行;先把CSS样式表设置好,再在编写HTML应用相应的样式;在Word里先把样式表定义好了,再按要求应用样式;而不是在打字的过程中,这里要加粗就加粗,那里要斜体就斜体。如有修改,就是修改定义,同时应用在所有实体上。按照相似的思维,在工作上,我一定要保证我所遵循的workflow是比较合理,能够适应大多数情况的,因为之后我做的事情就是不假思索地按照这个workflow去操作,就好像电脑严格按照已编好的程序来运行一样。因为,如果你的工作流程是每步都需要你看当时的情况来取舍,每步都要“随机应变”;工作流程也不固定,一会儿这样一会儿那样的话,你工作的需时就不好估计,你对你的工作进度就容易失去控制。你的workflow越是连个机器人都能完成,就越高效。越是要你时时处处都用模糊智慧去取舍、去回味、去条件判断分支,就越低效。所以如果一个工具给到我的功能不是100%能实现,这就等于在我的workflow中种下一个不可靠因素,一个隐患;我的workflow就定义得不严密。真按它那样长期运行,很容易就栽在这个隐患上,到时我就要很麻烦地脱离机器人状态,花时间研究解决临时发生的问题,很拖进度。

最后就说到整合Word软件了。但这个功能,我只有EndNote的经验,其他软件因为在以上指标都有各种不适之处,所以我都没有长期使用。但我有一个印象比较深,就是Mendeley和Zotero都采用CSL,采用啥我不管,CSL想开源通用化我原则上也欢迎。但你必须同时提供有一个可视化的编辑器以便用户自行定义citation style啊。现在我再搜,似乎有一些第三方的编辑器了,也不知道好不好用。但在我当年使用Zotero和Mendeley的时候,我是找不到第三方编辑器的,我也没有精力去自己学习CSL语法。

最后就是“云”功能。“云”的概念大家都欢迎。大家都希望啥都能“云”。但是中国大陆目前的带宽和访问国外网络的状况,限制了我们不是什么东西都适合“云”。就好像我上一篇关于笔记软件的文章那样,我的笔记,以及我的文献数据库,都可能会占用一个比较大的文件空间。同步这样的文件往往需要很长的时间。假如我使用一个软件,工作的时间花掉了,还要花额外的时间等它同步完毕,那谈何提高工作效率呢?如果我用Mendeley识别我的PDF文件夹(2734个PDF文件),它会死。如果不识别PDF文件夹光导入文献数据(2.8k+),倒还可以(反应还是会慢些),但如果仅仅是这样我干嘛不用EndNote呢?EndNote更明快,前面也提到了还有排序功能的问题。再者,我为何啥软件都要自带云同步?现在已经有dropbox了。就好像我在上一篇文章里谈到的那样,OneNote就算没有整合SkyDrive,由于它的笔记文件是很清晰可以找得到的,也可以按用户意愿来修改存放位置。想要云同步的话,把文件放在Dropbox里就解决了。但若像Evernote这样,数据存在神秘的文件组合里,你还真只能依赖它自己的云功能,碰上恰好它的服务器很烂你每次同步都很痛苦,那就只好跟它说88了。EndNote的数据库文件也不算复杂,一个.enl文件带一个同名的.data文件夹,我习惯把这个跟我的PDF文件放在Dropbox的同一个文件夹里,就一起同步掉了,何需EndNote自带什么同步功能?我知道还有个EndNoteWeb,但我从来不用。EndNote是收钱的软件,当然做得好。Mendeley和Zotero是免费的,很多人说这很难得,做得不好情有可原。事实上如果它做得好,收费我也不是不愿意花钱,做得不好,我才不管它是不是免费。既然做免费软件压力这么大,我觉得花时间开发网上同步的功能框架就是完全浪费时间。有Dropbox用户不会用吗?你只需要把数据库文件做得简单易找些就行了。多花点资金和精力放在软件本身的细节上岂不更好?

注:距离我上一次使用EndNote之外的其他文献管理软件,已经好一段时间了。在写完这篇文章之后我又调查了一下。Zotero有standalone版本和一个Chrome的connector,我也重新安装了新版本的Mendeley试用,同时我还了解到一个叫Docear的,以前没听说过,也安装试用。ReadCube还是老样子,就不再试用了。试用之后也许会有新的看法,也许不会。