Monthly Archives: February 2023

学术出版物的格式(三)

3. 排版(typography)

英语的typography,释义是the visual components of the written words。前面提到的“语言风格”风格问题,都是独立于“视觉呈现”的。如果说“语言风格”是论文润色机构的任务,那么“视觉呈现”——排版——就是期刊出版社的任务。在当前的学术圈现状中,比起语言风格,作者在排版上需要承担的部分相对要少一些。但是,重视排版至少有以下必要性:

  • 我经常碰到一些期刊审稿任务,稿子毫无排版可言,难以卒读。就算现在越来越多的杂志不对初稿的排版作要求,对初稿进行好的排版仍然有助于投稿成功率。
  • 就算稿件正文的排版最终由期刊的出版社完成,稿件中的图、表范围内的风格和排版仍然属于作者自己决定的,除非原则问题否则出版社不会去改动
  • 学术会议中的PPT和海报的排版问题仍然完全由研究人员自己管理
  • 当然,本文默认的原则是,只要你愿意花钱,这些永远可以找专业的人去帮你做

排版本身包括的知识很庞杂。下图是维基百科上typography词条下的术语表,除了体现了排版知识的庞杂之外,倒是也按照按照对象的空间尺度分了类——这也是我们入手任何排版任务时应该考虑的顺序:页面设置、段落、字符和标点符号。

维基百科上typograpy词条下的术语表。注意page、paragraph、character和puctuation四个层次。

首先,在Word中,设置显示回车、空格等非印刷字符,将有助于我们排版。

建议在Word中设置显示所有格式标记。

标点符号的一些问题,我在前面已经讲过了。以下我将从小到大,按字符(characters)、段落(paragraphs)到页面(pages)的顺序讲。

3.1 字符

在Word中这对应着“字符”设置对话框。

在字符方面我们首先要区分两类英文字体家族:衬线字体(serif)和无衬线字体(sans serif)。衬线字体的一些修饰特征,使得我们可以更快的阅读更小、更密集的文字。因为我们的眼睛只需扫过这些修饰之处,而无须完整辨认出整个字母,我们的大脑就能帮我们“脑补”出整个字母。反之,无衬线字体多多少少需要我们更加定睛去看清每一个字母。所以,衬线字体更适用于大量文字的正文。无衬线字体适用于标题(包括小标题)或者字少的屏幕显示(比如讲演幻灯片)。不过,我认为这里面没有特别严格的原则性规定。我建议各位多翻阅优雅的出版物,找到自己喜欢的方式。按照上述的应用理由,在中文里,宋体可属于衬线字体,黑体和各类等线体可属于无衬线字体,因为它们也具有上述的效应。但是,我个人品味喜欢使用一种合适的楷体来作为正文字体,关于使用楷体的体会我会在整个系列文章的最后分享。

衬线字体(serif)和无衬线字体(sans serif)的主要区别

其次我们要注意英语中的“斜体”分为italic和slanted。slanted意思就是生硬的把正体字拉斜,而不作任何改动。slanted是不常见的做法,但我在这里提出是有原因的,马上会详述。

Italic和slanted对同一字体的不同处理

事实上,一个字体集(font family)的不同的风格(typeface)都需要独立设计,也以独立的字体文件形式存在。例如,如果某名称的字体,事实上没有提供italic的设计,那这一字体就没有斜体。上图给出了一个字体的italic处理,我们从字母a、f、n、i、v等的区别就容易理解为什么“斜体是需要独立设计的字体文件”,而如果你真的只需要slanted,根本无需设计师去独立设计,只需要计算机自动把原本的正体字仿射地拉斜即可。严格来说,“粗体”(bold)只是使用了某个较大字重(font weight)的版本而已。一个比较齐全字体集还可以提供更多不同字重,往往从bold,semibold,……一直到light。但“加粗”也同样是可以通过仅从一套常规字重的字体通过计算自动实现的。

很不幸地,Word默认提供这些功能。既倘若你所选定字体没有粗体或者italic的设计,在Word中仍然能设置斜体和粗体,这时Word给出的斜体就只是slanted。

特别地,中文字体都没有“斜体”一说。如果你在Word里对中文字体设置“斜体”,你看到的就是slanted的结果。

在这里我要解释两个问题。一是:slanted不好吗?二是:中文字体为什么没有“斜体”一说。

Slanted跟Italic相比的“不好”可以这么去理解。在古腾堡印刷传统中,当人们需要使用一种不同的风格时,往往是有一定的表意目的。比如,在英语中为了强调(emphasize),所以要用斜体。为了表示书名或者文章的标题,需要使用斜体。在英文印刷的历史长河中,斜体字母都是要另外刻的,没有计算机帮你把印出来的正体拉成斜体。那么,旧时代的字体设计师门既然要给同一字体集设计一套斜体,为何不干脆把每个正体拉斜了事,而是要像上图例子那般给一些字母换一种设计呢?这个问题我只需提出,答案大家可以自己查阅。但既有这一问,就说明我们在正式表意目标下需要使用斜体时,应该使用的就是italic。

但是上面说slanted的“不好”是加了引号的,因为这不是绝对地在所有场合都不受欢迎。我们注意到,上图中的例子是衬线字体。对于非衬线字体,本来就没有这些修饰,因此它的斜体就往往难说有什么重新设计的原则(除非设计师有它自己的美学意图)。下图是又一个例子。

Italic对于无衬线字体,很可能本来就是一个slanted的效果。

从上图的Impact字体可以感受到,我们也许在设计广告牌之类需要使用艺术字的时候,将享有更自由的做法,此时完全没必要排除slanted在任何一个字体集的可能,只要这在艺术上精准体现了你的意图。学术场合中,也许只要制作讲演幻灯片或海报的时候,才会有这种因素。正式文本需要按正式文书惯例。

文字体为什么“没有斜体”,这里相关的判断也是加了引号的。主张中文“没有斜体”的,讨论范围仅限于“斜体在英文文章中的用法”这一对比上。比如,中文不用斜体来表强调,而是用重点号。中文也不用斜体来表示书名或者文章的标题,而是使用中文的书名号“《》”(我们课题组的要求中,不采用方引号)。还有,中文在进行成段的引用(对应于英文中的block quote)时,也不会采用斜体。重点号可方便地在Word和Latex的CTeX环境下实现,但它很难在更多富文本编辑框中实现,所以也可以接受采用其他方式来实现,例如加粗,或者换一种字体集或字体风格,总之用回避slanted效果的斜体来实现上述的目的,主要批评的是那种照版英文原文的style到中文翻译上的做法。但是,也需要注意的是,中文规范中也并非完全不采用斜体。正如我在对slanted的解释里说的道理,在展示用途中,作为“艺术字”的功能,没有完全排斥slanted的原则。这个知乎回答 中举的中文斜体应用例子,正是由于它讨论的是展示用途,而非要在中文正文中表示强调等。

我在这里抛出一个原则:同一文本,不要使用超过两种风格的字体。这里的“风格”是泛指上述各层面:不要有两种serif或者两种san serif、不要有两种字体集、不要有两种字重……等等。“不超过两种”原则限制,能严格遵守,就严格遵守。大家也可以翻阅大量学术文献的出版版本或者学术专著的印刷版来体会它们是否违反了我在此抛出的原则。

字符层面需要调节的尺度,包括字母间距和单词间距。下图展示了这个问题下不同做法的效果。当然,一般情况下,Word帮你把这件事按默认设置处理好。但这不代表默认设置在任何情况下都是最好看的。我在这里举一个例子:中文的字符间距,往往需要跟据行距、段落和页面的情况进行调节,默认间距往往相对过密。但是,我一时很难找到漂亮的正面例子来说明这个问题,以后碰到了,会补进来。

英文的字母间距调整还会涉及到kerning和ligature问题(如下图),在这里只是提示大家留意这些现象,但未必是你需要亲自注意的,因为这些问题在专业的编辑软件中都帮你解决好了。

上下标的字到底缩到正常字的百分之几大小,放在正常字的多高或多低的水平位置,原则上都是可调的。但一般情况Word已有的默认设置我们不去改动。这件事在公式问题上可能更有实际意义些。

Mathtype中的上、下标设置

3.2 段落

Word中的“段落”设置对话框中的内容,代表了排版中关于段落层次需要考虑的绝大部分问题。

全英文稿避免两端对齐。

现在很多期刊论文都是双栏甚至三栏排版的。之所以有这种偏好,是认为一行的单词数超过某值时会造成阅读困难,而普通印刷品的纸张大小(A4或Letter)又有那么宽,所以分栏。分栏后往往使得一行放不下几个单词,特别是当长单词比较多的时候。

这时如果我们坚持采用两端对齐(justification),就会出现下图的不良情况:1)出现“河流”(river);2)词间距无法统一;3)甚至字符间距也无法统一。所以,左对齐(让右侧参次不齐不去管)是推荐做法。

两端对齐(justification)造成的各种问题。

有人问了,长的单词,用连字号来断开不好吗?确实也有一个设计原则不鼓励使用连字号把一个长单词断开成两截。但我认为这不失为一个权宜之计,特别是在中英混排不得不采用两端对齐的情况下,允许长英文单词以连字号断开是最佳的做法。

句与句之间,是有着与单词之间不一样大小的间隔的。在纸媒印刷的时代,人们可以自由创建任意大小的间隔,但是在打字机时期,我们只能按键盘上的空格键若干次,成倍地制造间隔。因此,在打字机时期形成了一种惯例,句中的标点符号(如逗号、分号、引号)后只打1个空格——这是单词间距,但是句末的标点符号(如句号、感叹号、问号)后要打2个空格。下图是打字机时代的一个例子。可以看出,若不是这么做,人在阅读时很难留意到句末。英语水平有限的同学可能体会不深,如果你希望迅速阅读一篇文章,准备使用“一目十行”的技能时,迅速判断语法结构是关键。而判断完整句子的结束与否,在英语语法中也是一个重要的要求。打字机时代之所以需要让句子间隔夸张起来,是因为打字机无法做到kerning,且每个字母的大小又是相同的。

在这个极端的例子中,句点后打了3个空格。
这是Word时代仍然延用不当传统造成的后果,结合“两端对齐”后,多余的空格给段落造成了大量的“河流”。

事实上在印刷业,使用单词间隔的2倍作为句子间隔是过于夸张了。所以,业界很早就明确规定:句末标点后,也按一次空格。到了Word时代的今天,很多排版问题Word都通过算法和默认设置自动解决了,但为了用户的传统,又保留了很多打字机时代的操作方式。例如,Word完全可以取消标点符号后打一个空格键的要求,因为算法完全能判断出标点符号的类型,并自动加上排版上所需大小的相应间隔。但这严重违返了打字机时代的惯例。这就好比至今“保存”按钮的图标是早已消失的物品:3.5英寸磁盘。正是因为排版学和排版软件的现状充满了类似这般理论上的“不自洽”,使得我们常常想要深究时都处处碰壁,思想更加混乱。我能啰嗦就啰嗦,但更多时候需要大家对排版学本身感兴趣,多了解其历史,来得到缓解。

我们更经常要求调节的是“行距”。这个概念也是笼统的。严格意义上,类似“行距”意义的,有好几个概念,如下图所示。在Word当中的“行距”设置,调节的是下图中的line space。而在Windows系统下的Word软件,调用不同字体时,可能由于字体的内部设计,“行高”(下图的line height)会有冗余空白(既远超ascent、descent的多余行高),叠加到Word的行距设置上,使得行距设置值相同,但采用了不同字体时,印刷效果上的实际行距不同。给你带来这种困扰的字体应该永久性拉黑。

前面提到,分栏的目的是减少每行的单词数。但是分栏后的栏宽受与页面大小和分栏数有关,字体本身的大小则是另一个独立的设置。你首先需要满足的原则是每行的单词数,具体怎么分栏,则要根据你字号来定。每行的单词数,叫the measure。有说法称,一行最好大概只有7到10个单词,供大家参考。

正式排版中我们还要避免“孤儿”(orphan)和“寡妇”(widow),下图是寡妇的例子:一个段落的最后一行成了某页的第一行。相应地,孤儿则是指一个段落的第一行成了某页的最后一行。我们当然希望,一个完整段落处于同一页,这样我们如果在段落内需要重读的时候不需要来回翻页造成心情烦躁。但书稿总之是要分页的,很难要求段落不被分页断开,因此我们至少希望不要造成孤儿或者寡妇。

寡妇(widow):一个段落的最后一行成了某页的第一行。
3.3 页面

Word中“页面设置”对话框中的内容,代表了排版中“页面”层次需要注意的大部分问题。我暂时想不到有什么特别值得在这里说的事情。

3.4 排版中的长度单位

磅(point)是出版用的单位体系,在这一单位体系12进制的,可能较常碰到的还有pica,12 picas = 1 points。在今天出版单位体系表示的各类尺寸,已经跟真实世界的物理尺寸建立了联系:1 inch = 72 points。

磅和英寸的换算关系

在屏幕显示方面,还会涉及到物理尺寸与像素之间的对应关系问题。例如,在一些专业作图软件中,字号既可表示为磅,又可表示为像素。但前者是使打印出来的东西的一致性所应采用的单位(因为它是物理长度单位,跟厘米英寸一样),但像素则是为了使屏幕显示出来的东西有一致性(看你怎么定义一致性)所应采用的单位。因为屏幕的最小显示元素是像素,无法在小于1像素之内做什么文章。所以在低分辨屏时代大家很精确地计算像素,因而习惯了像素单位。磅和像素之间的换算是一笔乱帐。大部分软件可能是按照1 inch = 96 px的惯例,来决定你设定了多少磅或多少英寸的东西,在显示屏上以多少像素显示给你看。你心里应该清楚,你不是在做网页设计或者软件界面设计,你的目标是打印出来之后的结果,所以软件的屏幕显示给你看到的只是“预览”。你应该抓住不放的是物理长度尺寸。

总之,“磅”在今天变成了无非是又一个物理长度单位。在排版时,处理各类物理长度单位之间的换算是家常便饭,建议在一旁打开计算器的长度换算功能。

在Word中文版当中,我们会碰到“字符”的单位,它不是一个物理长度单位。无论你用多大的字号(用物理长度单位表示,如多少磅),1字符都是指一个中文字的宽度。所以它是一个相对单位。英文中类似的单位是em和en,它们分别对应一个大写字母M和一个大写字母N的宽度。纵向维度类似的单位还有x-height,但它在word设置中用不上。

3.5 The HATS

HATS(Headings, Access, Typography, Spacing)代表着四个排版时需要注意的方面。后面两个跟前文介绍的内容有所重合。

Heading就是指,你写文章的时候要注意用小标题分节,不要哗啦啦从头写到尾。同时,提供一个小标题的目录。

Access是指,使用项目列表、表格、图形和照片来增加你文章的易读性。

Spacing方面,除了前文提到的各种排版中的常规间距问题外,还需要注意通过间距设置来产生对比,抓住或引领读者的眼球。这在一些宣传册、海报或者讲演PPT的设计中是有实用性的。

Z字形安排的内容顺序,更符合大部分人的阅读习惯。图中的方向是以从左到右(LTR)语言为例的。
3.6 中英混排的问题

至今中英混排的排版原则仍然没有特别完善。所以我对同学们的建议还是严格遵守学校发布的《学位论文撰写规范》以及里面提到的国家规定来进行中英混排。

Word已经在这件事上做了很多事情。但我们仍需注意的是:

左对齐还是两端对齐?如何表示中文的强调?中文标点符号的kerning?英文单词与中文之间的空隙?

所谓“中文标点符号的kerning”是指什么?例如:小明说:“今天天气真好!”在这里,冒号和左双引号同占一个中文字符空间,感叹号与右双引号同占一个中文字符空间。事实上Word的默认设置自动帮你做了这件事,但是在PowerPoint的文本框中这不是默认设置,你需要进设置使“中文版式”生效。

Word在中英混排时的部分自动处理。

如果你对中英混排的排版原则感兴趣,最好首先搜索相关设计领域的专业文章来作初步了解,然后做一下大陆和港台地区的不同官方规定的调查比较(甚至扩展到日文的规定),再去形成自己的理解。我这里留两个链接:

学术出版物的格式(一)

0. 写在前面的话

科学研究的成果免不了要以某种出版物的形式展示。例如,比较系统和深入的工作要印成一本书。就算只是一门课的讲义,用来发给学生,也需要注意基本上像一本书那样排版。新的研究成果要发表成论文,它也将会印在杂志和期刊上。学术会议上的口头演讲要制做幻灯片,学术会议里还有海报。以上这些场合都涉及到排版的知识。攻读研究生的过程本身就大量碰到这些锻炼机会,这也是研究生培养的一部分。网上一搜,不管是中英文,都有大量针对学术需要的排版知识了。

但是我发现上述认识对学生真正获得相应的技能并没有太大的帮助。

首先是学生一开始并不意识到,这件事情需要花专门的时间去系统了解,总觉得边干边学就行了。但是俗话说万事开头难。小活儿小难,大活大难。对于研究生来说,科学研究的每个环节对他来说都是新活儿,如果都“边干边学”,那么所有的小难大难累加起来将会形成高耸的学习门槛。

排版知识需要花专门的时间系统地了解……
或者,花钱交给专业的人去做。

其次,就算学生希望专门了解一下这方面的知识,也会在大量的信息下无所适从。这里面有“排版”这个概念从纸媒时代、低分辨屏时代、再到高分辨屏时代的历史转换遗留下来的“审美原则模糊”。我们都知道,自媒体时代,网上的资料都是小编总结的,天下文章一大抄,真正的来自同一个人的,统一自洽的亲身体会是很少的。有的文章抄的是纸媒时代的,有则抄的是低分辨屏时代的,有些原则仍适用于当下,有些则不适用了。学生如果想要拥有这种分辨力,就不得不对每条说教都追究“知其然知然所以然”,以便能独立思考这些原则是否仍适用于自己。这将大大增加学习的工作量,令人望而却步。

再者,学术场合的排版面临的问题也不是简单排版问题。它涉及图、表、文字和数学公式的混排。数学推导有长有短,还有在行中(inline),还涉及中英混排。一些一般性的排版知识介绍,无法覆盖研究生直接面临的问题。

先从一个基本的矛盾出发:排版领域本身就因为上述的历史转换而处于激烈的变革当中,不可能要求科学研究者们都是排版学专家。那么现实的社会到底是怎么协调的呢?先了解这个,知道了解哪些知识属于自己义务,而哪些则没必要强求,能够先设定一个边界。

1. 《撰写规范》(style guides)

作为对上一段的问题的回答——《撰写规范》或者style guides代表着研究人员必须了解的排版学知识的最小范围。

每位研究生都至少经历过本科学位论文的锻炼。一般学校会发布一个“学位论文撰写规范”。用这个关键词在网上搜索,能够找到很多高校和科研院所发布的版本。

华南理工大学的《研究生学位论文撰写规范》。左边的导航视图展示了这类规范一般包括的部分内容。

这些“撰写规范”针对的是中文或中英混排的。英语论文方面,类似的资料叫style guide。投过稿的同学应该知道,每个期刊都会对稿件排版有相应的style guide或称guidelines。同学们应该有过照着这些style guide中的要求重复修改自己稿件的经历。

《撰写规范》或者style guides代表着研究人员必须了解的排版学知识的最小范围。

一些权威的出版社或出版期刊的学会的style guides已经成为经典,众所周知且被广泛采用。这些style guides的规定,也成了一种普适的规范。我们平时经常听到的一些来自学术前辈的关于排版上的说教,其实都可以追溯到这些style guides。但是,一般人口中说出的经典style guides,其实都各有侧重。例如,美联社的The Associated Press Stylebook (AP Stylebook)主要针对新闻媒体。源自芝加哥大学出版社的Chicago Manual of Style主要针对正式出版(为出版社所参考)。美国心理学会(American Psychological Association,APA)的出版手册(Publication Manual)主要在医学类论文的学术写作当中被大量参考。很多医学期刊并不为自己新订一个style guide,而是直接要求以某最新版的APA为准。微软发布的Microsoft Manual of Style,主要针对软件和网页的用户界面。

我所在的领域是物理学和化学交叉领域。更适用的是美国化学学会的ACS Style Guide和美国物理协会的APS Style Guide

这里提到的各种style guide,每套都是一本书,其中有一些的正版全文是需要收费的。既然我说这些style guides的内容代表着研究人员应该掌握的所有排版知识,那么就暗示着,了解排版需要花的时间无法也不该是碎片式的“边干边学”、“碰到再学”。

在这里插一句提醒。高校的针对中文论文的《撰写规范》,常常大量引用我国已有的国家标准。例如说,数字的规范“按国家语言文字工作委员会等七单位1987年发布的《关于出版物上数字用法的试行规定》”。凡是这种情况,读者理应去详细阅读所提到的规定;这些规定里的内容《撰写规范》里一般都不再复述。实际上绝大多数同学可能只按照《撰写规范》里讲了要求来进行修改,剩下的按照导师的要求改。更多情况可能交给打印店解决了。我比较赞同两个极端,一个极端是自己全面了解,包括《撰写规范》中引用到的国家标准;另一个极端就是交给打印店,按照“专业的事交给专业的人办”原则。所以,如果我指出了什么格式上的疑问,学生一问三不知,但能够确定说“这是打印店帮搞的”,我就不会纠结。未来的社会,只会分工越细;研究人员必须知道的专业外的排版知识,只会越来越少。

但我的当下建议仍然是,就算还不确定要投搞到哪个期刊,甚至根本不是在投稿,而是一般性地创建文档,我们也要养成重视排版的习惯。自己要有着一个“个人默认”的撰写规范,指导着自己创建出来的任何文本。你发给他人的任何非正式的东西,都是正式的、统一的、自洽的。一份“东西”在排版格式上的统一自洽,能增加对方对这份“东西”的信任和阅读的意愿。你的这种素养无形中增加你成功的机会。这个“个人默认”的撰写规范,就可以直接采用或继承上述的某一种,以减轻自己的负担。

由于上面介绍的任何一套style guide的内容都已经十分全面了。以下我只挂一漏万地提一些我想提的小要点。请各位首先做到详细学习上述的《撰写标准》和某一个style guide,不要懒惰地把你刷到的这篇或任何一篇“经验分享”当作主要学习资料。反过来,一篇只提几个具体问题的格式经验,对你的用处仍然是很大的。因为处理文本格式问题非常讲究“举一反三”。别人向你提了一个具体的问题,那么类似的方面的问题还包括哪些,你就都要列举过来,全文查改。如果没有“举一反三”的素质,那么论文格式的修改就会陷入“讲一个改一个”的无尽深渊当中。一个人能够从一个小问题“举一反三”的反应出其他类似问题的前提是,他已经首先了解“一共包括哪些方面”、“哪些问题属于哪些方面”。同学们更需要建立的是这个概念体系,而非死记硬背大量鸡毛蒜皮的“格式要求”。

如果没有“举一反三”的素质,那么论文格式的修改就会陷入“讲一个改一个”的无尽深渊当中。

学术出版物的格式(二)

2. 文字内容的风格

翻开任何一个《撰写规范》或style guide,都能看到大致相似的内容。我个人把这些内容大致分为两部分。第一部分是“文字内容的风格”(style),它包括论文的语言要求及文字书写的规范、物理量名称、符号与计量单位、数字、公式、……等等。第二部分是“排版”(typography),大到页面设置,小到字间距、行距等,所有涉及尺寸位置的方面。至于图和表,它们都有各自独立文字风格要求和排版要求,跟正文的两方面要求都会有些区别。本节主要讲正文的文字内容风格,如前面说过地,只讲一些零散的要点,不是系统全面的介绍。

2.1 语法

语言的风格,大部分是语文教育和英语教育的范畴。这也就是为什么理科专业的导师们经常会相互吐槽学生“语文没学好”。大部分学生犯的问题就是十分基本的语文问题,很难拥有在这里讲的必要。但是公道地说,我们的中小学语言在写作的训练上,对应用文的写作要求太浅了,重视也很不够,不像一个公民语文教育样子。英语教育就更加落后于研究生需要。大部分研究生英语写作能力远远无法胜任他们面临的写作任务,而且是全方位的,从词汇到语法,更遑论风格了。在此我只用一句总结——语言表述必须清晰、准确。至于具体如何做到,就属于语文或英语写作训练的范畴了,我没办法手把手地教。不过,按照“专业的事情交给专业的人去办”的原则,语言风格问题,可以用类似Grammarly这样的在线服务或者找专业论文润色机构去搞定。或者,这能反过来帮助你理解,到底哪些属于“语言的风格”问题而非“排版”的问题——论文润色机构负责的部分,就属于“语言风格”;他们不负责管你的排版。

语言表述必须清晰、准确。
Language presentation should be clear and accurate.

在这里我提几个方面:1. 单词拼写(spelling);2. 用词(diction);3. 标点(punctuation);4. 数量与单位。

2.2 单词拼写

大部分单词拼写的问题可以查字典或语法书解决。我在这里提两个问题。第一是名词的复形(plural forms)。下面是我总结的一些例子。

具有特殊复形拼写规则的单词

上图按规律性分了组。举一反三的话,还有很多常用词是需要注意的,比如analysis的复形是analyses,坐标轴axis的复形是axes。至于,如何正确使用复形,就属于基本语法问题,自己看语法书学习。这里只强调当你需要使用复形式,需要注意拼写。

第二个问题是所有格(possessives)。我们经常会讲到多作者的共同工作。例如Kanter and Marshall’s results,表示这两个人共同得到的一份结果(这时result一词仍使用复形则可能表示它们共同得到的结果不止一项),注意这时只有最后一个人的名字后需要加“'s”。如果每个人都各自做出了一份结果,那就要在每个人名后加“'s”。

以我提到的这两个问题为例,大家就应该明白“拼写问题”不光是查字典的问题。大家需要对类似的问题敏感起来。

2.3 用词

注意相近意义词(组)的准确选择和运用。例如:

  • about/approximate
  • between/among
  • comprise/compose/consist

至于这些词的使用上具体要注意什么,英语课上会讲,我就不在这里复述了。

注意避免偏见(bias)。例如性别中性(gender neutrality),“人类”不说mankind而说humans/human beings,“发言人”不说speakman也不说speakwoman而用speakperson,等等。此外还有种族的偏见、疾病或身体残缺的偏见等等。偏见问题主要都在社科或医学类的论文中碰到。

注意避免冗余(redundancy)。例如,It has been xxx that …可简化为As already xxx, …;a number of改成several;are known to be改成are。类似这些问题,很多软件自带的语言提示都会显示。

2.1.1和2.1.2两个小节涉及到的问题,主要是综合的英语素养。而关于如何提高英语,就需要另外开一个系列来分享了。

2.4 标点

英语有自己的标点符号规范,跟中文不同。中学理应掌握的,我就不复述了,但不代表学生不会犯。所以请你们注意复习。我在这里只提几个小方面

2.4.1 关于“横线”模样的符号

我们一共有以下这些“横线”模样的符号:

符号名称符号字符UNICODE
负号(minus)U+2212
连字暨减号(hyphen-minus)-U+002D
不间断连字符(non-breaking hyphen)U+2011
短划线(en dash)U+2013
长划线(em dash)U+2014
几种“横线”模样的符号

键盘上直接能打出来的那个,是连字号暨减号,它应仅作为连字号(hyphen)使用。之所以又“暨减号”,是早期打字机年代不得不作出的妥协。在正式出版物中,上表中五种符号具有截然不同的意义和功能。

两种字体下的四种横线符号区别。从左到右依次是:连字号暨减号,en dash,em dash,负号。

连字号(既连字号暨减号)用于在自动换行时断开行末长词。这在行宽词数较少,又想要保持两端对齐的时候可以起到帮助。

两端对齐时,使用连字号和不使用连字号的效果

功能完善的编辑器软件,都能设置是否叫软件自动断词。如果不允许软件自动断词,你就要手动添加连字号,才能实现上图右边的效果,否则就会看到左边的效果。这里啰嗦一下,一个多音节单词,到底能在哪两个字母之间加连字号,必须以词典为准。词典中的词条往往会写成“het·ero·ge·ne·i·ty”这种样子,其中的点号代表着你可以加连字号的地方,其他字母之间是不允许加连字号断词的。别乱加。

连字号还能用于用已有单词临时组成的新词的时候,例如temperature-dependent process、mother-in-law。也包括用前缀构造的词,如self-assembly。

有时你特别不希望某个单词被断开换行,又不想为了他关闭编辑器的自动断词功能,那你就可以在发现编辑器断开了某词时,在断开出添加不间断连字符。它不会被打印出来。

En dash和Em dash中的“en”和“em”是指英文字母N和M,用来代表着英语字母的两种字宽。所以En dash意思就是长度跟N一样的短画线。En dash用于把相连单词构成具有并列关系或相对关系的短语,相当于“and”、“to”的意思。最常见的是把两个人名并列,如Flory–Rehner模型、时温叠加time–temperature superposition。

Em dash是英语中的破折号。不要用中文全角的破折号。例:All three experimental parameters—temperature, time, and concentration—were strictly followed.

2.4.2 关于“全角”与“半角

中文正文中表补充说明时使用括号,应属于中文标点符号的一种使用行为,故应采用全角括号。例如:所采用的溶剂是N,N-二甲基甲酰胺(N,N-dimethylformamide,DMF)。在此例中,括号用于表补充,故为中文标点符号的使用,要用全角括号。括号中的内容是补充英文全称和缩写,中间的逗号也是中文文本的标点符号使用,应用全角逗号。用于表序号的括号不是行文中为了表示补充,而是序号的组成部分。由于序号本身是拉丁字母或阿拉伯数字,故应使用半角括号,例如:如图3(a)所示。由公式(3-8)可知。如果序号确为中文,则括号应用全角。例如(一)、(二)、(甲)、(乙)。数学公式中的括号用半角。

2.4.3 关于单引号

在物理量字母中表示prime、double-prime的符号是:U+2032)和U+2033)。使用时不加斜体。例如储能模量G和损耗模量G。不要用键盘直接输入的字符'U+0027),或者"U+0022)代替。键盘直接输入的叫apostrophe,在打字机时代由于键盘有限因而身兼数职。但它们本身不是表示prime和double prime的正确的字符。此外,在Word中键处这两个字符时,软件会根据上下文智能替换成单引号U+2018)和U+2019),双引号U+201C)和U+201D)。单引号和双引号是英文行文中表引用时使用的,也不是表示prime和double prime的字符。

另外prime和double prime也用于表示角分和角秒、时分和时秒,英尺和英寸。例如,角度为8°12′36″

2.4.4 关于术语

学科术语若需要补充其英语名语的,一定要先给出中文名词。例如,N,N-二甲基甲酰胺(N,N-dimethylformamide,DMF)。错误例子:满足橡胶的典型行为(Gough–Joule effect),严格来说此处表示的意思是“橡胶的典型行为”一词的英语是Gough–Joule effect。因此需改为,满足橡胶的典型行为,即Gough–Joule效应。或改为,满足橡胶的典型行为,即哥夫–焦尔效应(Gough–Joule effect)。

术语首次出现,一定要严格按照中文全称、英文全称、英文缩写的顺序完整给出。之后再次出现,一律采用英文缩写。这里举一个错误例子,在首次出现时这样给出:溶剂是DMF(N,N-二甲基甲酰胺)。何谓“首次出现”?术语“首次出现”的范围包括:摘要之内、章之内(学位论文)、结论之内。跨越上述范围,再次出现同一术语,重新属于“首次出现”。

最好编制一个全文术语中、英和缩写一览表。用Excel,按字母排序。

2.4.5 关于化学物质

化学名称的命名规则是有国际标准的。为方便和安全起见,一律在Wikipedia上的相应词条中确认正确的命名。这里提一些零星的要点。

表示基团位置原子的元素符号要斜体。例如N,N-dimethylformamide中的N是指甲基所在原子的位置,不是表示化学式中的原子本身(如NH2),要用斜体。表手性的RS要用斜体。表顺反的cistrans要用全小写斜体。

化合物名称中的短横线是连字符。其余标点符号均用半角(包括逗号、圆括号和方括号),逗号不加空格。例如:4-[4-(4-chlorophenyl)-4-hydroxypiperidinyl]-N,N-dimethyl-2,2-diphenylbutanamide。上述关于符号使用半角、不加空格等规定也适用于中文。例如N,N-二甲基甲酰胺。

长的化学名称处于行末时,英文版是可被断成两行的。断词规范尚处于讨论阶段。如果不希望在某连字符处被断开,应采用非中断连字符。

2.5 数量与单位

关于数字、数学表达式和数量单位的规定,ACS和APS的Style Guide已经足够齐全了。本来这是我觉得最没必要在这里重复的,却是每年学生中问题最集中的方面。我在这里列首先强调大家专门去看我推荐的style guide认真通读。

2.5.1 数学表达式

数学表达式分为“显示”(display)和“行中”(inline)两种模式。我课题组学生都习惯使用Word,建议Word用户习惯使用MathType来处理数学公式。因为Word自带的公式编辑器字体不支持Times New Roman,在正文字体有此要求时,会造成字体不统一。用MathType插件时要注意设置公式字号与论文正文字号相同。

如果不使用MathType插入行中公式,而是直接使用输入时,注意运算符和关系符前后要加空格。例如,x + y = 3。

物理公式列出后,一定要确保每一个变量的物理意义都被以文字进行了介绍。

2.5.2 物理量与数量

表示物理量的字母要用斜体。下标非变量表意义的要用正体。例如:平衡模量Geq,字母G表示模量用斜体,下标“eq”表平衡(equilibrium),不是变量,用正体。下标是变量的要用斜体。例如N个实数组成的数列xi, i = 1, 2, …, N

数的表示采用科学记数法时,乘号前后可不加空格。例如3.2×10−3。记得10的幂如果是负的,负号要使用正确的字符。含有不确定度的表示,用正负号(±U+00B1)。前后不加空格。例如:3.12±0.06。如果要结合科学记数法,需加括号(运算规则本身的要求),例如:(3.12±0.06)×10−3。正负号后的不确定度具体意义(标准差、95%置信度区间等)另用文字说明。

单位用正体(upright roman)。对于复合的单位,要统一到底是用除号“/”还是用负幂。例如,到底是按mol L−1表示,还是按mol/L表示,全文都要统一,不要一时采用mol L−1,一时又采用mg/ml。单位中如果表相乘的,用一个空格隔开,如kg m s−2。为了不被编辑器把这样的一个单位断成两行,这个空格要采用“不间断空格”(non-breaking space,U+00A0)。

还有很多方面,“全文统一”都是一条默认的要求。比如“升”用大写L还是小写l,虽无原则性要求,但至少要全文统一,最好在你个人这里绝对地统一,只要出自你手,都只有一种风格。类似问题不再一一列举。

摄氏度要用度符号(°U+00B0)和大写字母C组成°C,不要用U+2103)。因为包括Times News Roman在内的很多字体都没有这一字符,在软件中插入该字符,系统将自动改用宋体显示,造成字体样式不统一。另外,摄氏度单位与数值间要加空格,因为它不是一个角度。

在很多方面,“全文统一”都是一条默认的要求。

用百分号来表示浓度时,要尽可能避免使用wt%、%v/v等符号,因为这些符号的定义不普遍明确。所有百分数,一律表示成xx%,不再对百分号添加修饰。至于其不同的意义,就用文字说明。例如,每次都明确“质量分数为3%的溶液”、“粒子的体积分数为1%的悬浮液”(英语类似)。质量分数和体积分数是不同的变量,分别用不同的字母表示。例如x是摩尔分数、w是质量分数、φ是体积分数。好处在于,若这些分数的定义本身是明确的,则诸如“x = 3%”的表述意义就自然也是明确的,无需多作解释。同时有,x = 3% = 0.03,即无论用不用百分号,数量的意义也都是明确的。

理论上,所有测量结果,不管是本研究做的,还是其他研究报道的,都是同时具有不确定度的。测量结果的均值应含有多少个有效数字,由不确定度本身决定,不是任意取的。测量结果的加减乘除以及函数值的不确定度,要根据误差传递公式得出,于是这些计算结果的均值的有效数字个数也不是任意的。如果的确要只报道均值而不附带不确定度,至少有效数字的个数要合理。而且全文提到同一结果是有效数字个数要统一。例如,在提到同一个压强时,不要前面说“压强是9 MPa”,后面又采用“9.0 MPa”。高分子的分子量是平均分子量,但在惯例上,我们不将分子量分布视为“分子量测量的不确定度”,用正负号带上其“标准差”或“95置信区间”,而是将分子量分布本身视为一种关注对象。因此平均分子量本身的有效数字位数无法通过“不确定度”确定,仅可遵循惯例,即精确到100 Da。例如,PEG的重均分子量是35100 Da。标准原子质量单位(即用于表示分子量的单位),最好统一使用道尔顿,不要使用g mol−1。因为后者意义与前者是不同的。前者是质量的单位,它是碳-12原子质量的1/12,原则上可用于表示一切质量;后者不是质量,而是摩尔质量,即每摩尔某对象的质量。仅在公式推导过程中用到分子量这个物理量时,由于这个物理量本身的定义就是一个分子的质量,故而才隐含默认了1 Da = 1 g mol−1的换算关系作为附加条件;这个换算关系并不是单位道尔顿的定义,而是一个声明!再者,我们不会讲“量取多少摩尔的聚合物”,因此聚合物的平均分子量用摩尔质量表示是没有实际意义的。

测量结果的均值应含有多少个有效数字,由测量的不确定度本身决定,不是任意取的。

单位中表示10−6的前缀字母要用专用符——微符(µU+00B5),而不要用希腊字母μU+03BC)。例如,5 µL,而非5 μL

表示数量的范围,照理应使用波浪号运算符(U+223C),而不是键盘直接打出的颚化符(~U+007E)。顾名思义,后者是在西班牙语、葡萄牙语等语言中表重音的符号,因此该符号的位置是靠顶的。然而由于U+223C在Times New Roman、Arial等常用字体中都没有,因此只好用颚化符代替。由于波浪号运算符是作为关系符使用的,因此前、后要加空格。有单位的,需要前后都带单位。例如:3 cm ~ 5 cm,不能写成“3 ~ 5 cm”。就算使用文字“至”表示范围也一样,例如3 cm至5 cm。如果是科学记数法,也应严格写成:3.0×10−3 m ~ 5.8×10−3 m。于是,这种表示规范也兼容涉及不同量级的情况,例如3 cm ~ 5.08 m,3×10−2 m ~ 5.08 m等,意义也是明确的。表示一系列离散值时,在中文行文中用正确的标点符号——中文顿号隔开,且每个数都要加上单位。例如,在温度为10 °C、20 °C、30 °C和50 °C下分别进行测试。如果要用物理量等号的形式,则属于一个数学表达式整体,因此正确的标点符号是半角逗号,因为在英语和数学表达式中,表并列是用逗号的,而且要加空格。例如,在温度T = 10 °C, 20 °C, 30 °C, 50 °C下实验。这里不再使用中文“和”,由于是中文文本,也不应使用英文“and”,故什么都不用。

单位本身足以明确物理量种类的,可不再明确。例如,在80 °C下进行测量。但严格的做法应该明示!例如,在温度为80 °C下进行测量,或者在T = 80 °C进行测量。