原标题:时空的乐章——引力波百年漫谈 (一)
一. 称不上源头的源头
甚至一度致使 LIGO 网站因访客过多而瘫痪。 LIGO 探测到的引力波来自距离我们约 13 亿光年的一对黑洞的合并, 那对黑洞的质量均数十倍于太阳质量, 其中数倍于太阳质量的巨大部分在合并过程中转变成了能量, 以引力波的形式释放了出来。 这种引力波的最大功率——即单位时间内释放出的能量的最大值——甚至超过了可观测宇宙中所有星星辐射功率的总和, 实在是惊心动魄到了极致, 而它被 LIGO 探测到的扰动幅度却比原子核的线度还小得多, 又实在是细微到了难以想象。
这种壮丽而又精微的现象背后有一连串引人入胜的问题, 比如: 引力波究竟是什么? 什么样的物理过程会发射引力波? LIGO 之前的引力波探测为什么不成功? LIGO 又为什么成功? 我们如何从 LIGO 探测到的比原子核的线度还小得多的扰动中推知出一对黑洞的合并, 甚至还推算出黑洞的质量及合并过程中释放的能量?…… 最后但并非最不重要的则是: 观测引力波的意义何在? 这一领域的前景何在? 在本系列中, 我们将沿着长长的历史足迹, 用文字和数学两种语言, 从理论和观测两个方面, 来讲述引力波的故事, 并对上述问题——以及许许多多其他问题——进行探究。
往历史足迹中看, 引力波的基础是引力理论, 引力理论的源头则在一个几乎称不上源头的地方。
让我们就从那个称不上源头的源头开始讲述引力波的故事吧。
形容一个孩子出生, 乃至形容一个新生事物的诞生, 有一个很俗套的词语, 叫做 “呱呱坠地”。 我们撇开 “呱呱” 不论, 且说说 “坠地”: 重物会 “坠地” 是人类最原始的经验之一, 它的幕后推手则是引力。 因此从某种意义上讲, 引力理论的诞生是真正的 “呱呱坠地”——不只是形容, 而真正是源自对重物 “坠地” 的观察。
在这种观察中, 最著名、 影响最大的论述出自公元前 4 世纪的古希腊哲学家亚里斯多德 (Aristotle)。 在他的《论天》(On the Heavens) 一书中, 亚里斯多德对物体的运动进行了详细分析, 其中针对单一质地的重物的下落运动 (即 “坠地”), 他给出了这样的论述:
金、 铅, 或任何其他有重物体的下落运动的快慢正比于它的大小。
这一论述中下落运动的 “快慢” 指的是——或者说接近于——后世所说的速度还是加速度? 亚里斯多德未作直接说明, 不过从他的其他论述中可推测出那是指速度[注一]。 类似地, 这一论述中重物的 “大小” 指的是后世所说的体积、 质量还是重量? 他也未明说, 不过由于对单一质地的重物来说, 这几者是互成正比的, 故无需区分。 借助这些词义上的澄清, 我们可用现代符号将亚里斯多德的重物下落规律表示为:
其中 v 是重物的下落速度, m 是重物的质量。
以时间之早、 知名度之高及影响力之大综合而论, 亚里斯多德的重物下落规律称得上是引力理论的源头。 当然, 这一源头与现代引力理论之间横亘了 2,300 多年的岁月, 两者无论从明晰性还是正确性上讲, 都是差得很远的。 事实上, 尽管澄清了词义, 亚里斯多德的重物下落规律依然问题多多。 比如一般的重物下落哪怕在近似意义上也不是匀速的, 却被当成了匀速, 这些就不站在后世的高度上细究了[注二]。
但有一点仍值得说明, 那就是我们虽将亚里斯多德的重物下落规律视为引力理论的源头, 但在亚里斯多德时代是不存在 “引力” 一词所包含的 “万有引力” (universal gravity) 概念的。 不仅如此, 亚里斯多德的重物下落规律甚至连地球引力场这一特例下的引力效应都算不上, 因为对亚里斯多德来说, 重物之所以下落, 乃是因为它们有趋向 “宇宙中心” 的天然运动, 跟地球无关。 在《论天》一书中, 亚里斯多德这样写道:
若将地球移到如今月球的位置上, 地球上的东西将不再落向它, 而是会落向它目前的位置。
这句话清楚地显示出, 亚里斯多德心目中的重物下落并不是落向地球, 而是落向碰巧被地球占据着的当时所谓的 “宇宙中心”, 若将地球移走, 重物是不会被地球吸引走的。 从这个意义上讲, 亚里斯多德的重物下落规律以现象而论虽是对引力效应的一种描述, 就本意而言, 却跟后世所说的引力理论有着显著区别, 因此我们称这一源头为 “称不上源头的源头”。
虽然用后世的标准来衡量, 亚里斯多德的重物下落规律无论从明晰性还是正确性上讲都问题多多, 但在 2,300 多年前, 这样的论述较之普通人的日常观察, 乃至普通哲学家的定性论述仍有一个突出的优点, 那就是涉及了数量关系——这也是我们之所以将它视为引力理论的源头。 在人类探索自然的历史上, 从定性的观察和论述过渡到数量关系是一种重大进展, 因为数量关系的出现不仅意味着定量表述的开始, 而且也开启了定量检验的大门[注三]。
不过亚里斯多德本人并没有迈进那扇大门, 因为他注重的乃是自然现象, 对在后世科学中扮演重要作用的实验却颇为轻视, 视之为人为现象。
由于只注重自然现象, 亚里斯多德的重物下落规律虽涉及了定量表述, 实际上却连定性观察的基础都很薄弱, 而基本是纯粹思辨的结果。 这也并不奇怪, 因为自然现象——尤其是像重物下落那样偶然发生的自然现象——是不受观察者控制, 从而往往出现在观察者未作准备的情形下, 并且往往是转瞬即逝的, 观察者只能作粗略而片面的观察。 粗略而片面的观察, 加上闭门造车式的纯粹思辨, 用这种重思辨轻实证的手段得出既不明晰也不正确的结论是不足为奇的[注四]。
遗憾的是, 在实证意识薄弱的早期科学中, 从权威的影响中走出来是不容易的, 因此历史用了很长的时间才完全摆脱亚里斯多德的重物下落规律。
物体在水和稀薄空气中下落时, 它们的下落速度必然正比于重量, 因为水和空气不能以同样的程度阻碍它们, 而是更容易在重物面前退让; 另一方面, 真空在任何时候、 任何方向上都不能对任何物体构成阻碍, 而是按其本性持续退让, 由于这个缘故, 任何物体哪怕重量不同, 在真空中都必然以相同的速度下落。
严格讲, 卢克莱修这段文字算不上是对亚里斯多德重物下落理论的直接异议, 而只不过是在认可后者的同时, 在后者所考虑的情形之外提出了真空中物体的下落速度与质量无关的附加观点。 而且就连这附加观点也并非卢克莱修的独创。 事实上, 亚里斯多德自己在《物理学》 (Physics) 一书中就曾提出过同样的观点, 只不过他以这一观点跟自己的重物下落规律相矛盾为由, 得出了真空不能存在的结论, 而不像卢克莱修那样给予了认同。
用现代符号来表示, 被亚里斯多德提出过, 又被卢克莱修所认同的这一真空中的重物下落规律可以写成:
不过这一规律虽在一定程度上往后世的重物下落理论又靠近了一步——因为具备了重物的下落规律与质量无关的重要特征, 却跟亚里斯多德的重物下落理论一样是纯思辨的, 而且同样是针对速度而非加速度的。
随着时间的推移, 开始有人从经验乃至实验的角度对亚里斯多德的重物下落理论提出了直接并且更细致的异议。 比如公元 6 世纪的神学家兼学者菲罗波努斯 (Joannes Philoponus) 在注释亚里斯多德著作时曾经指出:
如果你让一个比另一个重好多倍的两个重物从同样的高度落下, 你会看到运动所需的时间并不依赖于重量之比, 而是相差很小。
菲罗波努斯的这一异议跟晚了 1,000 多年的伽利略 (Galileo Galilei) 对亚里斯多德重物下落理论的质疑是相当接近的, 后者在 1638 年出版的名著《关于两门新科学的对话》 (Dialogues Concerning the Two New Sciences) 中对亚里斯多德是否用实验检验过自己的重物下落规律表示了 “高度怀疑”, 并且以代表伽利略本人的萨耳维亚蒂 (Salviati) 与代表亚里斯多德学说诠释者的辛普里修 (Simplicio) 对话的形式写道[注六]:
亚里斯多德说 “一个从一百肘尺高处下落的一百磅铁球在一个一磅铁球下落一肘尺之前就能落地”。 我说他们将同时落地。 你通过实验发现大的比小的领先两个手指的宽度, 也就是说, 当大的落地时, 小的离它只有两个手指的宽度。 我想你该不会将亚里斯多德的九十九肘尺藏在这两个手指的背后, 或只提我的小误差而对他的大错误默不作声吧。
单纯从对上述结论的陈述上讲, 伽利略的质疑跟菲罗波努斯的异议并无太大分别, 都是既指出了亚里斯多德的错误, 也承认了不同的重物往往不会严格地同时落地 (因为有空气阻力的影响), 从而有基本相同的周详性。 但伽利略的质疑比菲罗波努斯的异议著名得多, 因为伽利略作为现代实验科学的奠基人, 在结论之外所做的 “功课” 要充分得多, 对重物下落的研究也远比前人的系统和深入得多, 不仅指出了亚里斯多德的错误, 而且确立了重物下落的正确规律。
与亚里斯多德所推崇的自然现象相比, 实验由于是在观察者有准备乃至精心设计的条件下进行的, 不仅可以得到精密得多的观测结果, 而且还能远远超出自然现象的涵盖范围。 比如在伽利略的时代, 研究重物下落规律的一个很大的困难是地球的表面重力加速度太大, 重物很快就获得了太大的速度, 加上当时的计时手段很不精密, 使人们难以对下落方式进行精密测定。 而伽利略通过诸如斜面上的滚球那样的实验 “稀释” 了重力, 从而确立了重物下落的正确规律为匀加速运动——当然, 假设空气阻力可以忽略。 用现代符号来表示, 伽利略所发现的重物下落规律为 (其中 a 为加速度):
伽利略的发现不仅再次确立了重物的下落规律与质量无关的重要特征, 而且将其中的核心物理量由速度改为了加速度。 自那之后, 由于实验科学的崛起, 证据以无法遏制的步伐趋向雄辩, 亚里斯多德的重物下落规律很快就被完全摆脱了。 为了纪念伽利略的巨大功绩, 1971 年, 美国登月飞船 “阿波罗 15 号” (Apollo 15) 的宇航员斯科特 (David R. Scott) 在月球表面无空气阻力的环境下, 向地球上的亿万电视观众演示了一个铁锤和一片羽毛以相同方式落向月面的情形, 为伽利略的重物下落规律作了极富戏剧性的展示。
不过伽利略对重物下落规律的研究也有一个显著的局限, 那就是只涵盖了运动学——即重物是如何下落的, 而未涉及动力学——即重物为什么会下落, 因为伽利略同样没有万有引力的概念。 不过伽利略的研究虽只涵盖了运动学, 他将核心物理量由速度改为加速度, 却为动力学研究乃至万有引力的发现埋下了伏笔。
万有引力的发现还得再等一个人。
一个 “万有” 的东西照说该是很容易被发现的, 为何 “万有” 引力却屡屡躲过人们的视线呢? 这是因为引力在普通物体之间十分微弱, 从而使经验范围内的引力效应分成了重物下落和天体运动这两个貌似毫无关联的领域。 从这两个领域中洞察出相似性需要第一流的智慧, 而证明这种相似性则需要第一流的数学。
在伽利略去世的那一年——1642 年——一位兼具这种智慧和数学的科学巨匠诞生了, 他的名字叫做牛顿 (Isaac Newton)。
二、从牛顿引力到爱因斯坦时空
其中 m 是物体的质量, F 是作用在物体上的力, a 是物体的加速度[注一]。 这一定律引进了作为 (变速) 运动原因的力的概念, 并将之与运动的加速度定量地联系了起来。
与引进力的概念相匹配地, 《自然哲学的数学原理》一书的另一项重大成就是具体给出了一种力——而且是有着基础意义的力——的规律, 这种力就是万有引力, 这一规律被称为牛顿万有引力定律 (Newton's law of universal gravitation)。 牛顿万有引力定律给出了两个间距为 r, 质量分别为 M 和 m 的物体之间的引力 F, 其具体形式为[注二]:
出现在这一公式中的 G 是一个普适常数, 称为牛顿万有引力常数 (Newton's universal gravitational constant)。 当然, 这是以现代符号加以表述的结果, 牛顿的《自然哲学的数学原理》一书虽总体上是相当数学化的 (不过所用的数学工具偏于古典几何而非牛顿自创的微积分), 对定律的表述却是文字化的, 因而并未直接提供如 (2.2) 式那样的数学形式。
由上述牛顿第二运动定律 (2.1) 式和万有引力定律 (2.2) 式可以很容易地推出伽利略所发现的重物下落规律 (1.3) 式, 因为 (2.2) 式表明物体所受的引力正比于它的质量, 而 (2.1) 式告诉我们物体在给定外力的作用下运动时, 加速度反比于它的质量。 力正比于质量, 加速度反比于质量, 质量因此而被消去, 从而物体在引力作用下的加速度与它的质量——以及其他性质——无关。 具体地说, 在没有其他外力的情形下 (除非有特殊需要, 这一条件在下文中将不再提及, 但始终假定为成立), 任何物体在与之相距 r, 质量为 M 的物体的引力作用下运动的加速度为:
很明显, (2.3) 式右侧给出的正是 (1.3) 式中的常数, 在后世的术语中, 也被称为质量为 M 的物体在与之相距 r 处产生的引力场——或者更确切地说是引力场的场强[注三]。 利用牛顿的万有引力概念及后世引进的引力场这一术语, 伽利略发现的重物下落规律可以重新表述为: 物体在引力场中的加速度由物体所在之处引力场的场强所决定, 而与它的质量——以及其他性质——无关。 这样, 牛顿万有引力定律就不仅涵盖了伽利略所得到的有关重物如何下落的运动学结论, 而且从动力学上解释了重物为什么会下落, 完成了伽利略未能涉及的部分。
关于牛顿万有引力定律, 还有一点值得说明的是: 后世的物理学家喜欢把表示万有引力定律的 (2.2) 式中的质量称为 “引力质量” (gravitational mass), 以区别于表示牛顿第二运动定律的 (2.1) 式中的 “惯性质量” (inertial mass)。 更有甚者, “引力质量” 还被进一步区分为产生引力的所谓 “主动引力质量” (active gravitational mass) 和感受引力的所谓 “被动引力质量” (passive gravitational mass)。 这些质量的彼此相等则被视为额外的原理。 这种后世物理学家出于表述其他观念的便利而引进的繁琐性在牛顿的原始表述中是不存在的。 关于引力与质量的关系, 牛顿的原始表述是:
引力普遍存在于所有物体之间, 正比于每个物体的物质的量。
而所谓 “物质的量” (quantity of matter) 则正是《自然哲学的数学原理》开篇第一个定义所给出的、 被后世称为 “惯性质量” 的质量, 也是牛顿引进的唯一质量概念。
牛顿万有引力定律是真正的引力理论, 而且可以说是物理史上第一个称得上辉煌的理论。 天体的运行、 大海的潮汐都近乎完美地遵循着牛顿万有引力定律, 借助这一定律的威力, 天文学家们甚至像大侦探一样, 依据已知天体的运动推断出了太阳系第八大行星——海王星——的存在乃至位置, 谱写了物理史上最令人印象深刻的篇章之一[注四]。
但科学并没有在辉煌中沉醉。 牛顿万有引力定律虽然辉煌, 它的一个特点却在另一位科学巨匠眼里成了问题, 那位科学巨匠的名字叫做爱因斯坦。
1905 年, 爱因斯坦提出了著名的狭义相对论 (special relativity)。 狭义相对论一问世, 牛顿万有引力定律就成了一个老大难问题。 这是因为牛顿万有引力定律有一个特点, 那就是不含时间, 从而意味着引力的传播是瞬时的。 不幸的是, 狭义相对论却有一个速度上限: 光速 (speed of light)。 瞬时传播的引力跟有速度上限的狭义相对论显然是相互冲突的, 用爱因斯坦本人的话说: “以自然的方式将引力理论与狭义相对论联系起来很快就被发现是不可能的了”[注五]。
the Consequences Drawn From It) 的综述。 在那期间, 他忽然在思考这一问题上取得了后来被他称为 “一生中最快乐的思想” 的概念突破。
这一突破究竟是什么, 又是如何产生的呢? 1922 年 12 月 14 日, 爱因斯坦在日本京都大学的一次题为 “我是如何创立相对论的” (How I Created the Theory of Relativity) 的演讲中作了回顾:
我坐在伯尔尼专利局的办公室椅上, 一个想法突然闪了出来: 如果一个人自由下落, 他将感受不到自己的重量。 我吃了一惊。 这个简单的思想实验给我留下了深刻印象, 将我引向了引力理论。 我继续自己的思考: 一个下落的人是加速着的, 因此他的感受和判断是在加速参照系中发生的。 我决定将相对论推广到加速参照系。 我觉得这样做将能同时解决引力问题。
沿着这一思想实验的启示, 爱因斯坦提出了著名的等效原理 (equivalence principle), 即引力场中任何一个时空点附近都存在所谓的局域惯性参照系 (locally inertial reference frame), 其中的物理规律与不存在引力场时的惯性参照系里的物理规律相同[注六]。 依据这条原理, 爱因斯坦思想实验中自由下落的人之所以感受不到自己的重量, 是因为他的自由下落使他处于了局域惯性参照系中, 从而引力场仿佛不存在了。
等效原理是一条新原理, 但它的根基是古老的, 深植于被伽利略等人注意到, 并经牛顿万有引力定律所确认的 “物体在引力场中的加速度由物体所在之处引力场的场强所决定, 而与它的质量——以及其他性质——无关” 这一规律上。 因为否则的话, 假如组成人体的各种物质在引力场中的加速度因任何性质的差异而各不相同, 则哪怕自由下落也无法 “感受不到自己的重量”, 更遑论其他物理规律与惯性参照系里的物理规律相同了。
等效原理为构建新的引力理论提供了思路, 因为局域惯性参照系里的物理规律既然与不存在引力场时的惯性参照系里的物理规律相同, 那就可以由狭义相对论来描述。 那么引力场中的物理规律是什么呢? 答案就在爱因斯坦那 “一生中最快乐的思想” 里, 也就是 “将相对论推广到加速参照系”。
具体地说, 狭义相对论有一条所谓的 “相对性原理” (principle of relativity), 它要求物理规律在所有惯性参照系中都具有相同形式, 而 “将相对论推广到加速参照系” 则要求物理规律哪怕在非惯性参照系——也就是任意参照系——中也具有相同形式, 这被称为广义相对性原理 (generalized principle of relativity),
依据等效原理, 引力场 “有” 和 “无” 的区别——局域地讲——只是参照系的区别, 从而可以通过从局域惯性参照系到一般参照系的坐标变换来体现, 具体的体现方式则由广义协变原理所确定。 这听起来有些抽象, 做起来其实并不复杂, 因为在狭义相对论之后, 基础物理定律已大都表述为了具有洛仑兹协变性 (Lorentz covariance) 的张量方程, 这种方程距离广义协变原理的要求只有一步之遥, 我们要做的只是将局域惯性参照系中洛仑兹协变的张量方程改写为在任意坐标变换下都成立的所谓广义协变的张量方程即可。 这虽偶尔会出现需通过物理分析加以排除的歧义, 一般而言在数学上是轻而易举的, 往往只需依照所谓的 “最小替换法则” (minimal substitution rule), 将狭义相对论中的闵科夫斯基度规 (Minkowski metric) ημν 换成一般度规 gμν, 将普通导数 ?μ 换成协变导数 ?μ 即可。 从这个意义上讲, 广义协变原理对物理规律基本不构成约束 (但作为数学要求则是很强的)。 一旦物理规律被表述为广义协变形式, 引力场的影响——即引力效应——也就被涵盖在内了。
不过这一切对于构建广义相对论来说都是外围的东西, 因为漏掉了一个最重要的因素, 那就是引力场本身的规律。 其他物理规律都可以通过将局域惯性参照系中的——也就是狭义相对论中的——物理规律改写为广义协变形式而得到, 唯独引力场本身的规律不行, 因为引力在局域惯性参照系中是不存在的。
那么引力场本身的规律该如何得到呢? 刚才提到的 “最小替换法则” 其实已给出了一个重要提示。 因为 “最小替换法则” 意味着引力效应全都体现在了闵科夫斯基度规与一般度规、 普通导数与协变导数的区别上。 而从数学上讲, 这种区别归根到底就在于度规 (因为普通导数与协变导数的区别实质上亦是度规之别)。 既然引力效应归根到底就体现在度规上, 我们可以猜测, 描述引力场的规律可以用度规 gμν 本身所满足的某个张量方程来描述。
爱因斯坦的研究确认了这一点, 这也是他在创立广义相对论过程中付出的最艰辛的努力。
为了看出究竟什么样的张量方程可以描述引力场, 我们考察一下在没有其他外力的情形下物体在引力场中运动。 依据等效原理, 在局域惯性系中, 该运动是匀速直线运动, 运动方程为:
其中 τ 是所谓的仿射参数 (affine parameter), 对有质量物体来说通常选为固有时 (proper time)。 依据广义协变原理, 引力场中的物体运动方程乃是上述方程的广义协变形式, 也就是众所周知的测地线 (geodesic line) 方程[注七]:
其中的Γμνλ “马甲” 众多, 名称相当混乱, 有时称为克里斯托费尔联络 (Christoffel connection), 有时称为列维-奇维塔联络 (Levi-Civita connection), 有时称为黎曼联络 (Riemannian connection), 有时甚至笼统而不严格地称为联络。 我们姑取其中最著名的人物, 称其为黎曼联络, 它是由度规的导数构成的。 不难证明, 在物体运动速度远小于光速的情形下, 上式的空间部分可近似为:
由于 dxi/d2t 就是物体的加速度, 因此将 (2.6) 式与 (2.3) 式相比较, 并注意到 (2.3) 的右侧乃是引力场的场强, 我们便可得到一个粗略但富有启发性的对应, 那就是黎曼联络对应于引力场的场强[注八]。 如果进一步考虑到引力场的场强是引力势的导数, 而黎曼联络则是由度规的导数构成的, 我们还可以得到另一个粗略但富有启发性的对应, 那就是引力势对应于度规。
有了这些启发性的对应, 描述引力场的方程就呼之欲出了, 因为建立在牛顿万有引力定律基础上的引力场方程是所谓的泊松方程 (Poisson's equation):
这里我们略去了牛顿万有引力常数 G。 在本系列中, 这一常数及光速 c 通常将被略去 (相当于采用 c=G=1 的单位制), 只在有特殊需要——比如计算数值——时才会予以恢复 (恢复的方法是量纲分析)。 由于泊松方程 (2.7) 式是关于引力势的二阶线性微分方程, 而我们刚才已经注意到了引力势对应于度规, 因此它启示我们寻找一个关于度规的二阶微分方程, 并且关于二阶导数是线性的。 当然, 它还必须是张量方程, 以便满足广义协变原理。 另一方面, 泊松方程的右侧是作为引力源的物质的质量密度, 这启示我们引进在狭义相对论中已被普遍采用的描述物质分布的能量动量张量 Tμν 作为引力场方程的右侧, 在非相对论近似下, 它的一个分量正是质量密度。
将这些启示综合起来, 引力场方程的形式可确定为右侧是能量动量张量 Tμν, 左侧是一个关于度规 gμν 及其导数的二阶张量 (因右侧的能量动量张量是二阶张量, 左侧也必须是二阶张量)。 不仅如此, 左侧的二阶张量还必须只包含度规的不超过二阶的导数, 并且关于二阶导数是线性的。 初看起来, 这样的条件相当宽泛, 但源自广义协变原理的广义协变性极大地限制了方程的形式。 事实上, 在数学上可以证明, 满足上述条件的引力场方程左侧的二阶张量必定具有 αRμν+ βgμνR + γgμν 的形式。 这里 Rμν 是所谓的里奇曲率张量 (Ricci curvature tensor), R 是 Rμν 的缩并, 称为曲率标量 (curvature scalar), α、 β 和 γ 则皆为常数。 更令人满意的是, 引力场方程右侧的能量动量张量 Tμν 还必须满足广义协变形式的能量动量守恒定律 ?μTμν = 0, 这对方程左侧作出了进一步限制, 要求 β = —½α。 将这些结果综合在一起, 并辅以弱场近似下引力场方程等同于泊松方程这一额外要求 (这一要求可用来确定左右两侧的比例系数), 可将引力场方程——也就是广义相对论的基本方程——最终确定为:
这其中左侧的最后一项——即 Λgμν 项——被称为宇宙学项 (cosmological term), 其中的常数 Λ 被称为宇宙学常数 (cosmological constant)。 宇宙学项从单纯理论推导的角度讲处于一个灰色地带, 因为严格贯彻 “弱场近似下引力场方程等同于泊松方程” 这一要求其实是可以排除这一项的, 但只要宇宙学常数 Λ 足够小, 这一项的存在既不破坏广义协变性, 也不会与经验意义上的泊松方程相矛盾, 因此是可以允许的。 在历史上, 宇宙学项的命运颇有戏剧性, 爱因斯坦最初创立广义相对论时是不包含宇宙学项的, 后来出于寻找一个静态宇宙模型的需要, 他引进了宇宙学项。 等到静态宇宙模型被观测否定之后, 宇宙学项也一度失了宠。 但到了 20 世纪末, 精密的宇宙学观测重新确立了宇宙学项的必要性, 使后者 “王者归来”[注九]。
宇宙学项对于宇宙的长远未来有着极重要的影响, 但对于本系列所涉及的话题却关系不大, 因此除非有特殊需要, 我们将予以略去。 略去了宇宙学项的引力场方程为:
这就是本系列将要采用的基本方程, 也称为爱因斯坦场方程 (当然, 包含宇宙学项的场方程也同样称为爱因斯坦场方程), 是爱因斯坦 1915 年得到的[注十]。 由于整个推导是从局域惯性参照系中满足狭义相对论的物理规律开始延展的, 因此广义相对论确如爱因斯坦所预期的, 自动解决了将他引导到引力理论上来的牛顿万有引力定律与狭义相对论不相容的问题。 当然, 上面的叙述是高度浓缩和简化了的广义相对论发展史, 且偏于概念发展的逻辑线索而并不严格对应于爱因斯坦的努力。 从单纯历史的角度讲, 广义相对论的发现其实还有很多额外的曲折性, 这里就不细述了[注十一]。
爱因斯坦场方程远比电磁场方程复杂, 因为它是非线性的。 不过这是意料中的结果, 因为跟电磁场本身不带电荷不同, 引力场本身就带有能量动量, 从而本身就能产生引力场[注十二]。 此外, 爱因斯坦场方程还有一个鲜明特点, 那就是右侧有赖于物质, 而左侧只跟时空有关——因为左侧的所有项都是由度规及其导数构成的。 不仅如此, 左侧的里奇张量乃是时空曲率张量 (curvature tensor) 的缩并, 在一定程度上描述了时空的弯曲。 这种漂亮的几何意义, 外加前面提到过的引力效应——具体地说是引力对物质运动的影响——体现在度规上这一结论, 使美国物理学家惠勒 (John Archibald Wheeler) 用了一句很精炼的话来概述广义相对论的特点, 那就是 “时空告诉物质如何运动, 物质告诉时空如何弯曲”。
在爱因斯坦的这种全新的引力理论中, 传统的牛顿引力消失了, 取而代之的是弯曲的时空, 为了纪念爱因斯坦的巨大贡献, 我们称这种时空为爱因斯坦时空。 在爱因斯坦时空中, 纯粹牛顿引力作用下的曲线运动成了爱因斯坦时空中的 “直线” (即测地线) 运动[注十三]。
从亚里斯多德算起, 经过了 2,200 多年; 从伽利略和牛顿算起, 经过了 200 多年, 我们终于迎来了广义相对论与爱因斯坦时空。 从牛顿引力到爱因斯坦时空是科学史上最激动人心的进展之一。 如今距离那一进展又 100 多年过去了, 在这种全新的引力理论和全新的时空中, 很多新兴研究领域已经发展壮大, 引力波就是那样一个领域。
1、亚里斯多德的很多著作是由授课或听课笔记拼合而成的, 有些甚至是在他去世多年之后才成文的 (因此严格讲, 所谓亚里斯多德的观点其实有一部分乃是署名为亚里斯多德的观点), 故结构相当松散, 重复累赘、 主题分拆之处比比皆是, 常需相互比照着理解或诠释。 另外要说明的是, 不能将亚里斯多德未对 “快慢” 的含义作直接说明视为他的疏漏, 因为我们这里所做的乃是用后世的概念去套他的论述, 以便于现代读者理解, 在亚里斯多德自己的时代是不存在这些概念的, 从而未作直接说明是很正常的。 对后文的其他类似分析亦当作如是理解。
2、若一定要细究的话, 则亚里斯多德的重物下落规律在一种特定情形下是近似成立的, 那就是将规律中的速度理解为重物在特定流体中下落时的终端速度 (terminal velocity)——也就是重力与流体阻力平衡时的速度。 但即便作这样的理解, 仍需进一步要求重物的下落运动是所谓的低雷诺数 (low Reynolds number) 运动, 因为这时流体的阻力正比于重物的下落速度, 而重力正比于重物的质量, 故两者的平衡意味着终端速度正比于质量。 不过低雷诺数这一条件这对普通物体在空气里从普通高度的下落往往是不成立的。
3、当然, 亚里斯多德的重物下落规律并非那个时代对自然现象的唯一定量表述, 古代的天文观测也具有令人瞩目的定量性, 不过对于日常现象, 定量表述在当时还是不多见的。
4、重思辨轻实证并非亚里斯多德的个人特色, 事实上, 思辨直到 17 世纪的法国哲学家笛卡尔 (René Descartes) 乃至某些更晚近的哲学家那里, 仍被视为是知识的可靠来源。
5、《物性论》是用所谓 “抑扬六步格” (dactylic hexameter) 的韵律撰写的, 翻译版本众多, 有诗歌型的, 也有非诗歌型的, 这里是从非诗歌型的英文版转译的, 只译含义, 不管韵律。
6、肘尺 (cubit) 是一种粗糙的古代长度单位, 定义为人的前臂长度。 一般认为, 古希腊的肘尺约相当于 0.46 米。
7、确切地说, 为便于跟前文衔接, (2.1) 式采用的是质量不变情形下的牛顿第二运动定律。 牛顿给出的原始形式用现代符号表示为 F = d(mv)/dt, 即力等于动量的变化率, 适用面比 (2.1) 式更广。
8、这里要说明的是: 牛顿对万有引力的研究比《自然哲学的数学原理》一书的出版早了约 20 年就开始了, 其间有过错误和不完善。 与牛顿同时代的学者中有数人也猜到了引力的平方反比规律, 而且从历史的角度讲, 他们与牛顿之间并不愉快的互动对牛顿的研究不无助益。 不过万有引力定律的确立涉及到几个很重要的层面, 比如为了证明万有引力定律可以解释天体运动, 需在开普勒定律与万有引力定律之间进行相互推导 (其中用到了牛顿运动定律); 又比如万有引力定律的原始适用条件是大小相对于间距可以忽略的物体, 这对天体基本成立, 对地球上的重物下落却并不成立 (因为地球本身显然不满足这一条件), 需额外证明球对称物质分布产生的引力相当于物质全部集中在球心; 而在更一般的物质分布下还需用到微积分手段。 当时能从数学上胜任所有这些的只有牛顿, 因此将万有引力定律的发现归功于牛顿并冠以他的名字是毫不过分的。 另外要补充的是: (2.2) 式给出的只是万有引力的大小, 其方向则由引力的吸引特性所确定, 即每个物体所受来自另一个物体的引力总是指向另一个物体。
9、当然, 无论加速度还是引力场的场强都是有方向的, (2.3) 式给出的只是大小, 其方向则跟引力的方向一样, 指向质量为 M 的物体 (在更一般的物质分布下则大小和方向都要用微积分手段来计算)。 另外要说明的是: 将这些结果具体应用到地球引力场中的重物下落, 除了用到前一注释提到的 “球对称物质分布产生的引力相当于物质全部集中在球心” 这一结果外, 还隐含了物体的大小及下落的高度相对于物体与地心的距离可以忽略这一近似度很高的额外假设。
10、对这一发现感兴趣的读者可参阅拙作《那颗星星不在星图上: 寻找太阳系的疆界》 (清华大学出版社 2013 年 12 月出版)。
11、值得注意的是, 牛顿本人对自己的万有引力定律也不无疑虑, 因为这一定律所描述的是跨越真空而起作用的所谓 “超距作用” (action at a distance), 在牛顿看来是荒谬的。 虽然牛顿的着眼点是万有引力的 “超距作用” 而非瞬时传播特点, 但这两者是相辅相成的, 并且消解的方法也是共同的, 因此牛顿的疑虑具有令人钦佩的前瞻性。
12、某些广义相对论著作对等效原理进行了细分, 在那样的细分下, 这里所介绍的等效原理被称为 “强等效原理” (strong equivalence principle)。 另外要提醒读者的是, 等效原理其实允许一些微妙的、 并不妨碍广义相对论的例外, 对这一点感兴趣的读者可参阅拙作 从等效原理到爱因斯坦-嘉当理论, 收录于《因为星星在那里: 科学殿堂的砖与瓦》一书 (清华大学出版社 2015 年 6 月出版)。
13、有读者也许会问: 测地线方程可以用前面提到的 “最小替换法则” 得到吗? 答案是肯定的。 事实上, 局域惯性参照系中的运动方程 (2.4) 式可以表示为 uρ?ρuμ = 0 (其中 uμ 是四维速度), 运用 “最小替换法则” 可将之改写为 uρ?ρuμ = 0, 其分量形式正是 (2.5) 式。
14、顺便说一下, 由此可以得到等效原理的一种数学表述, 那就是: 在引力场中任何一个时空点附近都存在特殊的坐标系 (即局域惯性参照系), 其中的度规为闵科夫斯基度规, 而黎曼联络为零 (即引力场为零)。
15、对宇宙学项的历史感兴趣的读者可参阅拙作 宇宙学常数、 超对称及膜宇宙论。
16、确切地说, 爱因斯坦得到的场方程是 Rμν = —8π(Tμν — ½gμνT), 其中 T 是 Tμν 的缩并, 不过它与我们采用的形式只有约定等方面的差别, 实质上是等价的。
17、对广义相对论的发展历史感兴趣的读者可参阅拙作 希尔伯特与广义相对论场方程, 收录于《小楼与大师: 科学殿堂的人和事》一书 (清华大学出版社 2014 年 6 月出版)。
18、不过, 引力场本身的能量动量是广义相对论研究中一个很困难的课题, 对这一课题感兴趣的读者可参阅拙作《从奇点到虫洞: 广义相对论专题选讲》 (清华大学出版社 2013 年 12 月出版)。
19、引力理论跟时空结构的这种交融在等效原理中其实已可窥见端倪, 因为等效原理表明引力场中任何一个时空点附近都存在局域惯性参照系, 而局域惯性参照系中的物理规律由狭义相对论所描述, 其中的度规是闵科夫斯基度规, 这跟微分几何中每点的邻域内存在局域笛卡尔坐标系 (Cartesian coordinate system) 是完全相似的。 两者在数学结构上的相似和交融也就不足为奇了。