“我经常举的一个例子是,我对一个矩阵的‘行秩’和‘列秩’为什么会相等的好奇。其实在任何基本的线性代数书里,我们都可以找到它们为什么相等的证明。但是从那些逻辑推理的外表,我实在看不出它们为什么会巧合地相等。在我真正了解到它们为什么会一样的过程中,这个好奇却帮我了解了许多广义逆矩阵的几何意义。”
——李天岩《回首来时路》
编者提醒:文中提到的经典教材《线性代数应该这样学》,最新电子版(包括中文翻译版本)现已免费公开在SheldonAxler教授的个人主页。读者可直接访问https://linear.axler.net/下载获取。该书强调数学结构和几何直观,弱化矩阵计算,适合已经学过一遍线性代数,想要从更高视角加深理解的读者。
撰文|朱慧坚(广州南方学院数学与统计学院副教授)、丁玖(南密西西比大学数学系退休教授)
在理工科基础课《高等代数》或《线性代数》中,“矩阵”或许是出现频率最高的数学词汇,其重要性不亚于《数学分析》或《高等数学》中的“函数”。对于电子工程或计算机科学等应用学科的学生们而言,矩阵在《线性代数》中的一项基本用途是求解线性方程组,因为线性方程组的所有系数若不变动位置,可以自然地排成一个有几行几列的数组,即矩阵的形式,然后利用课本中定义的一系列矩阵运算和性质,同学们便掌握了求解方程组的有力工具。然而在面向数学专业的《高等代数》课程中,矩阵不仅延续了求解线性方程组的传统功能,还挺身而出,担当了连接抽象概念和具体模型的桥梁重任,用更专业一点的话来说就是:任何两个有限维向量空间之间的线性映射,只要在定义域向量空间和值域所属的向量空间中各自选取了一个基底,那么这个线性映射就有一个唯一确定的、看得见摸得着的“矩阵表示”,这时“矩阵有大用”的威力就充分显现了。
“打倒行列式!”
笔者分别在中美两国的大学多次讲授《线性代数》,所用的都是畅销教材。在中国使用的教材是工程名校同济大学编写的《工程数学·线性代数》,第一版四十四年前问世,第七版三年前推出;在美国则教过一浅一深的两门课:《线性代数I》和《线性代数II》。前者本质上只讲矩阵的初等理论,与上述同济大学教材的覆盖面相仿;后者主要学习有限维向量空间之间的线性映射理论,这时矩阵大致起到“助手”或“工具”的次要作用。
矩阵的历史源远流长。早在近两千年前的中国古代数学典籍《九章算术》中,它便已初现端倪,并被三国时期的伟大数学家刘徽(约225年-约295年)所应用。1850年,英国大数学家西尔维斯特(JamesJosephSylvester,1814-1897)正式将其命名为matrix;随后,比他小七岁的律师兼数学家凯莱(ArthurCayley,1821-1895)率先引入了矩阵的代数运算。一百五十年来,矩阵一直被代数学家和工程技术家们“玩”个不停,其卓著功勋,不在话下。
因为线性代数入门教程主要讨论作为具体代数运算对象的矩阵,中美两国的传统教科书一般都沿着数学史发展的足迹,在正式开讲矩阵前,第一章先讲行列式。然后以它为主要工具,一章又一章、一节又一节地推演出矩阵几乎数不清的种种性质,比如具有非奇异系数矩阵的线性方程组的著名解公式;它完全依赖于行列式的计算,名为克莱姆法则。还有,可逆矩阵的逆矩阵有个看上去美丽简洁的逆矩阵公式,其每个元素的计算都少不了行列式帮大忙;可惜这个忙帮得太花时间,以至于后世强调高效实用的计算数学家和工程师早就把这个“中看不中用”的求逆公式弃之不理了。
多年的教学实践提醒我们,尽管行列式理论曾在历史上为现代数学的不断进步立下过汗马功劳,但如今它对线性代数的影响力已日渐式微。其繁琐的计算公式,无论是基于排列的和式定义,还是拉普拉斯展开,都难以讨得学生欢心,有时甚至会引起他们的恐惧和反感——尤其是在需要化简一个颇为复杂的行列式时。所以,在线性代数的数学教育中出现了一种质疑的声音:行列式是否仍有讲授的必要?
恰好三十年前,美国数学家阿克斯拉(SheldonAxler,1949-)教授在读者如云的数学期刊《美国数学月刊》(第102卷)上,发表了题为DownwithDeterminants!(《打倒行列式!》)的文章。文章摘要的第一句开宗明义:
“本文展示了在没有行列式的情况下,如何更好地构建线性代数。”
第二年,《美国数学月刊》的东家——美国数学协会将1996年度的“莱斯特·R·福特阐述写作奖”颁给了阿克斯拉,表彰他这篇影响深远的数学檄文。笔者之一在密歇根州立大学数学系攻读博士学位时,修过阿克斯拉教授一学年的《高等泛函分析》研究生课程,为他的教学艺术所倾倒,当年提名他评选教学奖,他也当之无愧地将其收进囊中;须知他1975年从加州大学伯克利分校博士毕业后,去麻省理工学院担任两年摩尔讲师(极富荣誉的一种博士后位置)期间,就获得过校级教学奖。
在“讨伐”行列式的同一年年底,阿克斯拉教授出版了教科书《线性代数应该这样学》(LinearAlgebraDoneRight),其写作风格继承了他的师祖、美国数学写作与演讲高手哈尔莫斯(PaulHalmos,1916-2006)的名著《有限维向量空间》(Finite-DimensionalVectorSpaces),即用基于集合论的函数语言撰写代数课本。正如阿克斯拉教授在前述文章中所宣称的,他没有拿起行列式这把榔头来捶打出线性代数的各种零件,不过还是给予行列式足够的礼遇——将它放进了全书十章的最后,与矩阵迹共享一章,毕竟它是矩阵之子(西尔维斯特给矩阵所取的英文名字matrix来自拉丁语matrix,原意为“子宫”,隐喻行列式为矩阵所生)。
阿克斯拉教授精心写作的这部教材在美国高校极受欢迎。2009年,人民邮电出版社翻译出版了该书,此后一直跟随英文新版更新译本,目前已出版至第四版。积极从事数学普及的西北农林科技大学林开亮博士,还在《数学文化》杂志上发表了热情洋溢的书评。
《线性代数应该这样学》的译者在序中写道:“描述线性算子的结构是线性代数的中心任务之一,传统的方法多以行列式为工具。作者认为行列式既难懂又不直观,还缺少动机,并且导致思路曲折,从而掩盖了线性代数的本质。因此,本书完全抛开行列式,采用更直接的方法阐述了线性算子的基本理论,作者认为这种方法可使学生更加直观、深刻地理解线性算子的结构,线性代数就应该这样教与学。”
这本书起点较低,不需要太多预备知识,而特色鲜明,是公认的阐述线性代数的经典佳作。原书自出版以来,迅速风靡世界,其中包括斯坦福大学和加州大学伯克利分校等著名学府。根据阿克斯拉教授不断更新的统计数据,到目前为止全球共有超过四百二十所大学和学院采用这本书作为教材。笔者之一任教的大学数学系也慧眼识珠,及时用它替换了旧教材。当笔者再次讲授这门课时,书中清晰易懂的语言表述与滴水不漏的逻辑推理,令笔者马上想起八十年代末那个学年,自己坐在教室里,看阿克斯拉教授演绎泛函分析之美的生动场景。到了2020年,阿克斯拉教授出版新书Measure,Integration&RealAnalysis(《测度、积分和实分析》),并告诉笔者他一如既往地将电子版免费上线。笔者毫不犹豫地选择了这本书来讲授《实分析》课程,再一次满怀喜悦地品味了他的写作风格。
重新定义“秩”的基石
与矩阵形影不离的一个数学概念是“矩阵的秩”,它在线性代数中的地位,堪比微积分中的“导数”。在通常的教科书中,由于行列式最早登台亮相,自然它必须身兼数职,不仅要服务好之后登场的逆矩阵计算,也要充当矩阵秩的“解说员”。它向学生们这样介绍矩阵秩的概念:矩阵的秩是其非零子式的最大阶数。这句简洁的定义更通俗地说就是:从矩阵中任取k行k列元素而不改变相对位置,组成一个k阶方阵,其对应的行列式称为原矩阵的k阶子式。如果所给的矩阵有一个k阶子式不等于0,但所有更高阶的子式都等于0,那么我们就说这个矩阵的秩为k。
看来,按照这个定义,要找到一个矩阵的秩,我们必须耐心地计算不同阶数的子式,直到算出一个子式不为0,但又要确保更高阶数的子式统统等于0,才算大功告成。对学生而言,即便将这个定义背得滚瓜烂熟,也很难理解“秩”的意义到底是什么,可能知其然而不知其所以然。为了做习题应付考试,只好硬着头皮死算一通,以期熟能生巧。
现在,让我们暂时忘掉行列式,或者干脆假设它只是小说家杜撰出的一个莫名其妙的概念,以此来重新定义矩阵的秩。当然到了最后,为了让读者信服新定义其实与基于行列式计算的旧定义殊途同归,我们将再请行列式“复活回归”,举杯共贺对“秩”的新解释。
在进入下面的数学讨论之前,我们先做两点说明。首先,为了与笔者此前文章保持一致,本文将继续采用泛函分析中的通用术语“线性算子”(linearoperator),而不用常见的“线性映射”(linearmap,如前述阿克斯拉教授的著作)或“线性变换”(lineartransformation,见多数线性代数教科书)。其次,和以前一样,我们只在实数范围内谈论矩阵,当然文中的结果对复矩阵甚至一般数域上的矩阵也成立。照常,符号R代表实数集。
既然矩阵是上下左右排列整齐、有几行几列的一组数,它免不了要和只有一行的数组(称为行向量)和只有一列的数组(称为列向量)发生联系。某个向量中的分量个数如果是n,就称它是n维向量,并把所有的n维向量全体用符号Rn表示。这样,Rn中的一般元素写下来就是行向量x=(x1,…,xn)或列向量x=(x1,…,xn)T,其中大写的T是英文单词transpose的首字母,表示“转置”,即将矩阵的第i行变为第i列的操作。
为了节省篇幅,本文中的向量一般写成行向量,但为了满足矩阵乘法对行或列数的基本要求,它们有时被看成是列向量,反之亦然。在Rn中定义了标准的向量加法(对应分量相加)和数乘向量(数乘各分量)这两种代数运算,因而Rn有资格成为一个向量空间(也称线性空间)。向量空间中的元素称为向量。Rn的子集M如果对这两种运算是封闭的,也就是说,M中任意两个向量之和以及任意数与向量的标量积依然属于M,则M也是一个向量空间,称为Rn的子空间。在Rn内再定义标准的内积运算:向量x=(x1,…,xn)和向量y=(y1,…,yn)的内积是数x1y1+…+xnyn;熟悉矩阵乘法的读者可以把它写成更紧凑的形式yTx(这里向量x、y被理解为列向量)。有了内积,Rn便升格为欧几里得空间,因为内积概念引出了正交——就像欧几里得平面几何中两条互相垂直的线段那样。通过内积还可以定义向量的长度,正式学名叫范数:Rn中向量x=(x1,…,xn)的范数
它是二维或三维向量通常长度的直接推广。
按照定义,如果欧几里得空间Rn中的向量x和向量y的内积为0,则说x和y正交,记为x⊥y。任给Rn的一个子集S,空间Rn中所有与S内每一个向量都正交的向量组成的集合,称为S在Rn中的正交补,记为S⊥。读者可以证明S⊥也是Rn的一个子空间。比如说,在平面R2内,单点集S={(1,1)}的正交补是一条通过原点的直线{(t,-t):t为所有实数},这是极易验证的。
笔者一年前在《返朴》登载文章《矩阵乘法为什么是这样定义的?》,把任意给定的m行n列矩阵A=(aij)视为将Rn映射到Rm的一个线性算子,其函数法则是,将Rn里的任意向量x映到Rm中的对应向量y=Ax,即矩阵(aij)与列向量(x1,…,xn)T的乘积,y的第i个分量是
取遍Rn中的所有向量x,得到的所有向量Ax在Rm中组成一个集合,很容易验证,这个集合是Rm的一个子空间,叫做线性算子A的值空间,记成R(A)。这里的字母R与表示实数集的R没有关系,而是英文单词range(值域)的首字母。与A相关的还有一个向量空间,它是定义域Rn的一个子空间,由Rn中所有被A映到Rm中零向量的向量组成,记为N(A)。这里的N是英文单词null(零)的首字母。这两个线性子空间在线性代数中与线性算子A地位同等,将在下面的讨论中大放异彩。为了让它们给读者留下更深刻的印象,我们用数学语言把它们写成:
线性相关与基底
有了上面的预备知识,我们现在着手建立矩阵秩的概念。不过在此之前,必须先掌握线性代数中另一个关键概念。先看一个示例,给出三个向量
x=(1,2,3),y=(1,1,1),z=(0,1,2).
通过简单的观察可以发现,x减去y恰好就是z,即z=x–y。等式的左端只有一个单独的向量,而右端是另外两个向量的某种组合。因为这种组合是将一个向量组中的向量乘以常数系数(本例中是1和-1)再求和的结果,所以我们说这是一个线性组合,即向量z是向量x和y的线性组合。现在,我们将这个线性组合的关系式z=x-y改写成一边只剩零向量的形式:
1x+(-1)y+(-1)z=0,
注意到三个向量x,y,z前面的系数不全为0(事实上就此例而言,它们都不为0)。这时我们说给定的向量x,y,z线性相关。
接下来,我们考察这三个向量中的前两个x和y,看一看它们是否也线性相关——是否存在两个不全为0的数α和β,满足等式αx+βy=0。将x和y的分量代入,简单的代数运算给出下面关于未知数α和β的一个线性方程组:
α+β=0,2α+β=0,3α+β=0.
它只有平凡解,即零解α=0,β=0。这说明,使得线性组合αx+βy等于零向量的系数α和β只能全为0。换言之,两向量x和y不像上面的x,y,z那样是线性相关的。这个时候我们说向量x和y是线性无关或线性独立的。
读懂了上面的例子,下面关于线性相关或线性无关的定义就不难理解了。由于涉及多个向量,我们不再使用x,y,z,而是改用带下标的字母v表示向量,这里的v是英文单词vector(向量)的第一个字母。给定欧几里得空间Rn中的k个向量v1,v2,...,vk,如果存在不全为零的常数α1,α2,...,αk使得
就称向量v1,v2,...,vk线性相关;如果满足上述要求的α1,α2,...,αk不存在,则称v1,v2,...,vk线性无关。由此定义可知,给定向量v1,v2,...,vk线性无关,当且仅当只要上式成立,则其左端所有的系数α1,α2,...,αk必定全为零。
对于Rn中给定的k个向量v1,v2,...,vk和k个标量α1,α2,...,αk,形式为α1v1+α2v2+⋯+αkvk的向量被称为v1,v2,...,vk的一个线性组合。读者不难证明,给定向量v1,v2,...,vk的所有线性组合全体是Rn的一个子空间,称为由v1,v2,...,vk张成的向量空间,记为span{v1,v2,...,vk},而集合{v1,v2,...,vk}则称为这个空间的张成集。如果一个向量空间可由有限个向量张成,则说它是有限维的,否则称为无限维的(例如,所有多项式组成的向量空间就是无限维的)。线性代数研究有限维向量空间,而把无限维向量空间留给泛函分析去探讨。
从上两段中的定义,易得下面五个有用的简单事实:
(1)若一组向量包含零向量,则它们必定线性相关;
(2)若一组向量线性无关,则去掉其中任意一个向量,所剩向量也线性无关;
(3)若一组向量线性相关,则加进任意一个向量后也线性相关;
(4)若一个向量是其他几个向量的线性组合,则所有这些向量线性相关;
(5)在一个向量空间的张成集中,如果某个向量是集内其他向量的线性组合,那么该张成集去掉此向量后,剩余向量依然张成同一个向量空间。
为了诠释上述一般定义,下面给出一个最有代表性的例子。我们取Rn中n个“单位坐标向量”,用带下标的字母e表示,以示特别:
其中第i个向量ei的第i个分量为1,其余分量均为0。显而易见,这组向量是线性无关的。更进一步,Rn中的任意向量v=(α1,α2,...,αn)都可表示为α1e1+⋯+αnen。也就是说,Rn中的所有向量都是单位坐标向量e1,e2,…,en的线性组合。
这样说来,Rn的单位坐标向量e1,e2,…,en满足两个重要性质:(i)它们是线性无关的;(ii)它们所有的线性组合填满了Rn,即e1,e2,…,en张成Rn。由此我们说{e1,e2,…,en}是Rn的一个基底,此外,这个基底中的向量相互正交,且长度均为1。它是Rn最典雅的基底,被称为n维欧几里得空间Rn的典范基。
基于上面对典范基的具体讨论,我们可以将基底概念推广至Rn的任意子空间,并定义空间的维数。假定M为n维欧几里得空间Rn的一个非空子空间。如果在M中存在k个线性无关的向量v1,v2,...,vk,且M中的任一向量v都是v1,v2,...,vk的线性组合,则称{v1,v2,...,vk}为M的一个基底,并将正整数k叫做M的维数。简言之,向量空间的基底是张成该空间的线性无关向量组,维数是这个组的向量个数。然而,要使维数的定义合理,我们必须确保它仅仅依赖于M本身,而与基底的具体选择无关。换言之,若{u1,u2,...,ul}是M的另一个基底,那么l=k。这个结论当然正确,下面对此作出证明。
我们只需论证k≤l就够了,因为互换这两个基底便推出l≤k,从而得证l=k。事实上,我们可以证明更一般的命题:
引理1.若向量空间M中的向量v1,v2,...,vk线性无关,且向量u1,u2,...,ul张成M,则k≤l。
证明.由假设可知u1,u2,...,ul张成M,故v1是u1,u2,...,ul的线性组合,因而存在常数α1,α2,...,αl,使得v1=α1u1+⋯+αlul。将该式改写成线性相关的形式
因为v1不是零向量(否则与v1,v2,...,vk线性无关矛盾),故α1,α2,...,αl中至少有一个是非零数。令αr为它们当中最后一个非零数,则
因此由上面列出的事实(5)知,用v1取代M的张成集{u1,u2,...,ul}中的uᵣ,所得的新向量集(向量个数还是l)依然张成M。这就完成了证明的第一步。
按照与上面同样的方法进行归纳,经过s-1次替换(s=2,…,k),依次用v1,v2,...,vs-1取代张成集中的一个向量,得到的新集合依然张成M。所以vs是目前的张成集中向量的线性组合:
其中ω是张成集内剩余u的线性组合,它们的系数不能全为0,否则与v1,v2,...,vk线性无关矛盾。所以一定存在某个迄今留下的uj,它是v1,v2,...,vs-1,vs和其他u的线性组合。在张成集内用vs取代uj后,新集合张成M,且其中的元素个数保持为l。
到了最后一步,即s=k后,所有的v1,v2,...,vk都逐次取代了张成集{u1,u2,...,ul}中的一个向量,但原先的张成集元素可能还有剩余,故得k≤l。这就完成了这个关键引理的证明。
我们由此确认,有限维向量空间的维数仅仅依赖于空间本身,而与空间的基底选取无关。这也是人们将Rn称为n维空间的道理所在。下面再列出两个有关事实而不加以证明,不过爱好证明的读者可以将它们一一证出:
(6)k维向量空间M中的k个线性无关向量构成M的一个基底。
(7)k维向量空间M中,由k个向量组成的M的张成集是M的一个基底。
为什么矩阵的行秩等于列秩?
现在我们可以用维数的概念来引进矩阵的秩了。设A=(aij)为一给定的m行n列矩阵。将它按列划分写成A=[a1,a2,…,an]的“块矩阵”形式,每块aj是一个m维列向量,其中j=1,2,…,n。任给Rn中的列向量x=(x1,…,xn)T,矩阵乘法的定义给出
故值空间R(A)为A的列向量的所有线性组合全体,用数学表达式就是
我们将矩阵A的列秩定义为值空间R(A)的维数。由于矩阵的值空间由列张成,它也被称为矩阵的列空间,与下一段定义的行空间相对应。
另一方面,我们把A从上到下的m个n维行向量记成b1,b2,...,bm。由A的行向量的所有线性组合组成的向量空间span{b1,b2,...,bm},称为A的行空间。类似地,矩阵A的行秩定义为它的行空间的维数。注意到如果运用矩阵转置的运算,那么A的行空间就是AT的列空间R(AT),因而矩阵的行秩不外乎就是其转置矩阵的列秩。
那么,一个矩阵的行秩等于它的列秩吗?要回答这个问题,我们要用到Rn中的内积运算所引导出的向量的正交概念。我们在之前提到过,Rn的一个子集S在Rn中的正交补S⊥是Rn的子空间。现在取S为Rn的任一子空间M,则如同笔者在文章《从线性算子的角度看广义逆矩阵》中所论证的,Rn中的任一向量x都是M中唯一的向量y和M⊥中唯一的向量z之和,用空间分解的术语表达,就是:欧几里得空间Rn是子空间M和它的正交补M⊥的直和,记成Rn=M⊕M⊥。在此正交分解下,正交投影PM将x∈Rn映射到唯一的y∈M,是在数学中非常得宠的一类线性算子。在笔者另一篇文章《什么是最小二乘?》中,它扮演了成功的角色。
在维数计算中,正交分解Rn=M⊕M⊥的一大优势在于,Rn的维数等于M的维数与M⊥的维数之和,一个直观的例子是,三维xyz-坐标空间可以看作二维xy-坐标平面与同它垂直的一维z-坐标轴的正交和。所以若M的维数为k,则M⊥的维数必定是n–k。这个简单的算术关系将助我们一臂之力,证明本文的结论。
假设给定m行n列矩阵A的列秩为r(r取自rank的首字母),则R(A)是Rm的一个r维子空间。同理,设A的行秩为r',则R(AT)是Rn的r'维子空间。为了证明r=r',我们还需要一个形式优美、易于证明的等式:
引理2.R(AT)⊥=N(A)。
证明.设x∈R(AT)⊥,则x与AT的值空间中的所有向量都正交,即对所有的y∈Rm都有xTATy=0,或等价地,yTAx=0。既然y是任意的,令y=Ax,便有(Ax)TAx=0,故Ax=0,即x∈N(A)。
反之,若x∈N(A),则xTATy=yTAx=0对所有的y∈Rm都满足,故x与AT的值空间中的所有向量都正交,即x∈R(AT)⊥。所以R(AT)⊥=N(A)。
数学运算经常让我们感到愉悦,比如不少操作连续做两遍等同于“回到原地”,这样的例子包括矩阵转置、矩阵求逆和子空间的正交补。根据上述引理等式,再利用“有限维子空间正交补的正交补就等于原空间”这一“二次不变性”,我们获得另一个有用的等式
通过上式及欧几里得空间的正交分解,我们分别有Rn和Rm的如下分解:
我们现在断言:A将Rn的子空间R(AT)一一对应地映到R(A)上面,即线性算子A:R(AT)→R(A)既是单射又是满射。满射是显然的,因为根据上面的左边直和分解,A将N(A)映到{0},故将R(Aᵀ)映成整个R(A)。再证A是单射。假设??=??,其中?,y∈R(AT)=N(A)⊥,则?(?−?)=??−??=0,故?−?∈?(?)。因为N(A)⊥是向量空间,?−?∈N(A)⊥。既然?(?)∩N(A)⊥={0},向量?−?=0,即?=?。这证明了A限制在子空间R(AT)上是一对一的。
两个有限维向量空间M和N,只要在它们之间建立了一个既单射又满射的线性算子T:M→N,那么这两个空间将共享幸福(当然也有可能共坠深渊)。比如说,如果v1,v2,...,vk在M中线性无关,那么Tv1,Tv2,...,Tvk在N中线性无关,反之亦然。进而推出:{v1,v2,...,vk}是M的张成集当且仅当{Tv1,Tv2,...,Tvk}是N的张成集;{v1,v2,...,vk}是M的基底当且仅当{Tv1,Tv2,...,Tvk}是N的基底。单射加上满射称为双射,向量空间之间的双射线性算子又称为线性同构,简称同构。这是最理想的情形了,因为在同构之下,两个向量空间具有一模一样的代数结构,特别地,它们有相同的维数。一个著名的同构例子是:向量空间Rn与所有次数低于n的实系数多项式全体同构。
如上的讨论顺便回答了文章标题提出的问题:
定理.矩阵的行秩等于列秩。
定义.矩阵的行秩或列秩称为矩阵的秩。
通过行列式学过矩阵秩的读者自然会问最后一个问题:你们定义的秩等于我们的教科书中定义的秩吗?回答是,是的,它们是同一个整数。但在这里,我们不打算细致讨论行列式与矩阵秩的关系,因为这些关系相当地繁琐,这里就不赘述了。但是,只要考虑可逆矩阵A这一特殊但并不太失一般性的情形,还是能洞察到用“最大非零子式阶数”和用“线性无关张成集向量个数”这两种方法定义矩阵秩的等价性。
可逆矩阵A定义了双射线性算子A:Rn→Rn。这时A的所有列向量一定是线性无关的,否则A就会将非零向量映成零向量,与其单射性条件矛盾。而这些列向量同时也张成了A的值空间Rn(因为A是满射),因此它们组成了Rⁿ的一个基底,故A的秩等于n。另一方面,根据行列式的性质,行列式保持矩阵的乘法,即两个同阶方阵乘积的行列式等于这两个方阵行列式之积。可逆矩阵A意味着它的逆矩阵A-1满足等式AA-1=I,其中I为同样阶数的单位矩阵。这样,由等式
推出detA≠0。因为detA是A的最大阶数的非零子式,根据同济大学《线性代数》中的定义,A的秩等于n。
尾声
笔者写作此文的一个动机,来自李天岩教授在《回首来时路》(原载台湾《数学传播》杂志,2011年转载于《数学文化》杂志)中的一段话:
“我经常举的一个例子是,我对一个矩阵的‘行秩’和‘列秩’为什么会相等的好奇。其实在任何基本的线性代数书里,我们都可以找到它们为什么相等的证明。但是从那些逻辑推理的外表,我实在看不出它们为什么会巧合地相等。在我真正了解到它们为什么会一样的过程中,这个好奇却帮我了解了许多广义逆矩阵的几何意义。”
今年是笔者之一的博士论文导师李天岩教授逝世五周年及八十周年诞辰。我们撰写这篇科普文章,不仅试图以广义逆算子的思想解释为何“行秩等于列秩”,也是为了纪念他追求数学思想、授业解惑带徒的灿烂一生。
完稿于2025年10月27日星期一
点击下图,即可购书
注:本文封面图片来自版权图库,转载使用可能引发版权纠纷。