矩阵是一种简洁而有用的方式,可以唯一地表示和处理线性变换。特别是,每个线性变换都可以用矩阵表示,并且每个矩阵都对应于唯一的线性变换。矩阵及其近亲行列式是线性代数中极其重要的概念,最早由 Sylvester (1851) 和 Cayley 提出。
在他 1851 年的论文中,Sylvester 写道:“为此目的,我们必须从一个非正方形的项的矩形排列开始,假设由 行和
列组成。这本身并不代表行列式,但它本身就是一个矩阵,我们可以从中通过确定一个数字
并随意选择
行和
列来形成各种行列式系统,即
阶的方阵。” 由于 Sylvester 对由数字的矩形阵列形成的行列式感兴趣,而不是对阵列本身感兴趣(Kline 1990,第 804 页),因此 Sylvester 使用术语“矩阵”的传统用法来表示“其他事物起源的地方”(Katz 1993)。Sylvester (1851) 随后非正式地使用了术语矩阵,并指出“形成由
行和
列组成的矩形矩阵……。然后,通过随意从此矩阵中删除任何一列而形成的
个行列式都恒为零。” 然而,仍然由 Sylvester 的合作者 Cayley 在 1855 年和 1858 年的论文中以现代形式使用该术语(Katz 1993)。
在他 1867 年关于行列式的专著中,C. L. Dodgson (Lewis Carroll) 反对使用术语“矩阵”,并指出:“我知道“矩阵”一词已被用于表达我使用“块”一词的含义;但当然,前一个词更多地是指代数量可以引入的模具或形式,而不是此类量的实际集合……” 然而,Dodgson 的反对意见未被理睬,术语“矩阵”仍然保留了下来。
由方程组给出的变换
(1)
| |||
(2)
| |||
(3)
| |||
(4)
|
表示为矩阵方程:
(5)
|
其中 称为矩阵元素。
一个 矩阵由
行和
列组成,具有实系数的
矩阵集合有时表示为
。为了记住哪个索引指的是哪个方向,请识别最后一个(即右下角)项的索引,因此上述矩阵中最后一个元素
的索引
将其标识为一个
矩阵。请注意,虽然此约定与用于表示画布上绘画的尺寸测量(高度在前,宽度在后)的约定匹配,但它与测量纸张、房间尺寸和窗户所用的约定相反(其中宽度在前,高度在后;例如,8 1/2 英寸乘 11 英寸的纸张宽度为 8 1/2 英寸,高度为 11 英寸)。
如果 ,则矩阵称为方阵;如果
,则矩阵称为矩形矩阵。一个
矩阵称为列向量,一个
矩阵称为行向量。特殊类型的方阵包括单位矩阵
,其中
(其中
是克罗内克 delta)和对角矩阵
(其中
是一组常数)。
在本文中,矩阵使用方括号作为分隔符表示,但在一般文献中,它们更常使用圆括号分隔。后一种约定引入了不幸的符号歧义,即形式为 的矩阵与二项式系数
(6)
|
在本文中以符号形式引用时,矩阵以无衬线字体表示,例如 、
等。在这种简洁的符号中,方程 (5) 中给出的变换可以写成
(7)
|
其中 和
是向量,
是矩阵。还存在许多其他符号约定,一些作者更喜欢斜体字体。
有时方便地用矩阵元素来表示整个矩阵。因此,矩阵 的第
个元素可以写成
,而由条目
组成的矩阵可以写成
,或简写为
。
两个矩阵可以相加(矩阵加法)或相乘(矩阵乘法)以产生一个新的矩阵。单个矩阵的其他常见运算是矩阵对角化、矩阵求逆和转置。
矩阵 的行列式
或
是一个非常重要的量,它出现在许多不同的应用中。 方阵的对角线元素的和称为矩阵迹
,它也是许多类型计算中的一个重要量。