Đa thức đặc trưng
Phần này chỉ xét ma trận vuông: biến đổi tuyến tính đưa \(n\) vectơ thành \(n\) vectơ.
Trong thực tế, biến đổi lặp nhiều lần. Nếu chỉ nói “ma trận \(A\) đưa \(I\) thành \(A\)” thì quá trừu tượng. Tốt nhất là tìm “điểm bất động”. Nhưng thường không có, nên tìm phần “đồng tuyến” hay “biến dạng đơn giản”.
Trị riêng và vectơ riêng
Trong biến đổi của \(A\), một số vectơ giữ hướng, chỉ bị co giãn.
Cho \(V\) trên trường \(F\), \(T\) là biến đổi. Nếu tồn tại \(\lambda\in F\) và vectơ không-zero \(\xi\) sao cho:
thì \(\lambda\) là trị riêng, \(\xi\) là vectơ riêng.
Vectơ riêng trên cùng đường thẳng, hướng không đổi (kể cả bị co về 0). Vectơ riêng không duy nhất; mọi vectơ cùng phương đều là vectơ riêng, nhưng quy ước vectơ 0 không là vectơ riêng.
Trong thực tế, với cùng trị riêng, chọn một cơ sở đại diện.
Giả sử \(\alpha_1,\dots,\alpha_n\) là cơ sở, \(T\) có ma trận \(A\):
Cho trị riêng \(\lambda_0\) và vectơ riêng \(\xi\), với \(\xi=(\alpha_1,\cdots,\alpha_n)X\):
Suy ra định thức bằng 0.
Đa thức đặc trưng
Với ma trận \(A\) bậc \(n\), ma trận \(\lambda I-A\) gọi là ma trận đặc trưng.
Định thức của nó là đa thức đặc trưng, ký hiệu \(p_A(\lambda)\):
Một số nơi định nghĩa \(\det(A-\lambda I_n)\), khác nhau hệ số \((-1)^n\). Lưu ý định thức ma trận \(0\times 0\) là 1.
Nghiệm của \(p_A\) là trị riêng. Vectơ riêng là nghiệm không-zero của \((\lambda_0I-A)X=0\).
Trị riêng/vectơ riêng của \(T\) tương ứng với của \(A\) qua cơ sở.
Theo định lý cơ bản đại số:
\(d_i\) là bội đại số của \(\lambda_i\). Tổng các bội bằng \(n\).
Tìm trị riêng và vectơ riêng
- Tính \(|\lambda I-A|\).
- Tìm nghiệm của \(f(\lambda)\) trong trường \(F\).
- Với mỗi trị riêng \(\lambda\), giải \((\lambda I-A)X=0\) để lấy một hệ nghiệm cơ bản \(X_1,\dots,X_t\). Khi đó mọi vectơ riêng thuộc \(\lambda\) là:
với không phải tất cả \(k_i\) bằng 0.
- Vectơ riêng của \(T\) là:
Nên mọi vectơ riêng là tổ hợp tuyến tính của \(\xi_i\).
Trị riêng/vectơ riêng phụ thuộc vào trường.
Biến đổi tương tự
Giới thiệu
Nếu \(A\) là tam giác trên:
thì
Dễ tính; tam giác dưới tương tự. Nếu \(A\) không thuộc hai loại này, dùng biến đổi tương tự để đưa về dạng dễ tính.
Định nghĩa
Với ma trận \(A,B\) bậc \(n\), nếu tồn tại \(P\) khả nghịch sao cho:
thì \(A\) và \(B\) tương tự, và \(A\mapsto P^{-1}AP\) gọi là biến đổi tương tự. Chúng có cùng đa thức đặc trưng.
Chứng minh:
Tương tự cho \(A\mapsto PAP^{-1}\). Hơn nữa \(p_A(0)=(-1)^n\det(A)\) nên \(\det(A)=\det(P^{-1}AP)\).
Định lý: ma trận tương tự có cùng đa thức đặc trưng và trị riêng; ngược lại không đúng.
Do đó đa thức đặc trưng không phụ thuộc vào cơ sở.
Với \(p_A(\lambda)\) là đa thức đơn thức hệ số 1, theo Viète, hệ số bậc \(n-1\) là:
trong đó \(tr A\) là vết.
Hệ số tự do:
Định lý: ma trận tương tự có cùng vết.
Công thức hoán vị
Định lý: với mọi ma trận \(A,B\) (không cần vuông), nếu tích xác định thì \(tr(AB)=tr(BA)\).
Một chứng minh khác dùng công thức:
Định lý: với \(A\) \(m\times n\), \(B\) \(n\times m\):
Suy ra \(AB\) và \(BA\) có cùng trị riêng khác 0.
Định lý Schur
Mọi ma trận bậc \(n\) tương tự một tam giác trên; đường chéo chính là các trị riêng.
Hệ quả: với đa thức \(\phi(x)\), trị riêng của \(\phi(A)\) là \(\phi(\lambda_i)\). Đặc biệt, trị riêng của \(kA\) là \(k\lambda_i\), của \(A^m\) là \(\lambda_i^m\).
Dùng khử Gauss để biến đổi tương tự
Khử Gauss dùng biến đổi hàng. Nếu sau khi nhân trái bởi ma trận sơ cấp lại nhân phải bởi nghịch đảo của nó thì là biến đổi tương tự; nhân phải tương ứng biến đổi cột.
Nếu đưa được về tam giác trên/dưới thì dễ tính đa thức đặc trưng. Nhưng biến đổi \(A\mapsto T_{ij}(k)AT_{ij}(-k)\) có thể làm các phần tử đã khử trở lại khác 0, nên khó đạt tam giác.
Dưới đây sẽ xét ma trận Hessenberg.
Ma trận Hessenberg trên
Với \(n>2\), ma trận:
gọi là Hessenberg trên, trong đó \(\beta\) là đường chéo phụ.
Dùng biến đổi tương tự để khử các phần tử dưới đường chéo phụ, ta được Hessenberg. Đa thức đặc trưng của Hessenberg có thể tính trong \(O(n^3)\).
Gọi \(H_i\) là ma trận con \(i\times i\) đầu, \(p_i(x)=\det(xI_i-H_i)\). Khi đó:
Khai triển theo hàng cuối:
Suy ra với \(2\le i\le n\):
Đây là thuật toán Hessenberg.
Định lý Cayley–Hamilton
Với ma trận \(A\) bậc \(n\) và đa thức đặc trưng \(f(\lambda)\), ta có \(f(A)=0\).
Tương tự với biến đổi tuyến tính \(T\).
Do đó mọi ma trận đều có đa thức triệt tiêu.
Đa thức tối tiểu
Trong không gian \(n\) chiều, mọi biến đổi tuyến tính tạo thành không gian \(n^2\) chiều. Với \(T\), các biến đổi \(T^0,\dots,T^{n^2}\) tuyến tính phụ thuộc, nên tồn tại đa thức không-zero \(f\) sao cho \(f(T)=0\). Chọn đa thức bậc nhỏ nhất gọi là đa thức tối tiểu \(m_A(\lambda)\).
Theo thuật toán Euclid, đa thức tối tiểu là duy nhất và chia mọi đa thức triệt tiêu. Đặc biệt, \(m_A\) chia \(p_A\).
Định lý: bỏ bội, \(p_A\) và \(m_A\) có cùng nghiệm.
Định lý: vectơ riêng thuộc trị riêng khác nhau là độc lập tuyến tính.
Ứng dụng
Trong tin học, thường xét ma trận trên \((\mathbb{Z}/m\mathbb{Z})^{n\times n}\), với \(m\) thường là số nguyên tố. Khi \(m\) hợp số, có thể dùng phép chia Euclid tương tự.
实现
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 | |
Thuật toán Hessenberg không ổn định số, nên với \(\mathbb{R}^{n\times n}\) cần thuật toán ổn định hơn.
Có thể liên hệ đa thức đặc trưng với truy hồi tuyến tính, hoặc dùng Cayley–Hamilton, lấy modulo đa thức để tăng tốc lũy thừa ma trận.
Theo Cayley–Hamilton:
với \(O\) là ma trận 0, và \(p_A(x)=x^n+\sum_{i=1}^nc_ix^{n-i}\).
Nếu cần \(A^K\) lớn, tính \(f(x)=x^K\bmod{p_A(x)}\) rồi dùng \(f(A)=A^K\).
Vì \(\deg f < n\), viết \(f(x)=\sum_{i=0}^{n-1}f_ix^i\) và \(n=km\):
Chọn \(k=\sqrt{n}\), tính \(f(A)\) cần khoảng \(O(\sqrt{n})\) phép nhân ma trận.
Tài liệu tham khảo
- Rizwana Rehman, Ilse C.F. Ipsen.La Budde’s Method for Computing Characteristic Polynomials.
- Marshall Law.Computing Characteristic Polynomials of Matrices of Structured Polynomials.
- Mike Paterson.On the Number of Nonscalar Multiplications Necessary to Evaluate Polynomials. ````
Last updated on this page:, Update history
Found an error? Want to help improve? Edit this page on GitHub!
Contributors to this page:OI-wiki
All content on this page is provided under the terms of the CC BY-SA 4.0 and SATA license, additional terms may apply