실베스터 판정법에서 넘어왔습니다.
실베스터 행렬
덤프버전 :
분류
1. 개요[편집]
실베스터 행렬(Sylvester matrix)은 두 다항식이 공통인수를 갖는지에 대한 정보를 담고 있는 정사각 행렬이다. 예시에서처럼 n차 방정식의 판별식을 유도해 내는데 사용할수있다.
2. 정의[편집]
실베스터 행렬은 두 다항식 <math>f,\ g\in k[x]</math>([math(k)]는 체)에 의해 결정되는 행렬로, 여기서는 <math>\mathrm{Syl}(f,g)</math>라고 표기한다.
<math>f(x)=a_m x^m+\cdots+a_1 x+a_0, \ \ g(x)=b_n x^n+\cdots+b_1 x+b_0 \ \ (a_m,\ b_n \neq 0)</math>일 때, <math>\mathrm{Syl}(f,g)</math>는 다음과 같은 <math>(m+n)\times(m+n)</math> 행렬이다.
분류
3. Resultant[편집]
실베스터 행렬의 행렬식은 (Sylvester) resultant라고 부르며, <math>\mathrm{Syl}(f,g)</math>의 행렬식을 <math>\mathrm{Res}(f,g)</math>라고 표기한다.
3.1. Resultant와 공통인수[편집]
정리 다음은 동치이다.
* <math>\mathrm{Res}(f,g)=0</math>
* <math>f</math>와 <math>g</math>는 공통인수를 갖는다.
[ 증명 아이디어 보기 ] - 증명의 대략적인 아이디어는 다음과 같다. 차수가 [math(d)] 이하인 모든 다항식을 모은 [math(d+1)]차원 벡터공간을 [math(P_d)]라고 표기하자. 선형 변환 [math(\delta :\ P_{n-1}\oplus P_{m-1} \rightarrow P_{m+n-1})]을 [math(\delta(A,B)=Af+Bg)]가 되도록 정의한다. 그러면 [math(\delta)]는 다음과 같이 행렬로 표현된다.
[math(A=r_{n-1} x^{n-1}+\cdots +r_1 x + r_0,\ B=s_{m-1} x^{m-1}+\cdots +s_1 x+s_0)]라고 하면,[math(\delta(A,B)=(r_{n-1}\ \cdots \ r_0 \ \ s_{m-1} \ \cdots \ s_0)\ \mathrm{Syl}(f,g) \begin{pmatrix} x^{m+n} \\ \vdots \\ x \\ 1 \end{pmatrix})]
따라서 [math(\mathrm{Res}(f,g)\neq 0)]은 [math(\delta)]가 전사함수라는 것과 동치이다.[1] 이제 [math(\delta)]가 전사함수라는 것과 [math(Af+Bg=1)]인 [math(A,\ B)]가 존재한다는 것이 동치임을 증명하고, 이것이 [math(f,\ g)]가 공통근을 갖는다는 것과 동치임을 증명하면 된다. 자세한 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Theorem 5.5 참고. □
대수적으로 닫힌 체에서는 다항식이 모두 일차식들로 인수분해되므로, 공통인수를 갖는 것과 공통근을 갖는 것이 동치이다. 따라서 [math(k)]가 대수적으로 닫힌 체이면 다음이 동치이다.
- 와 는 공통근을 갖는다.
이는 [math(f)], [math(f')]가 공통근을 갖는 것과 [math(f)]가 중근을 갖는 것이 동치[1] 이기 때문이다. 따라서 [math(k)]가 대수적으로 닫힌 체이면 위 따름정리의 역도 성립한다.따름정리 <math>f</math>가 중근을 가지면 <math>\mathrm{Res}(f,f')=0</math>이다.
3.2. Resultant와 판별식[편집]
정리 [math(f)]의 근을 [math(\alpha_1, \cdots, \alpha_m)], [math(g)]의 근을 [math(\beta_1, \cdots , \beta_n)]이라고 할 때, 다음이 성립한다.
[math(\displaystyle \mathrm{Res}(f,g)=a_m^n b_n^m \prod_{i, j}^{\ } (\alpha_i-\beta_j))]
[ 증명 보기 ] - 다음은 Valery Bykov, Alexander Kytmanov, Mark Lazman - Elimination Methods in Polynomial Computer Algebra의 Theorem 6.1에서 소개된 증명이다. 우변은 다음과 같이 쓸 수 있다.[math(\displaystyle S:=a_m^n b_n^m \prod_{i, j} (\alpha_i-\beta_j) = (-1)^{mn} b_n^m \prod_{j=1}^n (a_m \prod_{i=1}^m (\beta_j-\alpha_i)) = (-1)^{mn} b_n^m \prod_{j=1}^n f(\beta_j),)]
[math(\displaystyle S=a_m^n b_n^m \prod_{i, j} (\alpha_i-\beta_j) = a_m^n \prod_{i=1}^m (b_m \prod_{j=1}^n (\alpha_j-\beta_i)) = a_m^n \prod_{i=1}^m g(\alpha_i))]
다음과 같은 행렬식을 보자.[math(M:=\begin{vmatrix} \beta_1^{m+n-1} & \beta_2^{m+n-1} & \cdots & \beta_n^{m+n-1} & \alpha_1^{m+n-1} & \alpha_2^{m+n-1} & \cdots & \alpha_m^{m+n-1} \\ \beta_1^{m+n-2} & \beta_2^{m+n-2} & \cdots & \beta_n^{m+n-2} & \alpha_1^{m+n-2} & \alpha_2^{m+n-2} & \cdots & \alpha_m^{m+n-2} \\ & & \vdots & & & & \vdots & \\ \beta_1 & \beta_2 & \cdots & \beta_n & \alpha_1 & \alpha_2 & \cdots & \alpha_m \\ 1 & 1 & \cdots & 1 & 1 & 1 & \cdots & 1 \end{vmatrix})]
이는 Vandermonde 행렬이므로 행렬식은 다음과 같다.[math(\displaystyle M=\prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{i=1}^m \prod_{j=1}^n (\beta_j-\alpha_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i))]
[math(\displaystyle \therefore \ a_m^n b_n^m \ \mathrm{Res}(f,g) \cdot M =\ \mathrm{Res}(f,g) \cdot (-1)^{mn} S \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i) \ \ \ \ \cdots(1))]
그런데 [math(f(\alpha_i)=0)], [math(g(\beta_j)=0)]이므로 [math(\mathrm{Res}(f,g) \cdot M)]은 아래와 같이 계산될 수 있다.[math(\displaystyle \mathrm{Res}(f,g) \cdot M = \begin{vmatrix} \beta_1^{n-1} f(\beta_1) & \beta_2^{n-1} f(\beta_2) & \cdots & \beta_n^{n-1} f(\beta_n) & 0 & \cdots & 0 \\ & & \vdots & & & \vdots & \\ \beta_1 f(\beta_1) & \beta_2 f(\beta_2) & \cdots & \beta_n f(\beta_n) & 0 & \cdots & 0 \\ f(\beta_1) & f(\beta_2) & \cdots & f(\beta_n) & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 & \alpha_1^{m-1} g(\alpha_1) & \cdots & \alpha_m^{m-1} g(\alpha_m) \\ 0 & 0 & \cdots & 0 & \alpha_1^{m-2} g(\alpha_1) & \cdots & \alpha_m^{m-2} g(\alpha_m) \\ & & \vdots & & & \vdots & \\ 0 & 0 & \cdots & 0 & g(\alpha_1) & \cdots & g(\alpha_n) \end{vmatrix} \\ = \prod_{j=1}^n f(\beta_j) \prod_{i=1}^m g(\alpha_i) \cdot \begin{vmatrix} \beta_1^{n-1} & \beta_2^{n-1} & \cdots & \beta_n^{n-1} \\ & & \vdots & \\ \beta_1 & \beta_2 & \cdots & \beta_n \\ 1 & 1 & \cdots & 1 \end{vmatrix} \cdot \begin{vmatrix} \alpha_1^{m-1} & \alpha_2^{m-1} & \cdots & \alpha_m^{m-1} \\ & & \vdots & \\ \alpha_1 & \alpha_2 & \cdots & \alpha_m \\ 1 & 1 & \cdots & 1 \end{vmatrix} \\ = \prod_{j=1}^n f(\beta_j) \prod_{i=1}^m g(\alpha_i) \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i))]
[math(\displaystyle \therefore \ a_m^n b_n^m \ \mathrm{Res}(f,g) \cdot M = S \cdot (-1)^{mn} S \prod_{1\leq i<j \leq n} (\beta_j-\beta_i) \prod_{1\leq i<j \leq m} (\alpha_j-\alpha_i) \ \ \ \ \cdots(2))]
식 [math((1))]과 식 [math((2))]에 의해 [math(\mathrm{Res}(f,g)=S)]이다. ■
이때 [math(\alpha_i)], [math(\beta_j)]는 [math(k)]의 대수적 폐포(algebraic closure)의 원소이다.[2]
위 정리와 판별식의 정의에 의해 resultant와 판별식의 관계를 얻을 수 있다. 또는 아래 식으로 판별식을 정의하기도 한다. 차수가 [math(n)]이고 최고차항이 [math(a_n)]인 다항식 <math>h</math>의 판별식 [math(D)]는 다음과 같다.
분류
이때 판별식도 주어진 체 [math(k)]의 대수적 폐포에서의 근을 이용해 정의한다. 이렇게 정의하더라도 판별식은 [math(k)]의 원소가 되는데, 이는 resultant가 정의에 의해 [math(k)]의 원소가 되기 때문으로 이해할 수 있다.
상술된 따름정리로부터 <math>f</math>가 중근을 가지면 <math>D=0</math>임을 확인할 수 있다. 당연히 대수적으로 닫힌 체에서는 그 역도 성립한다. 대수적으로 닫힌 체가 아니면 역이 성립하지 않으며, [math((x^2+x+1)^2\in \mathbb R[x])]와 같은 반례가 있다.
다음과 같은 정리에 따라 판별식도 기약다항식(irreducible polynomial)임을 알 수 있다.
정리[3]
Resultant는 기약다항식이다.
3.2.1. 예시: 2차 다항식 판별식 유도[편집]
다음은 resultant를 이용하여 2차 방정식의 판별식 <math>D</math>를 유도하는 과정이다.
<math>f(x)=ax^2+bx+c </math>
<math>f'(x)=2ax+b</math>
<math> \mathrm{Res}(f,f')= \begin{vmatrix} a & b & c \\ 2a & b & 0 \\ 0 & 2a & b \end{vmatrix}= a \begin{vmatrix} b & 0 \\ 2a & b \end{vmatrix} -b \begin{vmatrix} 2a & 0 \\ 0 & b \end{vmatrix} +c \begin{vmatrix} 2a & b \\ 0 & 2a \end{vmatrix}</math>
<math> a \begin{vmatrix} b & 0 \\ 2a & b \end{vmatrix}= a(b^2-0\cdot 2a) </math>
<math> -b \begin{vmatrix} 2a & 0 \\ 0 & b \end{vmatrix} = -b(2ab-0^2)</math>
<math> c \begin{vmatrix} 2a & b \\ 0 & 2a \end{vmatrix}=c((2a)^2-0\cdot b)</math>
<math>\therefore \;\; a \begin{vmatrix} b & 0 \\ 2a & b \end{vmatrix} -b \begin{vmatrix} 2a & 0 \\ 0 & b \end{vmatrix} +c \begin{vmatrix} 2a & b \\ 0 & 2a \end{vmatrix}= a(b^2-0\cdot 2a) -b(2ab-0^2)+c((2a)^2-0\cdot b)</math>
<math> = ab^2-0\cdot 2a^2 -2ab^2+0^2b+c\cdot 4a^2-0\cdot bc</math>
<math> = ab^2-2ab^2+c\cdot 4a^2</math>
<math>\therefore \mathrm{Res}(f,f') =-ab^2+4a^2 c</math>
<math> D= (-1)^{n(n-1)\over 2} a_n^{-1} \mathrm{Res}(f,f') </math>
<math>\therefore D= (-1)^{n(n-1)\over 2} a_n^{-1} (-ab^2+4ca^2)</math>
<math>\quad = -a^{-1}(-ab^2+4ca^2)</math>
<math>= {(-ab^2+4ca^2) \over -a}</math>
<math>= b^2-4ca </math>
<math>\therefore D= b^2-4ca </math>
3.3. 대수 기하학에서[편집]
이 경우 elimination ideal <math>I\cap k[a_0,\cdots,a_m,b_0,\cdots,b_n]</math>은 principal ideal이 되며 그 생성원은 <math>\mathrm{Res}(f,g)</math>가 된다. 이는 [math(\mathbb Q)]와 같은 체에서 여러 변수, 여러 다항식일 때도 마찬가지로 성립하며,[5] 이 때의 생성원을 multipolynomial resultant라고 한다. 즉 Sylvester resultant는 그 특수한 경우이다.정리[4]
<math>f(x)=a_m x^m+a_{m-1} x^{m-1}+\cdots+a_1 x+a_0, \ g(x)=b_n x^n+b_{n-1} x^{n-1}+\cdots+b_1 x+b_0</math><math>I\ =\ <f,g>\ \subset \ k[x,a_0,\cdots,a_m,b_0,\cdots,b_n] </math>
<math>\Rightarrow \ I\cap k[a_0,\cdots,a_m,b_0,\cdots,b_n]\ =\ <\mathrm{Res}(f,g)> </math>
여기서 계수 <math>a_0,\cdots,a_m,b_0,\cdots,b_n</math>를 변수취급 해줬다. 이렇게 계수들을 변수취급해준 뒤 <math>x</math>와 같은 기존 변수를 소거(elimination)하여 계수들이 만족하는 조건을 알아내는 과정을 implicitization이라고 한다. 여기서는 그 조건이 resultant인 것이다.
4. 역사[편집]
제임스 조지프 실베스터(James Joseph Sylvester)[6] 가 도입하였다.[7] 좀 더 구체적으로는 제임스 조지프 실베스터가 아서 케일리(Arthur Cayley)와 함께한 행렬연구에서[8] [9] 그의 업적이 알려진 바 있다. [10]
5. 관련 문서[편집]
이 문서의 내용 중 전체 또는 일부는 2023-12-06 07:14:56에 나무위키 실베스터 행렬 문서에서 가져왔습니다.
[3] 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Proposition 5.12 참고.[4] 증명은 Brendan Hassett - Introduction to Algebraic Geometry의 Theorem 5.13 참고.[5] 증명은 Mateusz Michałek, Bernd Sturmfels - Invitation to Nonlinear Algebra의 Theorem 4.11 참고.[6] 실베스터-갈라이 정리를 증명한 사람이기도 하다.[7] 월프럼 매스월드, 실베스터 행렬 -https://mathworld.wolfram.com/SylvesterMatrix.html[8] 고등학교 기하와 벡터, 성지출판 ( <math>\text{I}</math> 일차변환과 행렬) 수학이야기-행렬과 행렬식37p 2017[9] A Memoir on the Theory of Matrices , Arthur Cayley , Philosophical Transactions of the Royal Society of London, Vol. 148 (1858), pp. 17-37 (21 pages) Published by Royal Society -https://www.jstor.org/stable/108649 [10] L. On Hamilton's quadratic equation and the general unilateral equation in matrices J.J. Sylvester F.R.S. 1884/11/01 Pages 454-458 | Published online: 29 Apr 2009 DOI https://doi.org/10.1080/14786448408627619