Milnor conjecture

0 / 0

Nhấn vào đây để tải về
Báo tài liệu có sai sót
Nhắn tin cho tác giả

(Tài liệu chưa được thẩm định)
Nguồn:
Người gửi: Nguyễn Hoàng Nam
Ngày gửi: 14h:52' 02-04-2024
Dung lượng: 328.9 KB
Số lượt tải: 0

Số lượt thích: 0 người

Từ bài toán tổng các bình phương đến giả thuyết Milnor
Nguyễn Mạnh Linh
Université Paris-Saclay

0

Mở đầu

Bài viết này giới thiệu về lý thuyết về các dạng toàn phương và giả thuyết Milnor, với xuất phát
điểm là một bài toán sơ cấp - biểu diễn một số nguyên dương thành tổng các số chính phương.
Ta bắt đầu với câu chuyện về tổng hai số chính phương. Định lý nhỏ Fermat có một hệ quả
đơn giản sau đây. Nếu p là một số nguyên tố, p ≡ 3 (mod 4), và a, b là các số nguyên sao cho
p|a2 + b2 thì p|a hoặc p|b. Từ đây ta suy ra rằng điều kiện cần để một số nguyên dương n biểu
diễn được thành tổng hai số chính phương là
Với mỗi số nguyên tố p ≡ 3

(mod 4), số mũ của p trong phân tích của n là số chẵn.

(1)

Hóa ra, (1) cũng là điều kiện đủ. Thật vậy, ta có đẳng thức nổi tiếng
(x21 + x22 )(y12 + y22 ) = (x1 y1 − x2 y2 )2 + (x1 y2 + x2 y1 )2

(2)

của Diophantus. Nhờ (2) cùng các đẳng thức 1 = 12 + 02 và 2 = 12 + 12 , ta chỉ cần chứng minh
rằng mọi số nguyên tố p ≡ 1 (mod 4) đều là tổng của hai số chính phương. Kết quả này được
biết đến với tên gọi “Định lý Fermat về tổng hai số chính phương”. Có nhiều chứng minh cho
định lý này, chẳng hạn chứng minh của Euler năm 1749 bằng xuống thang vô hạn và đẳng thức
(2). Năm 1990, Zagier đã đưa ra một “chứng minh một câu” như sau. Trên tập hợp hữu hạn
S = {(x, y, z) ∈ N3 : x2 + 4yz = p}, ta có hai phép đối hợp i : S → S (nghĩa là i ◦ i = idS ) cho bởi


(x + 2z, z, y − x − z) nếu x < y − z,
i(x, y, z) = (2y − x, y, x − y + z) nếu y − z < x < 2y,


(x − 2y, x − y + z, y) nếu x > 2y.
), vì thế |S| là số lẻ (các điểm
Ta kiểm tra được rằng i có điểm bất động duy nhất là (1, 1, p−1
4
không bất động của i được ghép cặp với nhau, nên |S| cùng tính chẵn lẻ với số điểm bất động của
i). Từ đó suy ra rằng phép đối hợp (x, y, z) 7→ (x, z, y) cũng có điểm bất động, nghĩa là tồn tại
x, y ∈ N sao cho p = x2 + 4y 2 = x2 + (2y)2 .
Năm 1748, Euler đã phát hiện ra một đẳng thức theo tinh thần của (2), nhưng là cho tổng bốn
bình phương,

1

(x21 + x22 + x23 + x24 )(y12 + y22 + y32 + y42 ) = (x1 y1 − x2 y2 − x3 y3 − x4 y4 )2
+ (x1 y2 + x2 y1 + x3 y4 − x4 y3 )2
+ (x1 y3 − x2 y4 + x3 y1 + x4 y2 )2
+ (x1 y4 + x2 y3 − x3 y2 + x4 y1 )2 .

(3)

Nhờ (3) cùng các đẳng thức 1 = 12 + 02 + 02 + 02 và 2 = 12 + 12 + 02 + 02 , ta suy ra rằng mọi số
nguyên dương đều là tổng của bốn số chính phương nếu ta chứng minh được điều đó cho các số
nguyên tố lẻ. Điều này đã được thực hiện bởi Lagrange năm 1770. Cụ thể, trong trường Fp = Z/pZ,
ta có a2 = b2 khi và chỉ khi a = ±b, nên đa thức thức x2 nhận đúng p−1
giá trị khác nhau khi x
2
p+1
thay đổi trong Fp \ {0} (vì thế nhận đúng 2 giá trị khi x thay đổi trong Fp ). Điều này cũng đúng
với đa thức −x2 − 1, vì thế tồn tại a, b ∈ Z sao cho a2 ≡ −b2 − 1 (mod p), hay a2 + b2 + 12 + 02 = kp
2
với k ∈ N∗ . Ta có thể chọn a, b sao cho |a| < p2 và |b| < p2 , từ đó kp < p2 + 1 < p2 , nên k < p.
Ta lấy số nguyên dương k0 nhỏ nhất sao cho k0 p là tổng của bốn số chính phương và chứng
minh rằng k0 = 1. Trước hết, hiển nhiên k0 ≤ k < p. Viết k0 p = x21 + x22 + x23 + x24 và giả sử phản
chứng rằng k0 > 1. Nếu k0 chẵn thì có một số chẵn các số lẻ trong bốn số x1 , x2 , x3 , x4 . Đánh số
lại nếu cần, ta có thể giả sử x1 ≡ 2 (mod 2) và x3 ≡ x4 (mod 2). Khi đó
k0
·p=
2

x1 + x2
2

2

+

x1 − x2
2

2

+

x3 + x4
2

2

+

x3 − x 4
2

2
,

mâu thuẫn với tính nhỏ nhất của k0 . Vậy k0 lẻ. Với i = 1, 2, 3, 4, chọn số nguyên yi ≡ xi (mod k0 )
sao cho |yi | ≤ k20 (từ đó suy ra |yi | < k20 ). Ta thu được y12 + y22 + y32 + y42 = k0 k1 với 0 ≤ k1 < k0 (vì
y12 + y22 + y32 + y42 < k02 ). Nếu k1 = 0 thì y1 = y2 = y3 = y4 = 0, nên x1 , x2 , x3 , x4 đều chia hết cho
k0 , suy ra k02 = x21 + x22 + x23 + x24 |pk0 , hay k0 |p. Điều này là không thể vì k0 > 1 và p là số nguyên
tố lớn hơn k0 . Vậy 0 < k1 < k0 . Từ đẳng thức (3) (đổi dấu y1 ), ta có
k02 k1 p = (x21 + x22 + x23 + x24 )(y12 + y22 + y32 + y42 ) = z12 + z22 + z32 + z42 ,
với

z1



z
2

z3



z4

= −x1 y1 − x2 y2 − x3 y3 − x4 y4 ≡ −(x21 + x22 + x23 + x24 )
= x1 y2 − x2 y1 + x3 y4 − x4 y3 ≡ x1 x2 − x2 x1 + x3 x4 − x4 x3
= x1 y3 − x2 y4 − x3 y1 + x4 y2 ≡ x1 x3 − x2 x4 − x3 x1 + x4 x2
= x1 y4 + x2 y3 − x3 y2 − x4 y1 ≡ x1 x4 + x2 x3 − x3 x2 − x4 x1

≡ 0 (mod k0 )
≡ 0 (mod k0 )
≡ 0 (mod k0 )
≡ 0 (mod k0 ).

Vậy z1 , z2 , z3 , z4 đều chia hết cho k0 và ta có
2 2 2 2
z1
z2
z3
z4
k1 p =
+
+
+
,
k0
k0
k0
k0
mâu thuẫn với tính nhỏ nhất của k0 . Tóm lại, giả sử k0 > 1 là sai và ta có k0 = 1, hay p là tổng
của bốn số chính phương.
Các đẳng thức (2) và (3) có thể được hiểu theo một nghĩa tự nhiên hơn như sau. Nhắc lại rằng
một phần tử của trường số phức C được cho bởi x = x1 + x2 i, với x1 , x2 ∈ R (tức là C là một
R-không gian vectơ 2-chiều với cơ sở {1, i}) và i2 = −1. Ta định nghĩa số phức liên hợp và chuẩn
của z lần lượt bởi x := x1 − x2 i và N (x) := xx = |x|2 = x21 + x22 . Phép liên hợp thỏa mãn xy = x · y,
2

nên N (xy) = N (x)N (y). Đây chính là đẳng thức (2) của Diophantus. Năm 1843, Hamilton đã
khám phá ra đại số quaternion H, đó là một R-không gian vectơ 4-chiều với cơ sở {1, i, j, k} và
phép nhân cho bởi quy tắc i2 = j 2 = k 2 = ijk = −1. Nói riêng, ta có ij = −ji, nên phép nhân
trên H không giao hoán. Tuy nhiên nó vẫn kết hợp và mọi phần tử khác 0 đều có nghịch đảo
hai phía (hay H là một đại số chia). Ta cũng định nghĩa liên hợp và chuẩn của một quaternion
x = x1 +x2 i+x3 j +x4 k lần lượt bởi x := x1 −x2 i−x3 j −x4 k và N (x) := xx = x21 +x22 +x23 +x24 . Phép
liên hợp thỏa mãn xy = y · x (nó là một phản đồng cấu đại số), nên ta cũng có N (xy) = N (x)N (y),
đó chính là đẳng thức (2) của Euler.
Xây dựng của trường số phức C có thể được mô tả lại bởi C := R2 , với phép nhân cho bởi
công thức (x1 , x2 )(y1 , y2 ) := (x1 y1 − y2 x2 , y2 x1 + x2 y1 ). Mỗi số thực x ∈ R được đồng nhất với
cặp (x, 0), còn cặp (0, 1) chính là ký hiệu hình thức i mà ta đã dùng để chỉ một căn bậc hai của
−1. Phép liên hợp phức được cho bởi (x1 , x2 ) := (x1 , −x2 ). Tương tự, ta có thể coi H := C2 với
phép nhân cho bởi công thức (x1 , x2 )(y1 , y2 ) := (x1 y1 − y2 x2 , y2 x1 + x2 y1 ) và phép liên hợp cho bởi
(x1 , x2 ) := (x1 , −x2 ). Cayley và Graves đã tiếp tục quá trình này (xây dựng Cayley–Dickson) để
thu được đại số octonion O = H2 với phép nhân và phép liên hợp cho bởi các công thức tương tự.
Đó là một R-không gian vectơ 8-chiều, nơi phép nhân không còn tính kết hợp. Tuy nhiên, ta vẫn
có N (xy) = N (x)N (y) với mọi x, y ∈ O. Từ đây ta thu dược đẳng thức của Degen về tổng tám
bình phương,

=
+
+
+
+
+
+
+

(x21 + x22 + x23 + x24 + x21 + x25 + x26 + x27 + x28 )(y12 + y22 + y32 + y42 + y52 + y62 + y72 + y82 )
(x1 y1 − x2 y2 − x3 y3 − x4 y4 − x5 y5 − x6 y6 − x7 y7 − x8 y8 )2
(x1 y2 + x2 y1 + x3 y4 − x4 y3 + x5 y6 − x6 y5 − x7 y8 + x8 y7 )2
(x1 y3 − x2 y4 + x3 y1 + x4 y2 + x5 y7 + x6 y8 − x7 y5 − x8 y6 )2
(x1 y4 + x2 y3 − x3 y2 + x4 y1 + x5 y8 − x6 y7 + x7 y6 − x8 y5 )2
(x1 y5 − x2 y6 − x3 y7 − x4 y8 + x5 y1 + x6 y2 + x7 y3 + x8 y4 )2
(x1 y6 + x2 y5 − x3 y8 + x4 y7 − x5 y2 + x6 y1 − x7 y4 + x8 y3 )2
(x1 y7 + x2 y8 + x3 y5 − x4 y6 − x5 y3 + x6 y4 + x7 y1 − x8 y2 )2
(x1 y8 − x2 y7 + x3 y6 + x4 y5 − x5 y4 − x6 y3 + x7 y2 − x8 y1 )2 .

(4)

Một cách tự nhiên, ta tự hỏi rằng liệu có một đẳng thức tương tự cho lũy thừa tiếp theo của
8, tức là 16 bình phương. Câu trả lời đáng tiếc là “không”. Khi áp dụng xây dựng Cayley–Dickson
cho đại số octonion, ta thu được đại số sedenion S, nơi mà đẳng thức N (xy) = N (x)N (y) không
còn đúng. Tổng quát hơn, ta tự hỏi rằng với n ∈ N∗ liệu có tồn tại các đa thức Z1 , . . . , Zn , song
tuyến tính theo hai bộ biến X = (X1 , . . . , Xn ) và Y = (Y1 , . . . , Yn ) (nghĩa là mỗi đa thức Zi là tổ
hợp tuyến tính của các đơn thức dạng Xj Yk ), sao cho
(X12 + · · · + Xn2 )(Y12 + · · · + Yn2 ) = Z12 + · · · + Zn2

(5)

hay không? Chẳng hạn, ta đã thấy rằng điều này đúng với n = 1, 2, 4, 8. Hurwitz đã dập tắt hi
vọng này bằng một định lý được chứng minh năm 1898, chỉ ra rằng bốn giá trị vừa rồi là tất cả
các giá trị của n sao cho tồn tại một đẳng thức có dạng (5). Ở mục 2, ta sẽ “cứu vãn” một phần
của hi vọng trên với kết quả của Pfister, nói rằng với n là lũy thừa của 2 thì ta có thể tìm được
một đẳng thức kiểu (5) với Zi là các phân thức hữu tỉ và tuyến tính theo Y .

3

1

Sơ lược về dạng toàn phương

Để trình bày kết quả của Pfister về tổng của 2m bình phương, ta cần ngôn ngữ của các dạng toàn
phương trên trường tùy ý (chính công trình của Pfister đã mở đường cho việc nghiên cứu lý thuyết
này). Trong suốt bài viết, ta làm việc với các trường k có đặc số khác 2 (nghĩa là 1 + 1 ̸= 0 trong
k). Các trường như Q, R, C, Fp (với p lẻ)... thỏa mãn tính chất này, nhưng các trường như F2 hay
F2 (X) thì không. Một dạng toàn phương n-chiều trên k là một đa thức thuần nhất bậc 2 theo n
biến
n
X
X
aij Xi Xj ,
q(X) = q(X1 , . . . , Xn ) =
ai Xi2 +
i=1

1≤in

với ai , aij ∈ k. Hiển nhiên, nó định nghĩa một hàm q : k → k thỏa mãn q(λv) = λ2 v với mọi λ ∈ k
và v ∈ k n . Ta nói hai dạng toàn phương q và q ' (với cùng số chiều n) đẳng cự và ký hiệu q ≃ q '
nếu tồn tại các dạng tuyến tính L1 , . . . , Ln (các đa thức thuần nhất bậc 1) theo n biến và độc lập
tuyến tính, sao cho q ' = q(L1 , . . . , Ln ). Nhờ một kỹ thuật thêm bớt bình phương cơ bản, được gọi
là phương pháp Gauß, ta có thể chỉ ra rằng mọi dạng toàn phương đều đẳng cự với một dạng toàn
phương đường chéo
n
X
⟨a1 , . . . , an ⟩ :=
ai Xi2
i=1
2

2

với a1 , . . . , an ∈ k. Chẳng hạn, với q = X + 4Y + Z 2 + 4XY + 2XZ, phương pháp Gauß được
thực hiện như sau. Chọn một biến T mà hệ số của T 2 khác 0, gọi là biến trục (ở đây ta lấy T = X)
và thêm bớt bình phương với tất cả các đơn thức chứa X còn lại, cụ thể
q = X 2 + 2X(2Y + Z) + (2Y + Z)2 − (2Y + Z)2 + 4Y 2 + Z 2 = (X + 2Y + Z)2 − 4Y Z.
Ta tiếp tục quá trình này với phần còn lại của q sau khi đã bỏ hạng tử chứa biến trục là (X +
2Y + Z)2 . Nếu xảy ra tình huống không chọn được biến trục nào, nhưng có hai biến (như ở đây
và Z ' = Y −Z
và dùng đẳng thức
là Y và Z) mà hệ số của Y Z khác 0, thì đổi biến Y ' = Y +Z
2
2
Y Z = (Y ' )2 − (Z ' )2
rồi tiếp tục chọn biến trục (chẳng hạn là Y ' ). Ở đây, ta có
q = (X + 2Y + Z)2 − (Y + Z)2 + (Y − Z)2 ≃ ⟨1, −1, 1⟩.
Các vô hướng a1 , . . . , an ∈ k trong biểu diễn q ≃ ⟨a1 , . . . , an ⟩ hoàn toàn không duy nhất. Chẳng
hạn, ta có ⟨a1 , . . . , an ⟩ ≃ ⟨λ21 a1 , . . . , λ2n an ⟩ với mọi λ1 , . . . , λn ∈ k × . Tuy nhiên, số vô hướng khác
0 trong chúng chỉ phụ thuộc vào q, nó được gọi là hạng của q, ký hiệu bởi rk(q). Nếu nó bằng
dim(q), số chiều (tức là số biến) của q, ta nói q không suy biến.
Ta có thể nhân một vô hướng với một dạng toàn phương. Nếu q ≃ ⟨a1 , . . . , an ⟩ và λ ∈ k thì
λq ≃ ⟨λa1 , . . . , λan ⟩. Phép toán không tầm thương đầu tiên trên các dạng toàn phương là tổng
trực giao. Nếu q1 và q2 lần lượt là các dạng toàn phương n1 - và n2 -chiều, ta định nghĩa tổng trực
giao q1 ⊥ q2 của chúng là dạng toàn phương (n1 + n2 )-chiều được định nghĩa bởi
(q1 ⊥ q2 )(X1 , . . . , Xn1 +n2 ) := q1 (X1 , . . . , Xn1 ) + q2 (Xn1 +1 , . . . , Xn1 +n2 ).
Tổng trực giao ⊥ có tính giao hoán, kết hợp (theo nghĩa sai khác đẳng cự) và có phần tử trung
lập là 0 (dạng toàn phương 0-chiều). Hiển nhiên, ta có ⟨a1 , . . . , an ⟩ ≃ ⟨a1 ⟩ ⊥ · · · ⊥ ⟨an ⟩ với mọi
a1 , . . . , an . Như đã nói ở trên, mọi dạng toàn phương q đều có phân tích trực giao
q = ⟨0⟩⊥(dim(q)−rk(q)) ⊥ q0 ,
4

với q0 là một dạng toàn phương không suy biến, nghĩa là q0 ≃ ⟨a1 , . . . , ar ⟩, với ai ∈ k × và r = rk(q).
Trên R, ta có khái niệm dạng toàn phương xác định dấu. Tính xác định dấu (dương hoặc âm)
của một dạng toàn phương thực không suy biến q tương đương với q(v) ̸= 0 với mọi vectơ v ̸= 0.
Trên trường k tùy ý, ta không có thứ tự để nói về tính xác định dấu. Thay vào đó, nó được thay
bởi khái niệm sau đây. Ta nói một dạng toàn phương n-chiều q là dị hướng nếu q(v) ̸= 0 với mọi
vectơ v ∈ k n \ {0}, đẳng hướng nếu tồn tại v ∈ k n \ {0} sao cho q(v) = 0. Hiển nhiên, mọi dạng
toàn phương suy biến đều đẳng hướng (hay mọi dạng toàn phương dị hướng đều không suy biến).
Với dạng toàn phương 1-chiều ⟨a⟩, a ∈ k, ta có
⟨a⟩ không suy biến ⇔ ⟨a⟩ dị hướng ⇔ a ̸= 0.
Với số chiều 2, ta có ví dụ đầu tiên về một dạng toàn phương không suy biến đẳng hướng là
H := ⟨1, −1⟩ = X 2 − Y 2 , vì H(1, 1) = 0. Ta gọi nó là mặt phẳng hyperbolic. Hóa ra, đây là dạng
toàn phương duy nhất (sai khác đẳng cự) như vậy. Thật vậy, xét một dạng toàn phương ở dạng
đường chéo, q = ⟨a, b⟩ = aX 2 + bY 2 với a, b ̸= 0. Nếu q đẳng hướng thì tồn tại (x, y) ∈ k 2 \ {(0, 0)}
với ax2 + by 2 = 0. Từ đây ta suy ra x, y ̸= 0, nên q = ⟨a, b⟩ ≃ ⟨a, by 2 ⟩ ≃ ⟨a, −ax2 ⟩ ≃ ⟨a, −a⟩. Cuối
cùng, từ đẳng thức
2
2

a−1
a−1
a+1
a+1
2
2
X+
X −
X+
X ,
aX − aY =
2
2
2
2
ta thu được q ≃ ⟨a, −a⟩ ≃ ⟨1, −1⟩ = H.
Tổng quát hơn, với q là một dạng toàn phương không suy biến và dị hướng, không khó để ta
chứng minh được rằng H là một hạng tử trực giao của q, nghĩa là q = H ⊥ q1 với một dạng toàn
phương q1 nào đó. Vì số chiều của q hữu hạn, ta chứng minh được bằng quy nạp rằng q ≃ H ⊥s ⊥ qan
với qan là một dạng toàn phương dị hướng và s ∈ N
Định lý 1.1 (Phân tích Witt). Mọi dạng toàn phương q đều có phân tích trực giao
q ≃ ⟨0⟩⊥r ⊥ H ⊥s ⊥ qan ,
với r, s ∈ N xác định duy nhất, và qan xác định duy nhất sai khác đẳng cự (ta gọi qan là phần dị
hướng của q).
Ta đã thấy ở trên rằng việc chỉ ra sự tồn tại của phân tích là khá dễ dàng. Tuy nhiên việc
chứng minh tính duy nhất thì phức tạp hơn nhiều và cần đến định lý giản ước Witt, nói rằng nếu
q ⊥ q1 ≃ q ⊥ q2 thì q1 ≃ q2 . Số tự nhiên s trong phân tích trên được gọi là chỉ số Witt của q và sẽ
được ký hiệu bởi w(q) trong các phần sau của bài viết. Ngoài ra, kể từ nay, ta sẽ giả sử rằng mọi
dạng toàn phương được nhắc đến đều không suy biến.

2

Dạng Pfister và tổng các bình phương

Ta trở lại với bài toán tổng các bình phương ở mục 0, cụ thể là định lý Pfister về tổng 2m bình
phương. Chứng minh của Pfister khá đơn giản và khiến cho các nhà toán học lúc bấy giờ rất ngạc
nhiên.
Trước hết, ta nói về phép toán thứ hai trên các dạng toàn phương, tích tenxơ. Khi tổng trực
giao ⊥ có vai trò như “phép cộng” thì tích tenxơ đóng vai trò “phép nhân”. Để đơn giản, ta chỉ cần
quan tâm đến tích tenxơ trên của các dạng đường chéo. Nếu q ≃ ⟨a1 , . . . , an ⟩ và q ' ≃ ⟨b1 , . . . , bm ⟩
lần lượt là các dạng toàn phương n- và m-chiều, ta định nghĩa q ⊗ q ' là dạng toàn phương (sai
khác đẳng cự) mn-chiều ⟨a1 b1 , . . . , ai bj , . . . an bm ⟩. Phép toán ⊗ giao hoán, kết hợp, phân phối đối
với tổng trực giao, và có phần tử trung lập là ⟨1⟩.
5

Định nghĩa 2.1. Với m ≥ 0 và a1 , . . . , am ∈ k × , ta gọi dạng toàn phương
⟨⟨a1 , . . . , am ⟩⟩ := ⟨1, −a1 ⟩ ⊗ · · · ⊗ ⟨1, −am ⟩
là một dạng Pfister cấp m.
Như vậy, một dạng Pfister cấp m có số chiều bằng 2m . Dạng toàn phương ⟨⟨−1, . . . , −1⟩⟩ =
+ · · · + X22m chính là đối tượng mà ta quan tâm ở mục 0. Một tính chất quan trọng của các
dạng Pfister là tính nhân tính. Với m = 0, dạng toàn phương ⟨1⟩ = X 2 thỏa mãn X 2 Y 2 = (XY )2 .
Với m = 1, dạng toàn phương ⟨1, −a⟩ = X12 − aX22 thỏa mãn đẳng thức

X12

(X12 − aX22 )(Y12 − aY22 ) = (X1 X2 + aY1 Y2 )2 − a(X1 Y2 + X2 Y1 )2 .

(6)

tương tự như (2). Với m = 2, ta sẽ thấy ở mục 4 rằng dạng toàn phương ⟨⟨a, b⟩⟩ = X12 − aX22 −
bX32 + abX42 cũng thỏa mãn một đẳng thức tương tự như (3), vì đó là “chuẩn thu gọn” của đại số
quaternion suy rộng Ha,b . Với m = 3, dạng toàn phương ⟨⟨a, b, c⟩⟩ thu được từ đại số octonion suy
rộng Ha,b,c , thu được từ Ha,b bởi xây dựng Cayley–Dickson, vì thế cũng thỏa mãn một đẳng thức
tương tự như (4). Nói riêng (với m = 0, 1, 2, 3), tập hợp
m

{q(v) : v ∈ k 2 } \ {0}
các giá trị khác 0 của k lập thành một nhóm con của nhóm nhân k × . Tất nhiên, điều này cũng
đúng khi thay k bởi một mở rộng trường tùy ý.
Với mỗi dạng toàn phương n-chiều q trên k và mỗi mở rộng trường K ⊇ k, ký hiệu bởi qK
dạng toàn phương trên K thu được bằng cách coi các hệ số của q như những phần tử của K (nói
riêng, ta có một hàm qK : K n → K).
Định nghĩa 2.2. Một dạng toàn phương n-chiều q trên k được gọi là nhân tính nếu trên trường
K := k(X, Y ) các phân thức hữu tỉ (theo 2n biến) trên k, đa thức qK (X)qK (Y ) ∈ K là một giá
trị của qK .
Chú ý rằng mặt phẳng hyperbolic H = ⟨1, −1⟩ hiển nhiên nhân tính, vì với mọi mở rộng trường
K ⊇ k, mỗi phần tử a ∈ K × đều là một giá trị của HK (do HK ≃ ⟨a, −a⟩ với mọi a ∈ K × ). Từ
đây ta thấy rằng mọi dạng toàn phương (không suy biến) đẳng hướng q đều nhân tính (vì H là
một hạng tử trực giao của q). Kết quả chính của mục này là việc các dạng toàn phương dị hướng
nhân tính duy nhất là các dạng Pfister. Ta cần một số kết quả chuẩn bị. Trước hết, với mỗi dạng
toàn phương q trên, ta có dạng song tuyến tính đối xứng tương ứng
b : k n × k n → k,

1
b(u, v) = (q(u + v) − q(u) − q(v)),
2

nghĩa là b(u, v) = b(v, u), b(u1 +u2 , v) = b(u1 , v)+b(u2 , v) và b(λu, v) = λb(u, v) với u, u1 , u2 , v ∈ k n
và λ ∈ k. Ngoài ra, ta có q(v) = b(v, v). Sử dụng công thức q(u + λv) = q(u) + 2λb(u, v) + λ2 q(v),
ta dễ dàng kiểm tra được rằng

q(u) − q(v)
q u+
(v − u) = q(v).
(7)
q(v − u)
Định lý 2.3 (Cassels–Pfister). Cho q là một dạng toàn phương n-chiều trên k và p ∈ k[X] là một
đa thức một biến. Nếu p là một giá trị của qk(X) thì tồn tại w ∈ k[X]n sao cho qk(X) (w) = p.
6

Chứng minh. Nếu q đẳng hướng thì tồn tại ma trận khả nghịch A ∈ GLn (k) sao cho
q(XA) = X12 − X22 +

n
X

ai Xi2 ,

i=3

, p−1
, 0, . . . , 0 A−1 ∈ k[X]n thỏa mãn qk(X) (w) = p.
với a3 , . . . , an ∈ k × . Khi đó, dễ thấy w = p+1
2
2
Vì vậy, ta có thể giả sử rằng q dị hướng. Khi đó, qk(X) cũng dị hướng (chính xác hơn, nếu
f = (f1 , . . . , fn ) ∈ k[X]n \ {0} thỏa mãn max deg(fi ) = d thì deg(qk(X) (f )) = 2d).
1≤i≤n

n

Từ giả thiết, tồn tại v ∈ k(X) sao cho qk(X) (v) = p. Bằng cách khử mẫu số, ta thu được đa
thức f ∈ k[X] \ {0} sao cho f v ∈ k[X]n . Ta chọn v và f sao cho f có bậc nhỏ nhất có thể. Định
lý được chứng minh nếu ta chỉ ra được rằng f ∈ k × . Thật vậy, giả sử phản chứng rằng f có bậc
dương. Thực hiện phép chia Euclid cho từng tọa độ của f v, ta thu được f v = f u + r, trong đó
u, r ∈ k[X]n , và các tọa độ của r đều có bậc nhỏ hơn deg(f ). Nếu r = 0 thì v = u ∈ k[X]n (nên
f ∈ k × , mâu thuẫn với giả sử phản chứng. Vậy r ̸= 0, nên qk(X) (r) ̸= 0 vì qk(X) dị hướng. Ta có
f 2 p = qk(X) (f v) = f 2 qk(X) (u) + 2f b(u, r) + qk(X) (r),
với b : k(X)n × k(X)n → k(X) là dạng song tuyến tính đối xứng ứng với qk(X) , nên qk(X) (r) = f g
với g ∈ k[X]. Đặt
w := u +

qk(X) (u) − qk(X) (v)
qk(X) (u) − p
(v − u) = u +
r.
qk(X) (u − v)
g

Từ công thức (7), ta có qk(X) (w) = p. Ngoài ra, dễ thấy gw ∈ k[X] và
deg(g) = deg(qk(X) (r)) − deg(f ) < 2 deg(f ) − deg(f ) = deg(f ),
mâu thuẫn với cách chọn v và f . Vậy f ∈ k × , chứng minh kết thúc.
Hệ quả 2.4 (Nguyên lý đặc biệt hóa). Cho q là một dạng toàn phương n-chiều trên k và p ∈ k(X)
là một phân thức hữu tỉ theo n biến. Nếu p là một giá trị của qk(X) thì với mọi điểm v ∈ k n mà
tại đó p xác định, ta có p(v) là một giá trị của q.
Chứng minh. Viết p = fg , với f, g ∈ k[X] và g(v) ̸= 0. Thay p bởi g 2 p = f g, ta có thể giả sử p ∈
k[X]. Viết v = (v1 , . . . , vn ). Ta chứng minh bằng quy nạp lùi theo i rằng p(X1 , . . . , Xi , vi+1 , . . . , vn )
là một giá trị của qk(X1 ,...,Xi ) . Khẳng định hiển nhiên đúng với i = n. Xét i < n và đặt X ' :=
(X1 , . . . , Xi ), v ' := (v1 , . . . , vi ). Theo giả thiết quy nạp, tồn tại u(X ' , Xi+1 ) ∈ k(X ' , Xi+1 )n
sao cho qk(X ' ,Xi+1 ) (u(X ' , Xi+1 )) = p(X ' , Xi+1 , . . . , vn ). Theo Định lý 2.3, ta có thể giả sử rằng
u(X ' , Xi+1 ) ∈ k(X ' )[Xi+1 ]n . Nói riêng, ta có thể thay Xi+1 = vi+1 để thu được p(X ' , vi+1 , . . . , vn ) =
qk(X ' ) (u(X ' , vi+1 )), hay p(X ' , vi+1 , . . . , vn ) là một giá trị của qk(X ' ) .
Hệ quả 2.5. Nếu q là một dạng toàn phương nhân tính trên k thì với mọi mở rộng trường L ⊇ k,
tích của hai giá trị khác 0 của qL lại là một giá trị của qL .
Chứng minh. Thật vậy, xét v, w ∈ Ln (với n = dim(q)). Vì qk(X,Y ) (q(X))qk(X,Y ) (q(Y )) là một giá
trị của qk(X,Y ) nên qL(X,Y ) (qL (X))qL(X,Y ) (qL (Y )) cũng là một giá trị của qL(X,Y ) . Theo Hệ quả 2.4
thì qL(X) (q(X))qL (w) là một giá trị của qL(X) . Tương tự, qL (v)qL (w) là một giá trị của qL .
Định lý thứ hai mà ta cần là kết quả sau đây.
7

Định lý 2.6 (Định lý về dạng con). Cho q và q ' là hai dạng toàn phương dị hướng trên k và đặt
m = dim(q ' ). Ta có q ' là một hạng tử trực giao của q khi và chỉ khi q ' (X1 , . . . , Xm ) là một giá trị
của qk(X1 ,...,Xm ) .
Chứng minh của Định lý 2.6 được thực hiện bằng quy nạp theo m. Bước quy nạp dài và kỹ
thuật nên ta không trình bày ở đây, nó cần đến định lý thác triển Witt (kết quả này cũng được
dùng trong chứng minh của định lý giản ước Witt). Với bước khởi đầu quy nạp m = 1, nếu
q ' (X) = aX 2 là một giá trị của qk(X) thì theo nguyên lý đặc biệt hóa (Hệ quả 2.4), tồn tại v ∈ k n
(với n = dim(q)) sao cho q(v) = a. Tất nhiên, v ̸= 0 vì a ̸= 0. Lấy A ∈ GLn (k) là một ma trận khả
nghịch với hàng đầu bằng v, thế thì q((1, 0, . . . , 0)A) = q(v) = a, nghĩa là hệ số của X12 trong dạng
toàn phương q((X1 , . . . , Xn )A) bằng a. Bằng cách thêm bớt bình phương (phương pháp Gauß), ta
thu được q ≃ ⟨a⟩ ⊥ q ' = q ' ⊥ q '' với một dạng toàn phương q '' nào đó.
Hệ quả 2.7. Cho q là một dạng toàn phương dị hướng n-chiều trên k và K := k(X) là trường các
phân thức hữu tỉ theo n biến. Ta có q nhân tính khi và chỉ khi qK ≃ q(X)qK .
Chứng minh. Nếu qK ≃ q(X)qK thì tồn tại ma trận A ∈ GLn (K) sao cho qK (Y A) = q(X)q(Y ),
với Y = (Y1 , . . . , Yn ) là n biến mới. Điều này có nghĩa là q(X)q(Y ) là một giá trị của qk(X,Y )
(vì Y A ∈ k(X, Y )n ). Ngược lại, giả sử q(X)q(Y ) là một giá trị của qk(X,Y ) . Theo Định lý 2.6 thì
q(X)qK là một dạng con của qK . Vì lý do số chiều, ta có q(X)qK ≃ qK .
Định lý 2.8 (Pfister). Các dạng Pfister đều nhân tính. Ngược lại, mỗi dạng toàn phương dị hướng
nhân tính đều đẳng cự với một dạng Pfister.
Chứng minh. Ta đã thấy rằng mọi dạng toàn phương đẳng hướng đều nhân tính, nên ta chỉ cần
chứng minh khẳng định đầu tiên cho các dạng Pfister dị hướng. Ta đã thấy ở (6) rằng các dạng
Pfister cấp 1 đều nhân tính. Xét q = ⟨⟨a1 , . . . , am ⟩⟩ là một dạng Pfister dị hướng cấp m ≥ 2. Ta
có q ≃ q ' ⊗ ⟨1, −am ⟩ ≃ q ' ⊥ (−am )q ' , với q ' = ⟨⟨a1 , . . . , am−1 ⟩⟩ (nói riêng, q ' dị hướng). Theo giả
thiết quy nạp, q ' nhân tính. Ký hiệu X và Y là hai bộ gồm 2m−1 biến. Theo Hệ quả 2.7, ta có
'
'
'
'
'
qk(X)
≃ q ' (X)qk(X)
và qk(Y
) ≃ q (Y )qk(Y ) . Đặt K := k(X, Y ), ta có
'
'
'
'
'
⊥ (−am )q ' (Y )qK
≃ ⟨q ' (X), −am q ' (Y )⟩ ⊗ qK
.
qK ≃ qK
⊥ (−am )qK
≃ q ' (X)qK

Bổ đề 2.9. Nếu γ là một giá trị khác 0 của một dạng toàn phương 2-chiều ⟨α, β⟩ trên một trường
k thì ⟨α, β⟩ ≃ γ⟨1, αβ⟩.
Chứng minh. Thật vậy, viết γ = αu2 − βv 2 với u, v ∈ k. Ta có
γ(αX 2 − βY 2 ) = (αu2 − βv 2 )(αX 2 − βY 2 ) = (αuX + βvY )2 − αβ(vX + uY )2 ,
nên γ⟨α, β⟩ ≃ ⟨1, αβ⟩, suy ra ⟨α, β⟩ ≃ γ1 ⟨1, αβ⟩ ≃

γ2
⟨1, αβ⟩
γ

≃ γ⟨1, αβ⟩.

Trở lại với chứng minh của Định lý 2.8. Vì q(X, Y ) = q ' (X) − am q ' (Y ) nên q(X, Y ) là một giá
trị của dạng toàn phương ⟨q ' (X), −am q ' (Y )⟩ trên K. Theo Bổ đề 2.9, ta có
'
qK ≃ ⟨q ' (X), −am q ' (Y )⟩ ⊗ qK
'
≃ q(X, Y )⟨1, −am q ' (X)q ' (Y )⟩ ⊗ qK
'
'
≃ q(X, Y )(qK
⊥ (−am q ' (X)q ' (Y )qK
))
'
'
'
≃ q(X, Y )(qK ⊥ (−am q (X)qK ))
'
'
≃ q(X, Y )(qK
⊥ (−am qK
))
≃ q(X, Y )qK .

8

Theo Hệ quả 2.7, q là một dạng nhân tính.
Ngược lại, giả sử q là một dạng toàn phương dị hướng nhân tính. Gọi m là số tự nhiên lớn
nhất sao cho q có một hạng tử trực giao là một dạng Pfister cấp m, chẳng hạn là q ≃ q ' ⊥ q '' với
q ' ≃ ⟨⟨a1 , . . . , am ⟩⟩. Giả sử phản chứng rằng dim(q '' ) ≥ 1, ta viết q '' ≃ ⟨b1 , . . . , bn ⟩. Ký hiệu X =
(X1 , . . . , X2m ), K := k(X) và Y = (Y1 , . . . , Y2m +n ). Vì q nhân tính nên q ' (X)q(Y ) = q(X, 0)q(Y )
là một giá trị của qK(Y ) (Hệ quả 2.5). Vì q dị hướng nên qK cũng dị hướng (ta chỉ cần lặp lại suy
luận ở đầu chứng minh của Định lý 2.3 kết hợp với quy nạp). Theo định lý về dạng con (Định lý
2.6), q ' (X)qK là một dạng con của qK . Vì lý do số chiều, ta có
'
''
'
''
'
''
qK
⊥ qK
≃ qK ≃ q ' (X)qK ≃ q ' (X)qK
⊥ q ' (X)qK
≃ qK
⊥ q ' (X)qK

(ở đây, ta có q ' (X)q ' ≃ q ' vì ta chỉ ra rằng mọi dạng Pfister đều nhân tính). Theo định lý giản ước
''
''
''
Witt, ta có qK
≃ q ' (X)qK
. Nói riêng, b1 q ' (X) là một giá trị của qK
. Lại theo Định lý 2.6 thì b1 q '
là một hạng tử trực giao của q '' , nên dạng Pfister cấp m
q ' ⊥ b1 q ' = q ' ⊗ ⟨1, b1 ⟩ ≃ ⟨⟨a1 , . . . , am , −b1 ⟩⟩
là một hạng tử trực giao của q. Điều này mâu thuẫn với tính lớn nhất của m. Vậy q '' = 0 và vì
thế q ≃ q ' là một dạng Pfister.
m

Áp dụng Định lý 2.8 cho dạng Pfister q = ⟨⟨−1, . . . , −1⟩⟩ = ⟨1⟩⊥2 , ta suy ra rằng trên mọi
trường k, tồn tại một đẳng thức dạng
(X12 + · · · + X22m )(Y12 + · · · + Y22m ) = Z12 + · · · + Z22m
với Zi ∈ k(X, Y ). Ngược lại, các lũy thừa của 2 là các số nguyên dương duy nhất thỏa mãn tính
chất này trên mọi trường. Thật vậy, nếu ta có một đẳng thức
(X12 + · · · + Xn2 )(Y12 + · · · + Yn2 ) = Z12 + · · · + Zn2 ,
với Zi ∈ R(X, Y ), thì dạng toàn phương (dị hướng) ⟨1⟩⊥n nhân tính, vì thế đẳng cự với một dạng
Pfister theo Định lý 2.8. Nói riêng, số chiều n của nó là một lũy thừa của 2.

3

Vành Witt và bài toán phân loại dạng toàn phương

Sau các tổng bình phương, ta quay lại với câu chuyện về các dạng toàn phương. Bài toán cơ bản
của đại số là bài toán phân loại. Câu hỏi ở đây là làm thế nào để phân loại các dạng toàn phương
(không suy biến) sai khác đẳng cự.
Ví dụ 3.1. Hiển nhiên, mọi dạng toàn phương (không suy biến) 1-chiều đều dị hướng. Ngoài ra,
⟨a⟩ ≃ ⟨b⟩ khi và chỉ khi ab là một bình phương trong k. Ta ký hiệu k ×2 là nhóm con của k × gồm
các bình phương (tức là ảnh của đồng cấu k × → k × , x 7→ x2 ). Vậy các dạng toàn phương 1-chiều
được phân loại bởi nhóm thương k × /k ×2 .
Bài toán phân loại nhanh chóng trở nên phức tạp ở số chiều cao hơn. Có hai cách tiếp cận.
1. Phương pháp thứ nhất là mô tả tập hợp Q(k) các dạng toàn phương (sai khác đẳng cự) như
tập thương của một tập hợp quen thuộc. Một cách ngây thơ, nếu ta ký hiệu bởi Qn (k) tập
con của Q(k) gồm các dạng toàn phương n-chiều thì ta có toàn ánh
(k × )n → Qn (k),

(a1 , . . . , an ) 7→ ⟨a1 , . . . , an ⟩.
9

Tuy nhiên đây hoàn toàn không phải đơn ánh (chẳng hạn, ta có ⟨1⟩ ≃ ⟨λ2 ⟩ với mọi λ ∈ k × ).
Ta sẽ thấy ở mục 6 rằng nửa đầu tiên của giả thuyết Milnor cho phép ta có một biểu diễn
của Q(k) (tuy nhiên, không phải bằng ánh xạ được định nghĩa ngây thơ như trên).
2. Phương pháp thứ hai là định nghĩa các bất biến từ Q(k) vào các tập hợp quen thuộc hơn.
Một ví dụ đơn giản là số chiều,
dim : Q(k) → N,
Bất biến này toàn ánh nhưng không nhất thiết đơn ánh (chẳng hạn, trên R, ta có ⟨1⟩ ̸≃ ⟨−1⟩).
Như vậy ta cần thêm các bất biến khác tốt hơn số chiều. Ta sẽ thấy ở mục 7 rằng nửa sau
của giả thuyết Milnor cho phép ta xây dựng một họ các bất biến đầy đủ {e0 , e1 , . . .}, nghĩa
là hai dạng toàn phương q và q ' đẳng cự khi và chỉ khi en (q) = en (q ' ) với mọi n.
Theo định lý phân tích Witt (Định lý 1.1), ta chỉ cần phân loại các dạng toàn phương dị hướng.
Định nghĩa 3.2. Ta nói hai dạng toàn phương q và q ' đồng dạng hay tương đương Witt và ký
'
hiệu q ∼ q ' nếu qan ≃ qan
.
Nói cách khác, q ∼ q ' nếu tồn tại các số tự nhiên r, s sao cho q ⊥ H ⊥r ≃ q ' ⊥ H ⊥s . Ta ký
hiệu W (k) là tập hợp các dạng toàn phương không suy biến sai khác đồng dạng (ta cũng có thể
định nghĩa W (k) như tập hợp các dạng toàn phương dị hướng sai khác đẳng cự, nhưng định nghĩa
trước sẽ tiện hơn khi ta định nghĩa các phép toán cộng và nhân trên W (k)). Theo quy ước, 0 cũng
là một dạng toàn phương dị hướng (hiển nhiên, ta có 0 ∼ H). Ta bắt đầu với mô tả của tập hợp
W (k) trong một số trường hợp cụ thể.
Ví dụ 3.3.
1. Trên k = C (hay tổng quát hơn là một trường đóng đại số tùy ý), mọi phần tử
đều là một bình phương, nên mọi dạng toàn phương n-chiều đểu đẳng cự với ⟨1⟩⊥n . Như vậy
các dạng toàn phương trên C được phân loại bởi số chiều (tức là bởi tập hợp N). Ngoài ra,
mặt phẳng hyperbolic là hạng tử trực giao của mọi dạng toàn phương với số chiều ≥ 2, nên
ta chỉ có hai dạng toàn phương dị hướng trên C là 0 và ⟨1⟩. Nói cách khác, W (C) = {0, ⟨1⟩}.
2. Trên k = R, luật quán tính Sylvester nói rằng các dạng toàn phương được phân loại bởi tập
hợp N × N. Cụ thể, mỗi dạng toàn phương thực q đều đẳng cự với ⟨1⟩⊥s+ ⊥ ⟨−1⟩⊥s− , trong
đó s+ và s− xác định duy nhất (được gọi lần lượt là chỉ số quán tính dương và chỉ số quán
tính âm của q. Ngoài ra, q dị hướng khi và chỉ khi một trong hai chỉ số quán tính bằng 0.
Vậy
W (C) = {⟨−1⟩⊥n : n ∈ N∗ } ∪ {0} ∪ {⟨1⟩⊥n : n ∈ N∗ }.
Để có một mô tả thuận tiện hơn, ta gọi sgn(q) := s+ − s− là ký số của q và nhận xét rằng
hai dạng toàn phương thực đồng dạng khi và chỉ khi có cùng ký số (vì sgn(H) = 0). Vậy, ta
có một song ánh sgn : W (C) → Z.
3. Với k là một trường hữu hạn (khi đó |k| lẻ, vì ta đã giả sử k có đặc số khác 2), đồng cấu
k× → k×,

x 7→ x2

có hạt nhân là {1, −1}, nên nhóm thương k × /k ×2 gồm đúng 2 phần tử. Nếu ta lấy ε ∈ k × là
một phần tử tùy ý mà không là một bình phương thì mọi phần tử của k × hoặc là một bình
phương, hoặc là tích của ε với một bình phương. Nói riêng, có đúng hai dạng toàn phương
1-chiều trên k (sai khác đẳng cự) là ⟨1⟩ và ⟨ε⟩ (xem Ví dụ 3.1). Bằng một suy luận đếm
đơn giản như đã làm trong chứng minh của định lý Lagrange về tổng bốn bình phương ở
10

mục 0, ta thấy rằng phương trình aX 2 + bY 2 + c = 0 có nghiệm với mọi a, b, c ∈ k × , vì thế
mọi dạng toàn phương trên k với số chiều ≥ 3 đều đẳng hướng. Như vậy ta chỉ còn phải
xác định các dạng toàn phương dị hướng 2-chiều. Hiển nhiên, ⟨1, −ε⟩ là một dạng như vậy.
Ngược lại, dễ thấy mọi dạng toàn phương 2-chiều đều đẳng cự với ⟨1, 1⟩, ⟨1, ε⟩ hoặc ⟨ε, ε⟩.
Nếu −1 là một bình phương trong k (điều này tương đương với |k| ≡ 1 (mod 4)) thì các
dạng toàn phương ⟨1, 1⟩ ≃ ⟨1, −1⟩ và ⟨ε, ε⟩ ≃ ⟨ε, −ε⟩ đẳng hướng, trong khi ⟨1, ε⟩ ≃ ⟨1, −ε⟩.
Ngược lại, nếu −1 không là bình phương trong k (hay |k| ≡ 3 (mod 4)) thì −ε ∈ k ×2 , nên
⟨1, ε⟩ ≃ ⟨1, −1⟩ đẳng hướng và ⟨1, 1⟩ ≃ ⟨1, −ε⟩. Ngoài ra, hiển nhiên ⟨ε, ε⟩ cũng dị hướng,
còn ⟨ε, ε, 1⟩ đẳng hướng, nên 1 là một giá trị của dạng toàn phương ⟨ε, ε⟩. Theo Bổ đề 2.9,
ta có ⟨ε, ε⟩ ≃ ⟨1, ε2 ⟩ ≃ ⟨1, 1⟩ ≃ ⟨1, −ε⟩. Trong cả hai trường hợp, ta có ...