star twitter facebook envelope linkedin youtube alert-red alert home left-quote chevron hamburger minus plus search triangle x

KIỂM ĐỊNH GIẢ THUYẾT VÀ P-VALUE – "PHIÊN TÒA THỐNG KÊ" PHÂN XỬ GIỮA SỰ THẬT VÀ ĂN MAY

KIỂM ĐỊNH GIẢ THUYẾT VÀ P-VALUE – "PHIÊN TÒA THỐNG KÊ" PHÂN XỬ GIỮA SỰ THẬT VÀ ĂN MAY

 

Ở bài viết trước, chúng ta đã đóng vai những thám tử dữ liệu, dùng Quy tắc 3 Sigma để lật tẩy vụ án "Lớp học thiên tài" với điểm trung bình cao bất thường (9.5 điểm). Tuy nhiên, trong cả pháp luật lẫn khoa học, chỉ có "sự nghi ngờ" là chưa đủ.

Luật sư bào chữa của lớp học - đại diện cho sự ngẫu nhiên - có thể đứng lên cãi rằng: "Thưa tòa, trên đời này chuyện quái gì cũng có thể xảy ra. Việc cả lớp đạt điểm cao chỉ là một sự trùng hợp hy hữu, một sự may mắn thuần túy!"

Để bác bỏ lời bào chữa này và đưa ra phán quyết cuối cùng, ngành thống kê không dùng cảm tính. Chúng ta mở một "Phiên tòa Thống kê" dựa trên hai công cụ quyền lực: Kiểm định giả thuyếtP-value.

1. Cáo trạng và Nguyên tắc suy đoán vô tội (H0 và H1)

Trước khi phiên tòa bắt đầu, bồi thẩm đoàn phải thiết lập hai phe đối lập rõ ràng. Trong thống kê, chúng được gọi là các Giả thuyết:

  • Giả thuyết Không (H0 - Null Hypothesis) – "Nguyên tắc suy đoán vô tội": Giả thuyết này luôn đứng về phía bị cáo (sự ngẫu nhiên). H0 tuyên bố: "Không có gì đặc biệt ở đây cả. Lớp học này hoàn toàn bình thường, và kết quả 9.5 kia hoàn toàn là do ăn may mà có."
  • Giả thuyết Đối (H1 - Alternative Hypothesis) – "Lời cáo buộc của Công tố viên": Đây là luận điểm của bạn: "Không thể có sự trùng hợp nào lớn như thế. Có điều bất thường đang xảy ra (gian lận hoặc lộ đề)."

Nhiệm vụ của phiên tòa thống kê là tìm kiếm bằng chứng để xem có thể bác bỏ lời tuyên bố vô tội (H0) của bị cáo hay không.

2. P-value: Độ tin cậy trong lời lời bào chữa của "Sự ăn may"

Để bảo vệ thân chủ của mình, luật sư "Ăn may" đưa ra một lý do: "Do hôm đó thời tiết đẹp, các em học sinh gặp may nên làm lụi cũng đúng hết!".

Lúc này, Thầy thẩm phán Thống kê sẽ tính toán một con số gọi là P-value (Probability value).

P-value là gì?  P-value chính là xác suất để sự ngẫu nhiên (H0) có thể tạo ra một kết quả kỳ lạ giống như thực tế (hoặc thậm chí còn kỳ lạ hơn), trong điều kiện thế giới đó hoàn toàn bình thường.

Hiểu một cách nôm na: P-value là thước đo mức độ "xạo" trong lời bào chữa của sự ngẫu nhiên.

  • P-value lớn (ví dụ p = 0.40): Lời bào chữa có tỷ lệ xảy ra tới 40%. Sự trùng hợp này rất dễ xảy ra trong thực tế. Tòa tuyên án: Không đủ bằng chứng kết tội, chấp nhận H0.
  • P-value cực nhỏ (ví dụ p = 0.0001): Lời bào chữa chỉ có 0.01% cơ hội thành sự thật. Giống như việc bạn bảo bạn trúng vé số độc đắc 3 ngày liên tiếp nhờ "may mắn". Lời bào chữa này quá vô lý! Tòa tuyên án: Bác bỏ H0, chấp nhận H1.

3. Ngưỡng mức ý nghĩa α = 0.05 – Ranh giới "Bằng chứng không thể chối cãi"

Trong luật pháp, để kết tội một ai đó, bằng chứng phải đạt mức "Vượt dải nghi ngờ hợp lý" (Beyond a reasonable doubt). Trong thống kê, các nhà khoa học quy ước một con số cụ thể gọi là Mức ý nghĩa α (Alpha), thường được chọn là 0.05 (tức 5%).

  • Nếu P-value < 0.05: Xác suất để kết quả này xảy ra do ăn may là ít hơn 5%. Tòa án thống kê coi đây là bằng chứng đanh thép. Chúng ta bác bỏ H0 (bác bỏ sự ngẫu nhiên) và tuyên bố kết quả này "có ý nghĩa thống kê" (Statistical Significance).
  • Quay lại vụ án điểm thi: Nếu ta tính ra P-value = 0.002 (0.2%), nhỏ hơn rất nhiều so với 0.05. Lời bào chữa "ăn may" bị bác bỏ hoàn toàn. Phiên tòa kết luận: Lớp học chắc chắn có gian lận!

4. Những sai lầm của Công lý (Sai lầm Loại I và Loại II)

Ngay cả những thẩm phán tối cao cũng có lúc phán quyết sai. Phiên tòa thống kê cũng vậy, chúng ta phải đối mặt với hai loại sai lầm chết người:

Loại sai lầm

Tên gọi

Bản chất trong tòa án

Bản chất trong thống kê

Hậu quả thực tế

Sai lầm Loại I

Dương tính giả

Xử OAN người vô tội.

Bác bỏ H0 trong khi H0 đúng.

Kết tội lớp học gian lận trong khi các em thực sự là thiên tài tự học.

Sai lầm Loại II

Âm tính giả

THẢ LỌT tội phạm.

Chấp nhận H0 trong khi H0 sai.

Kết luận lớp học bình thường trong khi họ thực sự có quay cóp.

Trong khoa học, Sai lầm Loại I được coi là nghiêm trọng nhất. Hãy tưởng tượng một công ty dược phẩm thử nghiệm thuốc mới.

  • Nếu họ mắc sai lầm Loại I: Họ tuyên bố thuốc có tác dụng (bác bỏ H0 - không có tác dụng) nhưng thực chất thuốc đó vô thưởng vô phạt. Bệnh nhân sẽ uống một loại thuốc không đảm bảo chất lượng. Đó là lý do vì sao ngưỡng α luôn phải siết rất chặt (5\% hoặc thậm chí là 1\%).

5. Lời kết: Thống kê – Nghệ thuật quản trị sự hoài nghi

Cuộc sống không có gì là tuyệt đối 100%. Thống kê sinh ra không phải để mang lại sự chắc chắn tuyệt đối, mà là để cho chúng ta biết mức độ rủi ro khi đưa ra một quyết định.

Khi bạn đọc báo thấy một nghiên cứu ghi: "A/B Testing chứng minh tính năng mới giúp tăng doanh thu với p < 0.05 ", bạn đã có thể mỉm cười hiểu rằng: Phiên tòa thống kê đã làm việc, họ đã bác bỏ sự may mắn, và bạn hoàn toàn có thể xuống tiền đầu tư dựa trên số liệu đó.

 

A - Z Sitemap

Đào tạo, nghiên cứu gắn liền với khoa học và công nghệ nhằm tạo ra những sinh viên và học viên có lòng yêu nước, có phẩm chất nhân văn mang đậm bản sắc Việt Nam, có ý thức sinh hoạt cộng đồng, có sức khỏe, có năng lực và kỹ năng toàn diện, tự tin, năng động, sáng tạo và trở thành công dân khởi nghiệp mang tính toàn cầu.