Phương pháp Chen-Stein: xấp xỉ phân phối Poisson
Phương pháp Chen–Stein cho xấp xỉ Poisson
1. Mở đầu
Vào cuối thập niên 1960, Charles Stein, không hài lòng với các chứng minh sẵn có của một định lý giới hạn trung tâm cụ thể, đã phát triển một cách tiếp cận mới để chứng minh định lý này trong quá trình chuẩn bị bài giảng thống kê của mình. Công trình mang tính tiên phong của ông được trình bày năm 1970 tại Hội nghị Berkeley lần thứ sáu về Thống kê Toán học và Xác suất, và sau đó được công bố trong kỷ yếu của hội nghị.
Sau này, nghiên cứu sinh tiến sĩ của ông là Louis Hsiao Yun Chen đã mở rộng phương pháp của Stein nhằm thu được các kết quả xấp xỉ cho phân phối Poisson. Do đó, việc áp dụng phương pháp Stein cho bài toán xấp xỉ Poisson thường được gọi là phương pháp Chen–Stein.
2. Ý tưởng của phương pháp Stein
Stein đưa ra một toán tử đặc trưng cho phân phối mục tiêu. Với phân phối Poisson có tham số $\lambda>0$, toán tử Stein $\mathcal{A}$ hoạt động trên các hàm $f:\mathbb{Z}_{\ge 0}\to\mathbb{R}$ theo công thức
$$\mathcal{A}f(k)=\lambda f(k+1)-k f(k).$$
Một phân phối $\mu$ trên $\mathbb{Z}_{\ge 0}$ là Poisson($\lambda$) khi và chỉ khi $\mathbb{E}_{X\sim\mu}[\mathcal{A}f(X)]=0$ cho mọi hàm đủ tốt $f$. Do đó, để đo khoảng cách giữa tích phân theo phân phối $\mathcal{L}(W)$ và Poisson($\lambda$), ta xem xét
$$\sup_{\mathcal{H}}\left|\mathbb{E}h(W)-\mathbb{E}h(Z)\right|=\sup_{\mathcal{H}}\left|\mathbb{E}\big[\mathcal{A}f_h(W)\big]\right|,$$
với $Z\sim\mathrm{Poisson}(\lambda)$ và $f_h$ là nghiệm (thường không duy nhất) của Stein equation
$$\lambda f(k+1)-k f(k)=h(k)-\mathbb{E}h(Z).$$
3. Áp dụng Chen–Stein: tổng các Bernoulli độc lập
Cho $X_1,\dots,X_n$ là các biến Bernoulli (không nhất thiết cùng tham số), với $p_i=\mathbb{P}(X_i=1)$ và $$W=\sum_{i=1}^n X_i,\qquad \lambda=\mathbb{E}W=\sum_{i=1}^n p_i.$$
Chen và sau đó là tiếp nối bởi nhiều tác giả cho ta các bất đẳng thức kiểu ràng buộc cho khoảng cách total variation:
$$d_{TV}(\mathcal{L}(W),\mathrm{Po}(\lambda))\le C(\lambda)\sum_{i=1}^n p_i^2,$$
với một hàm hằng số (hoặc phụ thuộc vào $\lambda$) $C(\lambda)$. Một dạng phổ biến trong sách vở là
$$d_{TV}(\mathcal{L}(W),\mathrm{Po}(\lambda))\le \min\{1,\,\tfrac{1}{\lambda}\}\sum_{i=1}^n p_i^2,$$
hoặc các hằng số sắc sảo hơn có thể xuất hiện khi xét phụ thuộc cục bộ giữa các biến Bernoulli.
Ghi chú: Các công thức chính xác khác với các hằng số tối ưu tùy thuộc vào giả thiết (độc lập, yếu phụ thuộc, cấu trúc "neighborhood"...), và có nhiều dạng ràng buộc trong văn học. Mục tiêu là cung cấp công thức hình thức và cách suy ra bằng Stein operator.
4. Phác thảo chứng minh (ý chính)
- Viết Stein equation cho một hàm test $h$; tìm nghiệm $f_h$ (có thể xây dựng bằng phương pháp tính dần/đệ quy).
- Viết $\mathbb{E}[\mathcal{A}f_h(W)]$ và tách thành các phần theo từng biến Bernoulli $X_i$ bằng cách dùng toán tử trao đổi (exchangeable pair) hoặc phương pháp tích phân theo từng phần rời rạc.
- Sử dụng ràng buộc trên các đạo hàm rời rạc (differences) của $f_h$ — tức là các điều khiển dạng $\|\Delta f_h\|$ và $\|\Delta^2 f_h\|$ — để liên hệ mỗi đóng góp với $p_i^2$ hoặc các đại lượng phụ thuộc cục bộ.
- Cộng dồn các đóng góp để thu được ràng buộc tổng quát cho $d_{TV}$.
5. Ví dụ: xấp xỉ Binomial bởi Poisson
Cho $W\sim\mathrm{Binomial}(n,p)$, ta có thể coi $W=\sum_{i=1}^n X_i$ với $p_i=p$ và $\lambda=np$. Khi $p$ nhỏ và $n$ lớn sao cho $\lambda$ cố định (thí dụ $p=\lambda/n$), thì
$$\sum_{i=1}^n p_i^2=n p^2=\frac{\lambda^2}{n},$$
và vì vậy vế phải tiến về $0$ khi $n\to\infty$. Đây là cơ sở cho xấp xỉ Poisson của Binomial trong giới hạn hiếm.
6. Mở rộng: phụ thuộc cục bộ
Chen–Stein rất mạnh vì nó mở rộng được sang trường hợp phụ thuộc cục bộ: nếu mỗi biến Bernoulli chỉ phụ thuộc vào một "neighborhood" nhỏ, thì mỗi đóng góp lỗi có thể được kiểm soát bởi các xác suất và cấu trúc phụ thuộc này. Kỹ thuật dùng các đại lượng như $\sum_i\sum_{j\in N(i)}\mathbb{E}(X_i)\mathbb{E}(X_j)$ hoặc các đại lượng tương đương.
Tài liệu tham khảo
- Phương pháp Stein (bài 1) — Duy Tân University.
- Phương pháp Stein (tiếp theo) — Duy Tân University.
- Barbour, A. D., Holst, L., & Janson, S. (1992). Poisson Approximation. Oxford University Press.
- Chen, L. H. Y. (1975). Poisson Approximation for Dependent Trials. The Annals of Probability, 3(3), 534–545.
- Arratia, R., Goldstein, L., & Gordon, L. (1989). Two Moments Suffice for Poisson Approximations. The Annals of Probability, 17(1), 9–25.
Bài viết liên quan
- Nghiên cứu ứng dụng phần mềm Minitab trong Phân phối nhị thức
- Màu cà rốt
- Một số vấn đề về mắt ở lứa tuổi 40 và cách khắc phục
- 🧮 GIẢI TÍCH – NỀN TẢNG CỦA TƯ DUY TOÁN HỌC HIỆN ĐẠI
- CÁC NGUYÊN TẮC SƯ PHẠM VÀ PHƯƠNG PHÁP DẠY HỌC CHỦ YẾU ĐƯỢC SỬ DỤNG TRONG GIẢNG DẠY CHẤT HỮU CƠ - PHẦN: HYDROCACBON NO (Tiếp theo phần trước)