star twitter facebook envelope linkedin youtube alert-red alert home left-quote chevron hamburger minus plus search triangle x

Phương pháp Chen-Stein: xấp xỉ phân phối Poisson

Phương pháp Chen–Stein cho xấp xỉ Poisson

1. Mở đầu

Vào cuối thập niên 1960, Charles Stein, không hài lòng với các chứng minh sẵn có của một định lý giới hạn trung tâm cụ thể, đã phát triển một cách tiếp cận mới để chứng minh định lý này trong quá trình chuẩn bị bài giảng thống kê của mình. Công trình mang tính tiên phong của ông được trình bày năm 1970 tại Hội nghị Berkeley lần thứ sáu về Thống kê Toán học và Xác suất, và sau đó được công bố trong kỷ yếu của hội nghị.

Sau này, nghiên cứu sinh tiến sĩ của ông là Louis Hsiao Yun Chen đã mở rộng phương pháp của Stein nhằm thu được các kết quả xấp xỉ cho phân phối Poisson. Do đó, việc áp dụng phương pháp Stein cho bài toán xấp xỉ Poisson thường được gọi là phương pháp Chen–Stein.

2. Ý tưởng của phương pháp Stein

Stein đưa ra một toán tử đặc trưng cho phân phối mục tiêu. Với phân phối Poisson có tham số $\lambda>0$, toán tử Stein $\mathcal{A}$ hoạt động trên các hàm $f:\mathbb{Z}_{\ge 0}\to\mathbb{R}$ theo công thức

$$\mathcal{A}f(k)=\lambda f(k+1)-k f(k).$$

Một phân phối $\mu$ trên $\mathbb{Z}_{\ge 0}$ là Poisson($\lambda$) khi và chỉ khi $\mathbb{E}_{X\sim\mu}[\mathcal{A}f(X)]=0$ cho mọi hàm đủ tốt $f$. Do đó, để đo khoảng cách giữa tích phân theo phân phối $\mathcal{L}(W)$ và Poisson($\lambda$), ta xem xét

$$\sup_{\mathcal{H}}\left|\mathbb{E}h(W)-\mathbb{E}h(Z)\right|=\sup_{\mathcal{H}}\left|\mathbb{E}\big[\mathcal{A}f_h(W)\big]\right|,$$

với $Z\sim\mathrm{Poisson}(\lambda)$ và $f_h$ là nghiệm (thường không duy nhất) của Stein equation

$$\lambda f(k+1)-k f(k)=h(k)-\mathbb{E}h(Z).$$

3. Áp dụng Chen–Stein: tổng các Bernoulli độc lập

Cho $X_1,\dots,X_n$ là các biến Bernoulli (không nhất thiết cùng tham số), với $p_i=\mathbb{P}(X_i=1)$ và $$W=\sum_{i=1}^n X_i,\qquad \lambda=\mathbb{E}W=\sum_{i=1}^n p_i.$$

Chen và sau đó là tiếp nối bởi nhiều tác giả cho ta các bất đẳng thức kiểu ràng buộc cho khoảng cách total variation:

$$d_{TV}(\mathcal{L}(W),\mathrm{Po}(\lambda))\le C(\lambda)\sum_{i=1}^n p_i^2,$$

với một hàm hằng số (hoặc phụ thuộc vào $\lambda$) $C(\lambda)$. Một dạng phổ biến trong sách vở là

$$d_{TV}(\mathcal{L}(W),\mathrm{Po}(\lambda))\le \min\{1,\,\tfrac{1}{\lambda}\}\sum_{i=1}^n p_i^2,$$

hoặc các hằng số sắc sảo hơn có thể xuất hiện khi xét phụ thuộc cục bộ giữa các biến Bernoulli.

Ghi chú: Các công thức chính xác khác với các hằng số tối ưu tùy thuộc vào giả thiết (độc lập, yếu phụ thuộc, cấu trúc "neighborhood"...), và có nhiều dạng ràng buộc trong văn học. Mục tiêu là cung cấp công thức hình thức và cách suy ra bằng Stein operator.

4. Phác thảo chứng minh (ý chính)

  1. Viết Stein equation cho một hàm test $h$; tìm nghiệm $f_h$ (có thể xây dựng bằng phương pháp tính dần/đệ quy).
  2. Viết $\mathbb{E}[\mathcal{A}f_h(W)]$ và tách thành các phần theo từng biến Bernoulli $X_i$ bằng cách dùng toán tử trao đổi (exchangeable pair) hoặc phương pháp tích phân theo từng phần rời rạc.
  3. Sử dụng ràng buộc trên các đạo hàm rời rạc (differences) của $f_h$ — tức là các điều khiển dạng $\|\Delta f_h\|$ và $\|\Delta^2 f_h\|$ — để liên hệ mỗi đóng góp với $p_i^2$ hoặc các đại lượng phụ thuộc cục bộ.
  4. Cộng dồn các đóng góp để thu được ràng buộc tổng quát cho $d_{TV}$.

5. Ví dụ: xấp xỉ Binomial bởi Poisson

Cho $W\sim\mathrm{Binomial}(n,p)$, ta có thể coi $W=\sum_{i=1}^n X_i$ với $p_i=p$ và $\lambda=np$. Khi $p$ nhỏ và $n$ lớn sao cho $\lambda$ cố định (thí dụ $p=\lambda/n$), thì

$$\sum_{i=1}^n p_i^2=n p^2=\frac{\lambda^2}{n},$$

và vì vậy vế phải tiến về $0$ khi $n\to\infty$. Đây là cơ sở cho xấp xỉ Poisson của Binomial trong giới hạn hiếm.

6. Mở rộng: phụ thuộc cục bộ

Chen–Stein rất mạnh vì nó mở rộng được sang trường hợp phụ thuộc cục bộ: nếu mỗi biến Bernoulli chỉ phụ thuộc vào một "neighborhood" nhỏ, thì mỗi đóng góp lỗi có thể được kiểm soát bởi các xác suất và cấu trúc phụ thuộc này. Kỹ thuật dùng các đại lượng như $\sum_i\sum_{j\in N(i)}\mathbb{E}(X_i)\mathbb{E}(X_j)$ hoặc các đại lượng tương đương.

Tài liệu tham khảo

  1. Phương pháp Stein (bài 1) — Duy Tân University.
  2. Phương pháp Stein (tiếp theo) — Duy Tân University.
  3. Barbour, A. D., Holst, L., & Janson, S. (1992). Poisson Approximation. Oxford University Press.
  4. Chen, L. H. Y. (1975). Poisson Approximation for Dependent Trials. The Annals of Probability, 3(3), 534–545.
  5. Arratia, R., Goldstein, L., & Gordon, L. (1989). Two Moments Suffice for Poisson Approximations. The Annals of Probability, 17(1), 9–25.
A - Z Sitemap

Đào tạo, nghiên cứu gắn liền với khoa học và công nghệ nhằm tạo ra những sinh viên và học viên có lòng yêu nước, có phẩm chất nhân văn mang đậm bản sắc Việt Nam, có ý thức sinh hoạt cộng đồng, có sức khỏe, có năng lực và kỹ năng toàn diện, tự tin, năng động, sáng tạo và trở thành công dân khởi nghiệp mang tính toàn cầu.