Tổ chức dữ liệu trong thống kê
TỔ CHỨC DỮ LIỆU
Khi tiến hành nghiên cứu thống kê, nhà nghiên cứu phải thu thập dữ liệu cho một biến cụ thể đang được nghiên cứu. Ví dụ, nếu một nhà nghiên cứu muốn nghiên cứu số người bị rắn cắn ở một khu vực địa lý cụ thể trong vài năm gần đây, họ phải thu thập dữ liệu từ các bác sĩ, bệnh viện hoặc các sở y tế khác nhau.
Để mô tả tình huống, rút ra kết luận, hoặc suy luận về sự kiện, nhà nghiên cứu phải tổ chức dữ liệu một cách có ý nghĩa. Cách thức thuận tiện nhất để tổ chức dữ liệu là xây dựng một phân bố tần số. Sau khi tổ chức dữ liệu, nhà nghiên cứu phải trình bày cho người đọc có thể rút ra một số thông tin từ thị giác từ những sự kiện có vẻ như phức tạp, hỗn độn. Phương pháp hữu ích nhất để trình bày dữ liệu là xây dựng biểu đồ và đồ thị thống kê. Có rất nhiều loại biểu đồ và đồ thị khác nhau và mỗi loại có một mục đích cụ thể.
Chương này giải thích làm thế nào để tổ chức dữ liệu bằng cách xây dựng phân phối tần số và làm thế nào để trình bày dữ liệu bằng cách xây dựng biểu đồ và đồ thị. Các biểu đồ và biểu đồ được minh họa ở đây là nhật đồ, đa giác tần số, biểu đồ hình cung, biểu đồ hình tròn, biểu đồ Pareto và biểu đồ chuỗi thời gian. Một biểu đồ kết hợp các đặc điểm của một phân bố tần số và nhật đồ được gọi là biểu đồ thân và lá.