
Vì sao số liệu lũ lụt có thể khác nhau? Một góc nhìn thống kê khoa học
Thống kê thiên tai luôn là một trong những lĩnh vực khó nhất bởi yêu cầu vừa phải nhanh để phục vụ cứu hộ, vừa phải chính xác để phục vụ hoạch định chính sách. Khi xảy ra lũ lụt, chúng ta thường thấy hai nhóm số liệu rất khác nhau:
- Trên mạng xã hội: con số bị thổi lên rất cao.
- Trên báo chí: số liệu chính thức thấp và chậm hơn.
Từ đó phát sinh tranh cãi, hoài nghi hoặc cảm giác “số liệu sai giống giai đoạn COVID”.
Thực tế, nếu ai từng học môn Thống kê, Nhập môn Khoa học dữ liệu, Hệ thống thông tin quản lý, hay Phân tích rủi ro đều biết rằng sự khác biệt này là bình thường và không phải sai lệch, bởi thống kê hiện đại tuân theo các nguyên lý quốc tế.
Thống kê thiên tai luôn có hai giai đoạn số liệu
Số liệu sơ bộ (Preliminary Data)
- Thu thập trong 24–72 giờ đầu.
- Mục tiêu: phục vụ cứu hộ, không phải phục vụ tổng hợp quốc gia.
- Thường thiếu, trùng, hoặc chưa xác minh được.
Số liệu cuối cùng (Final Data)
Hoàn thành sau khi tổng hợp từ nhiều hệ thống: y tế, công an, địa phương, cơ sở hạ tầng. – Được kiểm chứng bằng phương pháp thống kê chuẩn (Sendai Framework, EM-DAT, IRDR). – Dùng để báo cáo quốc gia và quốc tế. Cơ chế hai lớp số liệu này không chỉ có ở Việt Nam. Mỹ, Nhật, EU đều làm như vậy. Ngay cả đại dịch COVID cũng sử dụng hai bộ số liệu: số ghi nhận hàng ngày và số đã chuẩn hóa vài năm sau.
Vì sao MXH và báo chí chênh lệch nhau?
Mạng xã hội dùng “ước tính cảm tính”
Người dân thấy hình ảnh, video, nghe tin mất tích nhiều nên suy luận: “chắc cả nghìn người chết”. Đây là hiệu ứng availability bias – não bộ đánh giá mức độ nghiêm trọng dựa trên hình ảnh gây sốc.
Báo chí chỉ sử dụng số đã xác minh
Báo chí bị ràng buộc bởi luật, không được đăng số “nghi ngờ”, chỉ đăng số do cơ quan chức năng xác nhận. Vì vậy số luôn chậm và thấp hơn.
Khác nhau trong định nghĩa “nạn nhân” Chuẩn thống kê quốc tế phân tách rõ:
- Chết (dead)
- Mất tích (missing)
- Bị ảnh hưởng (affected)
- Bị thương (injured)
MXH thường cộng tất cả lại → thành con số lớn. Báo chí chỉ đăng “chết” → con số nhỏ. Kết quả là chênh lệch lớn nhưng không có nghĩa là số nào sai—chỉ khác cách phân loại.
Số liệu thiên tai luôn thay đổi theo thời gian
Sau thiên tai, có nhiều yếu tố khiến số liệu cập nhật tăng hoặc giảm:
- Người mất tích được xác nhận sau vài tháng hoặc vài năm.
- Dữ liệu từ các xã/huyện gửi về bị trùng hoặc bị thiếu.
- Tổn thất kinh tế cần kiểm toán mới xác định được.
- Viện nghiên cứu độc lập và cơ quan quốc tế cần thêm thời gian để chuẩn hóa.
Quy trình này giống hệt cách WHO cập nhật tử vong COVID sau 2–3 năm, khi có đủ dữ liệu tử vong toàn cầu. Đây là nghiệp vụ thống kê, không phải che giấu hay né tránh.
Nếu ai đã học thống kê thì nguyên lý này rất rõ ràng
Trong giáo trình thống kê của hầu hết các trường đại học, có 3 nguyên tắc bất di bất dịch:
(1) Dữ liệu sơ cấp và thứ cấp luôn khác nhau Dữ liệu thu thập ban đầu chưa bao giờ trùng khớp hoàn toàn với dữ liệu đã qua kiểm định.
(2) Mọi cuộc điều tra đều có sai số mẫu và sai số phi mẫu Thiên tai lại là bối cảnh có sai số phi mẫu rất lớn.
(3) Không thể dùng dữ liệu cảm tính để suy ra số tuyệt đối
Đây là nguyên tắc cơ bản của thống kê ứng dụng. Ai học thống kê đều hiểu. Vậy câu hỏi đặt ra là: ⸻
Vậy tại sao nhiều người vẫn “không muốn hiểu”?
Tâm lý hoảng loạn trong thiên tai
Khi chứng kiến sự cố, con người luôn đánh giá rủi ro theo cảm xúc, không theo lý trí.
Hiệu ứng lan truyền của MXH
Tin sốc lan nhanh gấp 3–5 lần tin chính thống (theo Harvard Kennedy School). Càng sốc càng dễ tin.
Thiếu kiến thức nền tảng về thống kê
Nhiều người có học thống kê nhưng:
- Học theo kiểu lý thuyết khô cứng,
- Không hiểu ứng dụng trong thiên tai,
- Không hiểu rằng trong khủng hoảng dữ liệu luôn “bẩn”.
Nên tưởng thống kê phải “đúng ngay lập tức”, trong khi đó trái ngược với bản chất thống kê.
Niềm tin xã hội bị bào mòn từ quá khứ
Trải nghiệm thời COVID khiến nhiều người mặc định: “Cứ số thấp là che giấu.” Dù thực tế cơ chế cập nhật chậm là quy trình quốc tế.
Động cơ cảm xúc: muốn tin điều mình đã tin
Đây là chứng confirmation bias. Người ta thích thông tin hợp với cảm xúc cá nhân, và phủ nhận những gì ngược lại.