Câu chuyện chung quanh bài báo mới đây của ông Angus Deaton (Giải Nobel Kinh tế học 2015) là một minh chứng cho cái mà tôi hay gọi nôm na là “văn hoá bộ lạc” (tribal culture) trong khoa học. Cho dù anh có giải Nobel, nhưng chưa chắc anh được bộ lạc khác công nhận và ghi nhận. Khoa học đánh giá trên giá trị khoa học, chứ không phải giải thưởng.
Câu chuyện bắt đầu từ một phân tích về tỉ lệ tử vong ở những người Mĩ trong độ tuổi trung niên. Qua phân tích dữ liệu của Cục thống kê Mĩ, Deaton và đồng nghiệp là Anne Case phát hiện rằng tỉ lệ tử vong ở nam và nữ trong độ tuổi 45-54 có học vấn dưới bậc đại học tăng rất nhanh trong thời gian 1999 và 2013. Sự thật đó nó nằm trong dữ liệu, nhưng chẳng ai chú ý, chẳng ai quan tâm! Deaton và Case nghĩ rằng họ đã có một phát hiện rất quan trọng cho y tế Mĩ, vì hai người nghĩ rằng tình trạng dùng ma tuý & á phiện tràn lan, lạm dụng rượu bia, và tự tử là nguyên nhân của xu hướng trên.
Họ nghĩ thế, nhưng chưa chắc dân y khoa nghĩ thế. Họ nộp bản thảo bài báo cho tập san JAMA (thuộc hàng danh giá số 1 trong y khoa), và bị trả lại chỉ trong vòng vài giờ. Ông Deaton cho biết việc từ chối giống như là email gửi sai địa chỉ và bị trả về ngay. Không có giải thích lí do từ chối bài báo. Hai tác giả sửa lại bản thảo và giảm xuống còn 2 trang, rồi gửi cho tập san New England Journal of Medicine (NEJM), một tập san còn danh giá hơn cả JAMA. Nhưng một lần nữa, NEJM cũng trả lại bản thảo.
NEJM có vẻ lịch sự hơn JAMA, vì họ có gửi bài báo ra cho các chuyên gia bình duyệt. Ý kiến của các chuyên gia và NEJM là họ không thấy thuyết phục về phương pháp cũng như cách diễn giải kết quả. Họ đòi hỏi tác giả phải giải thích tại sao có kết quả đó (tăng tử vong ở giới trung niên ít học). Ông Deaton bực mình ví von việc họ đòi ông giải thích như là việc nhân viên cứu hoả hỏi nhà ông bị cháy vì nguyên nhân nào! Ông so sánh việc từ chối như là nhà chúng ta đang bị cháy, chúng ta gọi xe cứu hoả đến giúp, và nhân viên cứu hoả hỏi tại sao nhà bị cháy, nếu không nói nguyên nhân họ không gửi xe cứu hoả đến giúp! Deaton cho biết theo ước tính của ông, có gần 500,000 người chết oan, tương đương với con số tử vong vì HIV/AIDS vậy mà họ khoanh tay ngồi đó và hỏi nguyên nhân.
Sau cùng thì cũng có kết quả có hậu. Deaton và Case gửi bản thảo cho PNAS, tập san ít danh giá hơn và ngoài thế giới y khoa. Bài báo được chấp nhận và cho công bố vào tuần này. Sau khi bài báo được công bố, ông Deaton mới tiết lộ những chi tiết mang tính hậu trường của thân phận của bài báo.
Những thông tin hậu trường đó, như tôi nói, phản ảnh cái văn hoá bộ lạc trong khoa học rất rõ nét. Ông Deaton là dân kinh tế học, vốn thường được xem là khoa học xã hội, là “khoa học mềm” (soft science), vì phương tiện đo lường khá thô sơ, chủ yếu dựa vào dữ liệu thứ cấp là chính. Còn y sinh học, vật lí, hoá học thường được xem là “khoa học cứng” (hard science), vì phương pháp đo lường tinh vi, chính xác, và phải cần đến thí nghiệm có thiết kế hẳn hoi. Chính vì cách phân định đó, nên giới kinh tế học cho dù có ý tưởng hay về y tế, vẫn khó có thể xuất hiện trong thế giới y khoa.
Đọc bài báo của Deaton và Case, tôi phải nói là khá đơn giản. Họ chẳng làm nghiên cứu hay thí nghiệm gì cả; tất cả họ có là lấy dữ liệu từ các cơ quan của Nhà nước. Sau đó, họ làm những phân tích mô tả, và đi đến phát hiện trên. Để giải thích cho xu hướng gia tăng tỉ lệ tử vong ở những người trung niên da trắng ít học, hai tác giả thu thập thêm dữ liệu về tự tử, sức khoẻ tâm thần, tiêu thụ rượu bia, v.v. qua các năm. Trong khoa học, những dữ liệu này gọi là “aggregated data”, tức là những dữ liệu đã được “đóng gói”, chứ không phải dữ liệu ở mức cá nhân. Khi hai dữ liệu aggregated nhập lại, thì các tác giả có thể phân tích tương quan, nhưng đó là “ecologic correlation” (tương quan ở mức quần thể), chứ không phải ở mức cá nhân. Do đó, dữ liệu của họ chẳng có giá trị khoa học cao. Nếu tôi là biên tập của JAMA tôi vẫn từ chối bài báo như thường.
Những dữ liệu aggregated nó có thể có ích cho chính sách công, nhưng ít khi nào có ích cho khoa học. Để biết mối tương quan giữa bia rượu và tử vong, một cách lí tưởng, người ta phải thu thập dữ liệu về tiêu thụ rượu bia (và nhiều dữ liệu khác) từng cá nhân theo thời gian cho đến ngày chết. Những dữ liệu khác cho phép chúng ta loại bỏ các yếu tố nhiễu. Đó là dữ liệu ở cấp độ cá nhân – individual data. Dữ liệu này (cấp độ cá nhân) có giá trị hơn là dữ liệu aggregated, vì nó cho phép chúng ta xem xét trực tiếp các mối liên quan, chứ không phải gián tiếp.
Nhiều nhà kinh tế không nhận ra sự khác biệt về cấp độ dữ liệu, nên có khi họ đánh giá không đúng giá trị của dữ liệu. Có nhiều dữ liệu (kiểu như Big Data) không có nghĩa là chất lượng tốt, vì đâu thể kiểm soát các yếu tố nhiễu. Ngoài ra, dữ liệu aggregated thì chỉ có thể làm ecologic correlation (tương quan quần thể), và loại tương quan này thì có rất nhiều vấn đề và không cho phép suy luận về nguyên nhân – hệ quả được. Trước đây, có phân tích cho thấy lượng chocolate tiêu thụ có tương quan với số giải Nobel, và kết quả này đã và đang trở thành một trường hợp kinh điển về hiểu sai khái niệm tương quan.
====
Comment của Thanh Tran:
Năm 1993 có một bài báo được đăng trên Nature tìm ra mối tương quan giữa nghe nhạc giao hưởng và kết quả học tập của trẻ em, gọi là Mozart Effect. GS Rauscher et al. chỉ ra rằng trẻ em được cho nghe nhạc giao hưởng làm bài kiểm tra IQ tốt hơn. Kết quả này thành công đến nỗi nó đã trở thành một trào lưu kéo dài cho đến bây giờ. Năm 1999 thống đốc bang Georgia chi ngân sách mỗi năm hơn 100000 $ để phát miễn phí đĩa CD nhạc giao hưởng cho trẻ em trong bang. Đâu đó ở Hà Nội người ta bán phở với giá cắt cổ vì miếng thịt đến từ con bò được chăn nuôi bằng cách cho nghe nhạc giao hưởng (thịt bò Kobe). Tuy nhiên, vài năm sau bài báo Nature đó hàng loạt bài báo, nghiên cứu, meta study chỉ ra rằng Mozart effect là không có cơ sở, khi một biến có vẻ như hiển nhiên là thu nhập của bố mẹ (hay class của bố mẹ) ảnh hưởng đến cả 2 biến nghe nhạc giao hưởng và kết quả học tập của trẻ em trên. GS Rauscher tiếp tục chống lại dư luận và thậm chí năm 2006 xuất bản một bài báo công bố Mozart effect lên loài chuột. Có vẻ như khập khiễng nếu so sánh sự hữu dụng của việc thí nghiệm cho chuột nghe nhạc và việc phát hiện ra số lượng người chết gia tăng đột biến của một nhóm người trong một quốc gia.
Về chuyện của GS Deaton, em không hiểu sao 2 giáo sư này lại gửi bài cho các tập san về y khoa. Không lẽ họ muốn nói rằng họ tìm ra symptom/correlation từ data và muốn raise awareness, hy vọng giới y khoa tiếp tục nghiên cứu để tìm causation thực sự? Việc họ bị trả lại bài báo là đương nhiên, vì như thầy nói mỗi bộ lạc có phương pháp tiếp cận vấn đề khác nhau. Việc so sánh phương pháp tiếp cận giữa các bộ lạc khác nhau có vẻ không đồng nhất, mặc dù thú vị. Ngay cả p value áp vào các ngành khác nhau để đo significant level cùng một tiêu chuẩn cũng là vấn đề bàn luận. Thí nghiệm trong kinh tế học (vĩ mô) hay xã hội học là gần như không thể, nếu có thể thì cũng rất tốn kém và ảnh hưởng nhiều đến vấn đề đạo đức. Kinh tế học vi mô có hẳn một trường phái chuyên làm thí nghiệm là exprimental economics, chủ yếu là về behavioral science, dính dáng đến tâm lý học, game theory.. Tuy nhiên, việc so sánh này như thầy làm là cần thiết vì nó cho thấy cái nhìn rộng hơn so với việc một ngành khoa học bị bó hẹp trong chính cái nhìn của mình, tránh những bi hài kịch như Mozart effect.
Về chuyện của GS Deaton, em không hiểu sao 2 giáo sư này lại gửi bài cho các tập san về y khoa. Không lẽ họ muốn nói rằng họ tìm ra symptom/correlation từ data và muốn raise awareness, hy vọng giới y khoa tiếp tục nghiên cứu để tìm causation thực sự? Việc họ bị trả lại bài báo là đương nhiên, vì như thầy nói mỗi bộ lạc có phương pháp tiếp cận vấn đề khác nhau. Việc so sánh phương pháp tiếp cận giữa các bộ lạc khác nhau có vẻ không đồng nhất, mặc dù thú vị. Ngay cả p value áp vào các ngành khác nhau để đo significant level cùng một tiêu chuẩn cũng là vấn đề bàn luận. Thí nghiệm trong kinh tế học (vĩ mô) hay xã hội học là gần như không thể, nếu có thể thì cũng rất tốn kém và ảnh hưởng nhiều đến vấn đề đạo đức. Kinh tế học vi mô có hẳn một trường phái chuyên làm thí nghiệm là exprimental economics, chủ yếu là về behavioral science, dính dáng đến tâm lý học, game theory.. Tuy nhiên, việc so sánh này như thầy làm là cần thiết vì nó cho thấy cái nhìn rộng hơn so với việc một ngành khoa học bị bó hẹp trong chính cái nhìn của mình, tránh những bi hài kịch như Mozart effect.
0 nhận xét:
Post a Comment