20รับ100 ยังรอการปฏิวัติ

20รับ100 ยังรอการปฏิวัติ

นี่คือความสนุกของสถิติ บัญชียอดนิยม

20รับ100 ของ David Salsburg เกี่ยวกับนักสถิติผู้ยิ่งใหญ่บางคนนั้นน่าอ่าน เต็มไปด้วยเกร็ดเล็กเกร็ดน้อยและข้อมูลส่วนบุคคลที่ไม่ธรรมดา เริ่มต้นในช่วงเปลี่ยนศตวรรษที่ผ่านมากับ Francis Galton, Karl Pearson, W. S. Gossett (‘นักศึกษา’ ของการทดสอบ t-test) และแน่นอน R. A. Fisher และยังคงดำเนินต่อไปด้วย Egon Pearson, Jerzy Neyman และ Florence Nightingale David

จนถึงตอนนี้ การดำเนินการทั้งหมดอยู่ที่ University College London และ Cambridge แต่หนังสือเล่มนี้ก็แพร่กระจายไปทั่วโลก มีเรื่องราวเกี่ยวกับชีวิตและผลงานของนักสถิติในศตวรรษที่ 20 หลายคน ตั้งแต่งานของ A. N. Kolmogorov เกี่ยวกับสัจธรรมของความน่าจะเป็น ผ่านงานของ I. J. Good เกี่ยวกับการเข้ารหัสที่ Bletchley Park และต่อมาด้วยวิธี Bayesian ไปจนถึงความสำเร็จมากมายของ John Tukey ไม่น้อย การแปลงฟูริเยร์อย่างรวดเร็ว ระหว่างทางมีคำอธิบายของความขัดแย้งที่ยิ่งใหญ่ (และยังไม่ได้รับการแก้ไข) ระหว่างนักสถิติเกี่ยวกับความน่าจะเป็นแบบผกผันและพื้นฐานของการอนุมานแบบอุปนัย

ชื่อหนังสืออ้างอิงถึงบทที่มีชื่อเสียงใน Fisher’s The Design of Experiments (1935) ในบทนี้ ฟิชเชอร์แสดงให้เห็นถึงหลักการของการออกแบบการทดลองโดยอภิปรายปัญหาสมมุติฐานของวิธีทดสอบข้ออ้างที่ว่าสามารถบอกได้ว่าชาถูกใส่ลงในถ้วยก่อนหรือหลังดื่มนม ความจริงข้อแรกที่ฉันค้นพบจากหนังสือเล่มนี้คือปัญหาไม่ได้เกิดขึ้นจากการสมมติทั้งหมด อิงจากเหตุการณ์จริงในงานเลี้ยงน้ำชาในเคมบริดจ์ในช่วงปลายทศวรรษ 1920 (ผู้เขียนรู้จักใครอยู่ที่นั่น)

ปริศนาทางสถิติ ชาเข้าถ้วยก่อนหรือหลังดื่มนม? เครดิต: BRIDGEMAN ART LIBRARY

หนังสือเล่มนี้เต็มไปด้วยเกร็ดเล็กเกร็ดน้อยส่วนตัว ทั้งน่าขบขันและบางครั้งก็บาดใจ (ต้องขอบคุณฮิตเลอร์และสตาลิน) ตัวอย่างเช่น ฉันค้นพบว่า I.J. Good ซึ่งทำงานมาเกือบทั้งชีวิตในสหรัฐฯ เป็นลูกชายของผู้อพยพชาวโปแลนด์ไปยังย่าน East End ของลอนดอน ซึ่งเป็นเจ้าของร้านขายเครื่องประดับโบราณที่มีชื่อเสียง (Cameo Corner) ใกล้กับ British Museum ( ฉันซื้อแหวนที่นั่น) อย่างไรก็ตาม ซาลส์บวร์กไม่ได้กล่าวถึงความชอบของฟลอเรนซ์ เดวิดสำหรับซิการ์ในสัดส่วนของเชอร์ชิลเลียน ฉันมักจะสงสัยว่าพวกเขาต้องสร้างความประทับใจอย่างไรเมื่อเธอย้ายไปแคลิฟอร์เนียในที่สุด วันนี้เธออาจจะถูกจับ

บัญชีของ Salsburg ไม่ใช่คณิตศาสตร์ทั้งหมด 

และเขาพยายามอย่างน่าเชื่อถือในการบรรยายด้วยวาจาของงานที่ยอดเยี่ยมบางอย่าง อย่างไรก็ตาม ความยากในการถ่ายทอดความคิดด้วยคำพูดก็กลับมาหาฉันด้วยจำนวนเล็กน้อยที่ฉันรู้สึกว่าเข้าใจในด้านที่ฉันไม่เคยรู้มาก่อน เช่น martingales (ฉันเชื่อว่าความหมายทางคณิตศาสตร์ของเขาแม่นยำกว่าคำจำกัดความทางทะเลของเขา ของคำนี้)

เมื่อพูดถึงวิทยาศาสตร์ในหนังสือ ซึ่งต่างจากประวัติศาสตร์และเกร็ดเล็กเกร็ดน้อย มุมมองของ Salsburg จะไม่ได้รับข้อตกลงที่เป็นสากล ประเด็นสำคัญเรื่องหนึ่งที่เกิดขึ้นซ้ำๆ ของเขาคือจักรวาลกลไกจักรกลแบบเก่าที่ถูกกำหนดไว้แล้วถูกกวาดล้างไปโดย “การปฏิวัติทางสถิติ … ‘สิ่งของ’ ของวิทยาศาสตร์ไม่ใช่สิ่งที่สังเกตได้ แต่เป็นฟังก์ชันการแจกแจงทางคณิตศาสตร์ที่อธิบายความน่าจะเป็นที่เกี่ยวข้องกับการสังเกต”

ปัญหาของฉันที่นี่คือ Salsburg ทำให้ความแตกต่างเพียงเล็กน้อยระหว่างความแปรปรวนที่หลีกเลี่ยงไม่ได้ซึ่งเป็นผลมาจากพฤติกรรมแบบสุ่มของอะตอม และความแปรปรวนที่หลีกเลี่ยงได้เนื่องจากข้อผิดพลาดในการสังเกต ในระดับโมเลกุล อะตอม และอนุภาคย่อย พฤติกรรมสุ่มเป็นส่วนหนึ่งของฟิสิกส์ของระบบ ในฟิสิกส์ย่อยของอะตอมและในสาขาช่องไอออนเดี่ยวของฉันเอง ค่อนข้างจริงที่สิ่งที่เราสังเกตเห็นคือการแจกแจง แต่อย่างไรก็ตาม เราสามารถพิจารณาวิธีการ (จริง) ของการแจกแจงดังกล่าวเป็นค่าคงที่ที่กำหนดได้ เราสามารถวัดระยะเวลาของอายุการใช้งานแบบสุ่มได้อย่างแม่นยำสูงเมื่อเทียบกับความแปรปรวนที่แท้จริงของระบบ

แต่สิ่งเหล่านี้เป็นงานวิจัยเฉพาะทาง ในพื้นที่ส่วนใหญ่ ความแปรปรวนจะไม่ค่อยเกิดขึ้นจากการจัดเรียงโมเลกุลเดี่ยวที่หลีกเลี่ยงไม่ได้นี้ คนส่วนใหญ่คิดว่ามันสมเหตุสมผลอย่างยิ่งที่เมื่อคุณวัด ตัวอย่างเช่น ค่าคงที่สมดุลสำหรับปฏิกิริยาที่กำหนดไว้อย่างดี มีค่าจริง แน่นอนว่าจะมีข้อผิดพลาดในการทดลองในการวัดค่านี้ แต่ปัญหาคือตัวกำหนดโดยพื้นฐานแล้ว

แม้ว่าแนวคิดทางสถิติจะมีความสำคัญในหลาย ๆ ด้าน แต่ฉันก็อดคิดไม่ได้ว่าซาลส์บวร์กพูดเกินจริงเมื่อเขาพูดถึงสถิติว่าเป็น “เครื่องมือที่สำคัญที่สุดเพียงอย่างเดียวของวิทยาศาสตร์ชีวภาพ” แล้วจีโนม กล้องจุลทรรศน์อิเล็กตรอน และตัวหนีบแพทช์ล่ะ? หากคุณอ่านบทความดีๆ ในพื้นที่ของฉันเอง เช่น Hodgkin และ Huxley ของ Bernard Katz หรือ Neher และ Sakmann คุณจะพบสถิติน้อยมาก (อย่างน้อยประเภทที่อ้างถึงข้อผิดพลาดในการวัด) และที่นั่น ก็ไม่มีความจำเป็นใดๆ ในด้านอื่นๆ เช่น การทดลองทางคลินิกและจิตวิทยา การใช้สถิติมีความสำคัญอย่างยิ่ง อย่างไรก็ตาม สิ่งหนึ่งที่เตือนเราถึงอันตรายของความกระตือรือร้นที่มากเกินไปสำหรับตัวเลข เมื่อผู้เขียนบอกเราอย่างไม่อายว่า “จิตวิทยาได้พัฒนาเทคนิคในการวัดความฉลาด 20รับ100