สวัสดีครับเพื่อนๆ ทุกคน! ในโลกที่เต็มไปด้วยความไม่แน่นอน ไม่ว่าจะเป็นเรื่องชีวิต การตัดสินใจทางธุรกิจ หรือการสร้างโมเดลเทรดสำหรับสาย Quant ทักษะอย่างหนึ่งที่ถือเป็น "เสาหลัก" เลยก็คือเรื่อง ความน่าจะเป็น (Probability Fundamentals) ครับ
แต่สิ่งที่น่าสนใจคือ แม้ว่าคณิตศาสตร์จะพิสูจน์หาคำตอบที่ถูกต้องได้ แต่สมองของมนุษย์เรากลับไม่ได้ถูกออกแบบมาให้เข้าใจสถิติโดยธรรมชาติเลย วันนี้เราจะมาเจาะลึกตั้งแต่ทฤษฎีพื้นฐานอย่าง Conditional Probability และ Bayes' Theorem ไปจนถึงเรื่องราวสุดคลาสสิกของสองนักจิตวิทยา Daniel Kahneman และ Amos Tversky ที่จะมาเฉลยให้เห็นกันชัดๆ ว่า สมองของเราหลอกตาและประเมินความน่าจะเป็นผิดพลาดไปได้อย่างไรครับ!
ปูพื้นฐานและทำความเข้าใจ Conditional Probability
Conditional Probability (ความน่าจะเป็นแบบมีเงื่อนไข) คือ โอกาสที่จะเกิดเหตุการณ์หนึ่ง (Event B) เมื่อเราแน่ใจแล้วว่าอีกเหตุการณ์หนึ่ง (Event A) ได้เกิดขึ้นจริงก่อนหน้า โดยเขียนแทนด้วยสัญลักษณ์ P(B|A).
ในวิชาสถิติแบบดั้งเดิม ความน่าจะเป็นทั่วไป เช่น โอกาสที่ฝนจะตก หรือโอกาสที่เหรียญจะออกหัว จะเป็นการมองจากภาพรวมใหญ่ๆ แต่ในชีวิตจริง เรามักจะมี "ข้อมูลอ้างอิง" เข้ามาช่วยจำกัดขอบเขตเสมอ เช่น "โอกาสที่ฝนจะตก ถ้าวันนี้มีเมฆครึ้ม" หรือ "โอกาสที่หุ้นจะขึ้น ถ้ามีข่าวประกาศลดอัตราดอกเบี้ย" ซึ่งนี่คือแนวคิดของ Conditional Probability ครับ
โดยสูตรทางคณิตศาสตร์ในการหาความน่าจะเป็นแบบมีเงื่อนไข เขียนได้ดังนี้ครับ:
$$P(B|A) = \frac{P(B \cap A)}{P(A)}$$
เพื่อให้เห็นภาพง่ายที่สุด ลองจินตนาการถึงการทอยลูกเต๋า 1 ลูก:
- ปกติแล้ว โอกาสที่จะได้แต้ม 6 คือ $P(แต้ม 6) = 1/6$
- แต่หากเราได้ข้อมูลเสริมมาว่า ลูกเต๋าที่ทอยออกมาได้ แต้มคู่ แน่นอน (Event A เกิดขึ้นแล้ว) โอกาสที่จะได้แต้ม 6 จะเปลี่ยนไปทันที เพราะตัวเลือกทั้งหมดเหลือแค่ {2, 4, 6} ดังนั้น $P(แต้ม 6 | แต้มคู่) = 1/3$

เมื่อเราจำกัดขอบเขตของ Sample Space ลงด้วยเงื่อนไขใหม่ ความแม่นยำในการวิเคราะห์ข้อมูลก็จะเพิ่มสูงขึ้นอย่างมากครับ
ทฤษฎีเปลี่ยนโลก: Bayes' Theorem
Bayes' Theorem คือ ทฤษฎีที่ใช้ในการปรับปรุงระดับความน่าเชื่อถือหรือความน่าจะเป็นของสมมติฐานเดิม (Prior) เมื่อมีข้อมูลหรือหลักฐานใหม่ (Evidence) เข้ามาเพิ่มเติม.
ทฤษฎีนี้ถูกคิดค้นโดย Thomas Bayes นักคณิตศาสตร์ชาวอังกฤษ และกลายมาเป็นรากฐานสำคัญของระบบ Machine Learning รวมถึงระบบประเมินความเสี่ยงต่างๆ โดยสูตรของ Bayes' Theorem เขียนดังนี้ครับ:
$$P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}$$
เพื่อให้เพื่อนๆ เข้าใจง่ายขึ้น เรามาจำแนกแต่ละตัวแปรในสูตรออกมากันครับ:
| ตัวแปร | ชื่อเรียกอย่างเป็นทางการ | อธิบายแบบเข้าใจง่าย |
|---|---|---|
| P(A|B) | Posterior Probability | ความน่าจะเป็นของเหตุการณ์ A หลังจากที่เราเห็นหลักฐาน B แล้ว (สิ่งที่เราอยากรู้) |
| P(B|A) | Likelihood | โอกาสที่เราจะพบหลักฐาน B ในกรณีที่สมมติฐาน A เป็นความจริง |
| P(A) | Prior Probability | ความน่าจะเป็นเริ่มต้นของเหตุการณ์ A ก่อนที่จะมีข้อมูลหรือหลักฐานใหม่เข้ามา |
| P(B) | Evidence | โอกาสทั้งหมดที่จะเกิดหลักฐาน B ขึ้น ไม่ว่าสมมติฐาน A จะจริงหรือไม่ก็ตาม |

ลองคำนวณจริง: การวินิจฉัยโรคทางการแพทย์ (Medical Diagnostic)
สมมติว่าเกิดโรคร้ายแรงชนิดหนึ่งขึ้นในเมือง ซึ่งสถิติบอกว่ามีคนเป็นโรคนี้น้อยมากเพียงแค่ 1% ของประชากร ($P(Disease) = 0.01$) หากคุณไปตรวจหาโรคนี้ด้วยชุดตรวจที่มีความแม่นยำสูงถึง 90% (หมายความว่าถ้าเป็นโรค ผลตรวจจะเป็นบวก 90% และถ้าไม่เป็นโรค ผลตรวจจะเป็นลบ 95% หรือมีโอกาสที่คนไม่เป็นโรคแต่ตรวจเจอผลบวกหลอกๆ 5%)
คำถามคือ: ถ้าผลตรวจของคุณออกมาเป็นบวก (+) โอกาสที่คุณจะเป็นโรคนี้จริงๆ มีกี่เปอร์เซ็นต์?
คนทั่วไปมักตอบว่า "90% แน่นอน" แต่ถ้าใช้ Bayes' Theorem คำนวณ:
- Prior $P(Disease)$ = 0.01 (1%)
- Likelihood $P(+|Disease)$ = 0.90 (90%)
- Evidence $P(+)$ = โอกาสที่ผลบวกจะเกิดขึ้นทั้งหมด (เป็นโรคแล้วตรวจเจอ + ไม่เป็นโรคแล้วตรวจผิดว่าเจอ) $$P(+) = (0.90 \times 0.01) + (0.05 \times 0.99) = 0.009 + 0.0495 = 0.0585$$
- คำนวณหา Posterior $P(Disease|+)$: $$P(Disease|+) = \frac{0.90 \times 0.01}{0.0585} = \frac{0.009}{0.0585} \approx 15.38%$$
ผลลัพธ์คือ คุณมีโอกาสเป็นโรคนั้นจริงเพียงแค่ 15.38% เท่านั้นเองครับ! ซึ่งต่างจาก 90% ที่เราเดาในตอนแรกอย่างมหาศาล นั่นเป็นเพราะจำนวนคนที่ไม่เป็นโรค (99%) มันเยอะมาก จนทำให้ปริมาณผลตรวจบวกปลอม (False Positive) ข่มผลตรวจจริงไปเสียหมดครับ
การประยุกต์ใช้ Bayes' Theorem ในระบบเทรด (Quant Trading)
ในโลกของ Algorithmic Trading นักเทรดสาย Quant มักจะนำทฤษฎี Bayes มาใช้ในการจำแนกสภาวะตลาด (Market Regime Identification) เพื่อปรับกลยุทธ์ให้เหมาะสมกับสภาพตลาดปัจจุบัน.
สภาวะตลาดการเงินมีการเปลี่ยนแปลงอยู่ตลอดเวลา เช่น จากสภาวะตลาดมีเทรนด์ (Trend Regime) ไปสู่สภาวะตลาดออกข้างไร้เทรนด์ (Mean-Reversion Regime) การนำกฎของ Bayes มาใช้ช่วยให้เราสามารถคำนวณ "ความน่าจะเป็นที่แท้จริง" ของสภาวะตลาดหลังจากเห็นสัญญาณเทคนิคอลได้
ตัวอย่าง: การตรวจจับตลาดขาขึ้น (Bull Market Regime)
สมมติว่าเราพึ่งได้สัญญาณซื้อจากโมเดลคณิตศาสตร์ตัวหนึ่ง (Momentum Signal) เราต้องการรู้ว่า โอกาสที่สภาวะตลาดตอนนั้นจะเป็นตลาดขาขึ้นจริง (Bull Market) มีอยู่เท่าใด?
จากการเก็บข้อมูลทางสถิติในอดีต (Backtest) เราพบความจริงดังนี้:
- Prior $P(Bull)$ = 0.40 (โอกาสปกติที่สภาวะตลาดจะเป็นตลาดขาขึ้นมี 40%)
- Prior $P(Bear)$ = 0.60 (โอกาสที่ตลาดจะเป็นขาลงหรือออกข้างมี 60%)
- Likelihood $P(+|Bull)$ = 0.80 (ถ้าตลาดเป็นขาขึ้นจริง โมเดลจะส่งสัญญาณซื้อ (+) ถูกต้อง 80%)
- False Positive $P(+|Bear)$ = 0.30 (ถ้าตลาดไม่ใช่ขาขึ้น โมเดลส่งสัญญาณซื้อหลอกๆ (+) อยู่ที่ 30%)
เมื่อนำสถิติเหล่านี้มาคำนวณหาความน่าจะเป็นหลังได้รับสัญญาณซื้อล่าสุด ($P(Bull | +)$):
- หาผลรวมโอกาสส่งสัญญาณซื้อทั้งหมด $P(+)$: $$P(+) = (0.80 \times 0.40) + (0.30 \times 0.60) = 0.32 + 0.18 = 0.50$$
- คำนวณหา $P(Bull | +)$: $$P(Bull | +) = \frac{0.80 \times 0.40}{0.50} = \frac{0.32}{0.50} = 64%$$
ผลลัพธ์คือ แม้สัญญาณซื้อจะดูแม่นยำสูงถึง 80% แต่เมื่อตลาดรวมมีโอกาสเกิดขาขึ้นเพียง 40% โอกาสที่สัญญาณซื้อนี้จะเป็นตลาดขาขึ้นจริงจึงเหลือเพียง 64% เท่านั้น! บอทเทรด Quant สามารถนำตัวเลข 64% นี้ไปปรับขนาดสัญญา (Position Sizing) หรือเปิด/ปิดฟังก์ชันการเทรดแบบตามเทรนได้โดยอัตโนมัติครับ
โค้ดตัวอย่าง Python: การคำนวณความน่าจะเป็นของสภาวะตลาดด้วย Bayes
เรามาดูโค้ด Python สั้นๆ ที่บอทเทรดจริงสามารถนำไปปรับใช้ในการอัปเดตสภาวะตลาดแบบไดนามิกได้เลยครับ:
def calculate_market_regime_prob(prior_bull, likelihood_correct, false_positive):
"""
คำนวณความน่าจะเป็นที่ตลาดจะเป็นขาขึ้นจริง หลังจากเกิดสัญญาณบวก
"""
prior_bear = 1.0 - prior_bull
# 1. คำนวณหาโอกาสที่จะเกิดสัญญาณบวกทั้งหมด (Total Evidence)
prob_signal = (likelihood_correct * prior_bull) + (false_positive * prior_bear)
# 2. ใช้กฎของ Bayes หา Posterior Probability
posterior_bull = (likelihood_correct * prior_bull) / prob_signal
return posterior_bull
# กำหนดสถิติตั้งต้น
prior_bull_market = 0.40
signal_accuracy = 0.80
signal_false_positive = 0.30
posterior = calculate_market_regime_prob(prior_bull_market, signal_accuracy, signal_false_positive)
print(f"ความน่าจะเป็นเริ่มต้น (Prior): {prior_bull_market * 100:.2f}%")
print(f"ความน่าจะเป็นหลังเจอสัญญาณซื้อ (Posterior): {posterior * 100:.2f}%")
การประยุกต์ใช้เช่นนี้ ช่วยให้ระบบเทรดทำงานแบบมีตรรกะรองรับ หลีกเลี่ยงสัญญาณหลอก (Whipsaw) และบริหารความเสี่ยงได้อย่างมืออาชีพครับ
ทำไมคนเราถึงมองพลาด? ทฤษฎีอคติของ Kahneman & Tversky
Daniel Kahneman (ผู้เขียนหนังสือ Thinking, Fast and Slow) และ Amos Tversky ได้เสนอว่า สมองของมนุษย์เราไม่ได้ใช้กฎของ Bayes ในการประเมินชีวิตประจำวัน แต่ใช้กฎลัดทางความคิด (Heuristics) ซึ่งมักนำไปสู่ความเข้าใจผิดที่เป็นระบบ (Cognitive Biases).
มีตัวอย่างงานวิจัยที่โด่งดัง 2 ตัวอย่างที่ช่วยสะท้อนให้เห็นว่ามนุษย์เราวิเคราะห์สถิติความน่าจะเป็นได้ขัดแย้งกับความเป็นจริงขนาดไหนครับ:
1. การทดลอง "Linda Problem" (สะท้อนอคติ Conjunction Fallacy)
Kahneman และ Tversky ได้อธิบายลักษณะของตัวละครสมมติชื่อ "ลินดา" ให้ผู้ร่วมการทดลองฟังดังนี้:
ลินดาอายุ 31 ปี เป็นคนโสด พูดจาเปิดเผย และฉลาดมาก ในช่วงที่เรียนมหาวิทยาลัย เธอเรียนสาขาปรัชญา และให้ความสนใจกับประเด็นเรื่องการเหยียดสีผิว ความไม่เท่าเทียมทางสังคม และเคยเข้าร่วมการชุมนุมต่อต้านนิวเคลียร์
จากนั้นผู้เข้าร่วมทดลองจะถูกถามว่า ข้อใดมีความน่าจะเป็นมากกว่ากันระหว่าง:
- ลินดาเป็น พนักงานธนาคาร (Bank Teller)
- ลินดาเป็น พนักงานธนาคาร และมีบทบาทเคลื่อนไหวในกลุ่มสิทธิสตรี (Bank Teller & Feminist)
ผลลัพธ์ปรากฏว่าผู้เข้าร่วมการทดลองมากกว่า 85% เลือกตอบ ข้อ 2 ครับ!
แต่ในทางคณิตศาสตร์แล้ว คำตอบนั้นเป็นไปไม่ได้เลยครับ เพราะโอกาสที่เหตุการณ์ 2 เหตุการณ์จะเกิดขึ้นร่วมกัน ($P(พนักงานธนาคาร \cap สิทธิสตรี)$) จะไม่มีทางสูงไปกว่าโอกาสที่จะเกิดเหตุการณ์เพียงเหตุการณ์เดียว ($P(พนักงานธนาคาร)$) ได้เลย สมองเราเลือกตอบข้อ 2 เพียงเพราะลินดามีภาพลักษณ์ "ตรงกับนิยามในใจ" (Representativeness Heuristic) ของเรา โดยสมองละเลยความจริงทางคณิตศาสตร์ไปอย่างสิ้นเชิง
2. คดีชนแล้วหนี "The Taxi Cab Problem" (สะท้อนอคติ Base Rate Fallacy)
นี่คืออีกหนึ่งการทดลองที่ขึ้นชื่อเรื่องความขัดแย้งระหว่างการประเมินความรู้สึกและการคำนวณด้วยกฎของ Bayes ครับ ลองจินตนาการสถานการณ์นี้ไปพร้อมกันครับ:
ลองคิดว่าคุณเป็นหนึ่งในคณะลูกขุนตัดสินคดีชนแล้วหนีคดีหนึ่ง มีรถแท็กซี่คันหนึ่งชนคนเดินถนนในตอนกลางคืนแล้วหลบหนีไปทันที โดยทั้งคดีนี้ฝ่ายโจทก์มีหลักฐานสำคัญเพียงชิ้นเดียวคือคำให้การของพยานที่เป็นชายชราซึ่งมองเห็นอุบัติเหตุจากหน้าต่างห้องพักที่อยู่ห่างออกไป พยานรายนี้ให้การว่า "เขาเห็นแท็กซี่สีน้ำเงินเป็นคันที่ชนคนเดินถนน"
เพื่อพิสูจน์ข้อเท็จจริง ทนายความฝ่ายผู้เสียหายได้สืบหาข้อมูลสถิติจนได้ข้อเท็จจริงในเมืองนี้มาเพิ่มเติม ดังนี้:
- ในเมืองนี้มีบริษัทแท็กซี่รันระบบอยู่แค่ 2 สี คือ แท็กซี่สีน้ำเงิน (Blue Cabs) และ แท็กซี่สีเขียว (Green Cabs)
- ในคืนเกิดเหตุ แท็กซี่ทั้งหมดที่วิ่งบนถนนมีสัดส่วนเป็น แท็กซี่สีเขียว 85% และ แท็กซี่สีน้ำเงิน 15% (ค่าสัดส่วนดั้งเดิม หรือ Base Rate)
- ศาลได้ทำการทดสอบประสิทธิภาพสายตาของพยานภายใต้สภาพความมืดคล้ายคลึงกับคืนเกิดเหตุ พบว่าพยานคนนี้จำแนกสีแท็กซี่ได้ถูกต้อง 80% ของจำนวนครั้งที่มอง และจำแนกสีผิดพลาดอีก 20%
คำถามคือ: ความน่าจะเป็นที่รถแท็กซี่คันที่ชนแล้วหนีไปนั้น จะเป็น "สีน้ำเงิน" จริงๆ ตามคำบอกเล่าของพยาน มีอยู่เท่าใด?
เมื่อ Kahneman และ Tversky นำโจทย์นี้ไปถามผู้คน ส่วนใหญ่มักตอบว่าโอกาสคือ 80% (ตอบตามความแม่นยำของสายตาพยานโดยตรง) แต่เมื่อคิดตามสูตร Bayes' Theorem ผลลัพธ์กลับเปลี่ยนไปอย่างสิ้นเชิงครับ:
- Prior $P(Blue)$ = 0.15 (15% ของแท็กซี่ทั้งหมด)
- Prior $P(Green)$ = 0.85 (85% ของแท็กซี่ทั้งหมด)
- Likelihood $P(Says Blue | Blue)$ = 0.80 (โอกาสตรวจพบว่าน้ำเงินเมื่อเป็นสีน้ำเงินจริง)
- False Positive $P(Says Blue | Green)$ = 0.20 (โอกาสมองแท็กซี่สีเขียวผิดเป็นสีน้ำเงิน)
- หาค่ารวม $P(Says Blue)$ = (มองน้ำเงินถูก + มองเขียวผิดเป็นน้ำเงิน) $$P(Says Blue) = (0.80 \times 0.15) + (0.20 \times 0.85) = 0.12 + 0.17 = 0.29$$
- หา Posterior $P(Blue | Says Blue)$: $$P(Blue | Says Blue) = \frac{0.12}{0.29} \approx 41.38%$$
คำตอบคือ โอกาสที่แท็กซี่ชนแล้วหนีคันนั้นจะเป็นสีน้ำเงินจริงๆ มีเพียง 41.38% เท่านั้น! ไม่ถึงครึ่งหนึ่งด้วยซ้ำครับ ซึ่งแปลว่าโอกาสที่รถที่ชนจะเป็นแท็กซี่สีเขียว (ที่วิ่งกันเกลื่อนเมืองแต่พยานมองผิดสีเนื่องจากความมืด) ยังมีสูงกว่าถึง 58.62% เลยครับ!

ความเข้าใจผิดนี้คือ Base Rate Fallacy ครับ ซึ่งเกิดจากการที่สมองมนุษย์ให้ความสำคัญกับข้อมูลใหม่ที่มีความชัดเจนสะดุดตา (คำให้การของพยานว่ามองเห็นสีน้ำเงิน 80%) จนละเลยข้อมูลตั้งต้นในภาพใหญ่ไปจนหมด (สถิติเดิมที่ว่าในเมืองมีแท็กซี่สีน้ำเงินวิ่งอยู่แค่ 15%)
บทสรุป
การเรียนรู้เรื่องความน่าจะเป็นพื้นฐานและทฤษฎีของ Bayes ไม่เพียงช่วยให้เราเขียนโปรแกรม วิเคราะห์โมเดลสถิติ หรือทำนายตลาดได้อย่างถูกต้องเท่านั้น แต่ยังเป็นเสมือน "เครื่องมือเตือนสติ" ไม่ให้เราตกเป็นเหยื่อของการคิดเร็วของสมองตัวเองตามงานวิจัยของ Kahneman & Tversky อีกด้วยครับ
การตัดสินใจที่ดีไม่ได้ขึ้นอยู่กับความรู้สึก แต่เกิดจากการมีทฤษฎีสถิติที่มั่นคงและข้อมูลอ้างอิงที่เหมาะสมนั่นเอง หวังว่าบทความนี้จะช่วยเพิ่มความเข้าใจในความน่าจะเป็นให้เพื่อนๆ ทุกคนนะครับ!
FAQ (คำถามที่พบบ่อย)
ทำไมทฤษฎี Bayes ถึงสำคัญมากในวงการ AI และ Machine Learning ครับ?
เพราะอัลกอริทึมอย่าง Naive Bayes Classifier ถูกออกแบบมาเพื่อกรองอีเมลขยะ (Spam Filter) หรือพยากรณ์ผลลัพธ์โดยอาศัยข้อมูลใหม่ที่ระบบพบเจอเข้ามาช่วยอัปเดตความถูกต้องไปเรื่อยๆ ซึ่งเป็นการถอดสูตรมาจาก Bayes' Theorem โดยตรงครับ
Conjunction Fallacy สามารถพบเจอได้บ่อยไหมในชีวิตประจำวัน?
บ่อยมากครับ เช่น เวลาเรามองเห็นเทรดเดอร์คนหนึ่งใส่สูท ถือคอมพิวเตอร์กราฟสวยงาม เรามักจะตัดสินไปว่า "เค้าต้องเป็นเทรดเดอร์ที่ได้กำไรอย่างสม่ำเสมอแน่ๆ" แทนที่จะมองตามความน่าจะเป็นพื้นฐานว่า "เค้ามีโอกาสเป็นเพียงคนทั่วไปที่ขาดทุนเฉลี่ยเหมือนๆ กับทุกคนในตลาด"
จะป้องกันไม่ให้เราตัดสินใจผิดพลาดจาก Base Rate Fallacy ได้อย่างไร?
พยายามหาตัวเลขตั้งต้นก่อนเสมอครับ! ก่อนจะตื่นตระหนกกับข่าวร้าย ข่าวเด่น หรือสัญญาณการวิเคราะห์ที่พึ่งปรากฏ ให้พิจารณาว่าความน่าจะเป็นดั้งเดิมของเหตุการณ์นั้น (Base Rate) แท้จริงแล้วมีอยู่เท่าใดในภาพใหญ่ทั้งหมดครับ
Resources:
