เข้าใจพื้นฐานความน่าจะเป็น (Probability Fundamentals): จากทฤษฎี Bayes สู่ความอคติทางจิตวิทยาของ Kahneman & Tversky

สวัสดีครับเพื่อนๆ ทุกคน! ในโลกที่เต็มไปด้วยความไม่แน่นอน ไม่ว่าจะเป็นเรื่องชีวิต การตัดสินใจทางธุรกิจ หรือการสร้างโมเดลเทรดสำหรับสาย Quant ทักษะอย่างหนึ่งที่ถือเป็น "เสาหลัก" เลยก็คือเรื่อง ความน่าจะเป็น (Probability Fundamentals) ครับ

แต่สิ่งที่น่าสนใจคือ แม้ว่าคณิตศาสตร์จะพิสูจน์หาคำตอบที่ถูกต้องได้ แต่สมองของมนุษย์เรากลับไม่ได้ถูกออกแบบมาให้เข้าใจสถิติโดยธรรมชาติเลย วันนี้เราจะมาเจาะลึกตั้งแต่ทฤษฎีพื้นฐานอย่าง Conditional Probability และ Bayes' Theorem ไปจนถึงเรื่องราวสุดคลาสสิกของสองนักจิตวิทยา Daniel Kahneman และ Amos Tversky ที่จะมาเฉลยให้เห็นกันชัดๆ ว่า สมองของเราหลอกตาและประเมินความน่าจะเป็นผิดพลาดไปได้อย่างไรครับ!

ปูพื้นฐานและทำความเข้าใจ Conditional Probability

Conditional Probability (ความน่าจะเป็นแบบมีเงื่อนไข) คือ โอกาสที่จะเกิดเหตุการณ์หนึ่ง (Event B) เมื่อเราแน่ใจแล้วว่าอีกเหตุการณ์หนึ่ง (Event A) ได้เกิดขึ้นจริงก่อนหน้า โดยเขียนแทนด้วยสัญลักษณ์ P(B|A).

ในวิชาสถิติแบบดั้งเดิม ความน่าจะเป็นทั่วไป เช่น โอกาสที่ฝนจะตก หรือโอกาสที่เหรียญจะออกหัว จะเป็นการมองจากภาพรวมใหญ่ๆ แต่ในชีวิตจริง เรามักจะมี "ข้อมูลอ้างอิง" เข้ามาช่วยจำกัดขอบเขตเสมอ เช่น "โอกาสที่ฝนจะตก ถ้าวันนี้มีเมฆครึ้ม" หรือ "โอกาสที่หุ้นจะขึ้น ถ้ามีข่าวประกาศลดอัตราดอกเบี้ย" ซึ่งนี่คือแนวคิดของ Conditional Probability ครับ

โดยสูตรทางคณิตศาสตร์ในการหาความน่าจะเป็นแบบมีเงื่อนไข เขียนได้ดังนี้ครับ:

$$P(B|A) = \frac{P(B \cap A)}{P(A)}$$

เพื่อให้เห็นภาพง่ายที่สุด ลองจินตนาการถึงการทอยลูกเต๋า 1 ลูก:

ปกติแล้ว โอกาสที่จะได้แต้ม 6 คือ $P(แต้ม 6) = 1/6$
แต่หากเราได้ข้อมูลเสริมมาว่า ลูกเต๋าที่ทอยออกมาได้ แต้มคู่ แน่นอน (Event A เกิดขึ้นแล้ว) โอกาสที่จะได้แต้ม 6 จะเปลี่ยนไปทันที เพราะตัวเลือกทั้งหมดเหลือแค่ {2, 4, 6} ดังนั้น $P(แต้ม 6 | แต้มคู่) = 1/3$

แผนภาพ Venn Diagram แสดงหลักการของ Conditional Probability P(B|A)

เมื่อเราจำกัดขอบเขตของ Sample Space ลงด้วยเงื่อนไขใหม่ ความแม่นยำในการวิเคราะห์ข้อมูลก็จะเพิ่มสูงขึ้นอย่างมากครับ

ทฤษฎีเปลี่ยนโลก: Bayes' Theorem

Bayes' Theorem คือ ทฤษฎีที่ใช้ในการปรับปรุงระดับความน่าเชื่อถือหรือความน่าจะเป็นของสมมติฐานเดิม (Prior) เมื่อมีข้อมูลหรือหลักฐานใหม่ (Evidence) เข้ามาเพิ่มเติม.

ทฤษฎีนี้ถูกคิดค้นโดย Thomas Bayes นักคณิตศาสตร์ชาวอังกฤษ และกลายมาเป็นรากฐานสำคัญของระบบ Machine Learning รวมถึงระบบประเมินความเสี่ยงต่างๆ โดยสูตรของ Bayes' Theorem เขียนดังนี้ครับ:

$$P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}$$

เพื่อให้เพื่อนๆ เข้าใจง่ายขึ้น เรามาจำแนกแต่ละตัวแปรในสูตรออกมากันครับ:

ตัวแปร	ชื่อเรียกอย่างเป็นทางการ	อธิบายแบบเข้าใจง่าย
P(A\|B)	Posterior Probability	ความน่าจะเป็นของเหตุการณ์ A หลังจากที่เราเห็นหลักฐาน B แล้ว (สิ่งที่เราอยากรู้)
P(B\|A)	Likelihood	โอกาสที่เราจะพบหลักฐาน B ในกรณีที่สมมติฐาน A เป็นความจริง
P(A)	Prior Probability	ความน่าจะเป็นเริ่มต้นของเหตุการณ์ A ก่อนที่จะมีข้อมูลหรือหลักฐานใหม่เข้ามา
P(B)	Evidence	โอกาสทั้งหมดที่จะเกิดหลักฐาน B ขึ้น ไม่ว่าสมมติฐาน A จะจริงหรือไม่ก็ตาม

ทฤษฎี Bayes' Theorem กับการคำนวณและจำแนกข้อมูลตามปัจจัยนำเข้า

ลองคำนวณจริง: การวินิจฉัยโรคทางการแพทย์ (Medical Diagnostic)

สมมติว่าเกิดโรคร้ายแรงชนิดหนึ่งขึ้นในเมือง ซึ่งสถิติบอกว่ามีคนเป็นโรคนี้น้อยมากเพียงแค่ 1% ของประชากร ($P(Disease) = 0.01$) หากคุณไปตรวจหาโรคนี้ด้วยชุดตรวจที่มีความแม่นยำสูงถึง 90% (หมายความว่าถ้าเป็นโรค ผลตรวจจะเป็นบวก 90% และถ้าไม่เป็นโรค ผลตรวจจะเป็นลบ 95% หรือมีโอกาสที่คนไม่เป็นโรคแต่ตรวจเจอผลบวกหลอกๆ 5%)

คำถามคือ: ถ้าผลตรวจของคุณออกมาเป็นบวก (+) โอกาสที่คุณจะเป็นโรคนี้จริงๆ มีกี่เปอร์เซ็นต์?

คนทั่วไปมักตอบว่า "90% แน่นอน" แต่ถ้าใช้ Bayes' Theorem คำนวณ:

Prior $P(Disease)$ = 0.01 (1%)
Likelihood $P(+|Disease)$ = 0.90 (90%)
Evidence $P(+)$ = โอกาสที่ผลบวกจะเกิดขึ้นทั้งหมด (เป็นโรคแล้วตรวจเจอ + ไม่เป็นโรคแล้วตรวจผิดว่าเจอ) $$P(+) = (0.90 \times 0.01) + (0.05 \times 0.99) = 0.009 + 0.0495 = 0.0585$$
คำนวณหา Posterior $P(Disease|+)$: $$P(Disease|+) = \frac{0.90 \times 0.01}{0.0585} = \frac{0.009}{0.0585} \approx 15.38%$$

ผลลัพธ์คือ คุณมีโอกาสเป็นโรคนั้นจริงเพียงแค่ 15.38% เท่านั้นเองครับ! ซึ่งต่างจาก 90% ที่เราเดาในตอนแรกอย่างมหาศาล นั่นเป็นเพราะจำนวนคนที่ไม่เป็นโรค (99%) มันเยอะมาก จนทำให้ปริมาณผลตรวจบวกปลอม (False Positive) ข่มผลตรวจจริงไปเสียหมดครับ

การประยุกต์ใช้ Bayes' Theorem ในระบบเทรด (Quant Trading)

ในโลกของ Algorithmic Trading นักเทรดสาย Quant มักจะนำทฤษฎี Bayes มาใช้ในการจำแนกสภาวะตลาด (Market Regime Identification) เพื่อปรับกลยุทธ์ให้เหมาะสมกับสภาพตลาดปัจจุบัน.

สภาวะตลาดการเงินมีการเปลี่ยนแปลงอยู่ตลอดเวลา เช่น จากสภาวะตลาดมีเทรนด์ (Trend Regime) ไปสู่สภาวะตลาดออกข้างไร้เทรนด์ (Mean-Reversion Regime) การนำกฎของ Bayes มาใช้ช่วยให้เราสามารถคำนวณ "ความน่าจะเป็นที่แท้จริง" ของสภาวะตลาดหลังจากเห็นสัญญาณเทคนิคอลได้

ตัวอย่าง: การตรวจจับตลาดขาขึ้น (Bull Market Regime)

สมมติว่าเราพึ่งได้สัญญาณซื้อจากโมเดลคณิตศาสตร์ตัวหนึ่ง (Momentum Signal) เราต้องการรู้ว่า โอกาสที่สภาวะตลาดตอนนั้นจะเป็นตลาดขาขึ้นจริง (Bull Market) มีอยู่เท่าใด?

จากการเก็บข้อมูลทางสถิติในอดีต (Backtest) เราพบความจริงดังนี้:

Prior $P(Bull)$ = 0.40 (โอกาสปกติที่สภาวะตลาดจะเป็นตลาดขาขึ้นมี 40%)
Prior $P(Bear)$ = 0.60 (โอกาสที่ตลาดจะเป็นขาลงหรือออกข้างมี 60%)
Likelihood $P(+|Bull)$ = 0.80 (ถ้าตลาดเป็นขาขึ้นจริง โมเดลจะส่งสัญญาณซื้อ (+) ถูกต้อง 80%)
False Positive $P(+|Bear)$ = 0.30 (ถ้าตลาดไม่ใช่ขาขึ้น โมเดลส่งสัญญาณซื้อหลอกๆ (+) อยู่ที่ 30%)

เมื่อนำสถิติเหล่านี้มาคำนวณหาความน่าจะเป็นหลังได้รับสัญญาณซื้อล่าสุด ($P(Bull | +)$):

หาผลรวมโอกาสส่งสัญญาณซื้อทั้งหมด $P(+)$: $$P(+) = (0.80 \times 0.40) + (0.30 \times 0.60) = 0.32 + 0.18 = 0.50$$
คำนวณหา $P(Bull | +)$: $$P(Bull | +) = \frac{0.80 \times 0.40}{0.50} = \frac{0.32}{0.50} = 64%$$

ผลลัพธ์คือ แม้สัญญาณซื้อจะดูแม่นยำสูงถึง 80% แต่เมื่อตลาดรวมมีโอกาสเกิดขาขึ้นเพียง 40% โอกาสที่สัญญาณซื้อนี้จะเป็นตลาดขาขึ้นจริงจึงเหลือเพียง 64% เท่านั้น! บอทเทรด Quant สามารถนำตัวเลข 64% นี้ไปปรับขนาดสัญญา (Position Sizing) หรือเปิด/ปิดฟังก์ชันการเทรดแบบตามเทรนได้โดยอัตโนมัติครับ

โค้ดตัวอย่าง Python: การคำนวณความน่าจะเป็นของสภาวะตลาดด้วย Bayes

เรามาดูโค้ด Python สั้นๆ ที่บอทเทรดจริงสามารถนำไปปรับใช้ในการอัปเดตสภาวะตลาดแบบไดนามิกได้เลยครับ:

def calculate_market_regime_prob(prior_bull, likelihood_correct, false_positive):
    """
    คำนวณความน่าจะเป็นที่ตลาดจะเป็นขาขึ้นจริง หลังจากเกิดสัญญาณบวก
    """
    prior_bear = 1.0 - prior_bull
    
    # 1. คำนวณหาโอกาสที่จะเกิดสัญญาณบวกทั้งหมด (Total Evidence)
    prob_signal = (likelihood_correct * prior_bull) + (false_positive * prior_bear)
    
    # 2. ใช้กฎของ Bayes หา Posterior Probability
    posterior_bull = (likelihood_correct * prior_bull) / prob_signal
    
    return posterior_bull

# กำหนดสถิติตั้งต้น
prior_bull_market = 0.40
signal_accuracy = 0.80
signal_false_positive = 0.30

posterior = calculate_market_regime_prob(prior_bull_market, signal_accuracy, signal_false_positive)

print(f"ความน่าจะเป็นเริ่มต้น (Prior): {prior_bull_market * 100:.2f}%")
print(f"ความน่าจะเป็นหลังเจอสัญญาณซื้อ (Posterior): {posterior * 100:.2f}%")

การประยุกต์ใช้เช่นนี้ ช่วยให้ระบบเทรดทำงานแบบมีตรรกะรองรับ หลีกเลี่ยงสัญญาณหลอก (Whipsaw) และบริหารความเสี่ยงได้อย่างมืออาชีพครับ

ทำไมคนเราถึงมองพลาด? ทฤษฎีอคติของ Kahneman & Tversky

Daniel Kahneman (ผู้เขียนหนังสือ Thinking, Fast and Slow) และ Amos Tversky ได้เสนอว่า สมองของมนุษย์เราไม่ได้ใช้กฎของ Bayes ในการประเมินชีวิตประจำวัน แต่ใช้กฎลัดทางความคิด (Heuristics) ซึ่งมักนำไปสู่ความเข้าใจผิดที่เป็นระบบ (Cognitive Biases).

มีตัวอย่างงานวิจัยที่โด่งดัง 2 ตัวอย่างที่ช่วยสะท้อนให้เห็นว่ามนุษย์เราวิเคราะห์สถิติความน่าจะเป็นได้ขัดแย้งกับความเป็นจริงขนาดไหนครับ:

1. การทดลอง "Linda Problem" (สะท้อนอคติ Conjunction Fallacy)

Kahneman และ Tversky ได้อธิบายลักษณะของตัวละครสมมติชื่อ "ลินดา" ให้ผู้ร่วมการทดลองฟังดังนี้:

ลินดาอายุ 31 ปี เป็นคนโสด พูดจาเปิดเผย และฉลาดมาก ในช่วงที่เรียนมหาวิทยาลัย เธอเรียนสาขาปรัชญา และให้ความสนใจกับประเด็นเรื่องการเหยียดสีผิว ความไม่เท่าเทียมทางสังคม และเคยเข้าร่วมการชุมนุมต่อต้านนิวเคลียร์

จากนั้นผู้เข้าร่วมทดลองจะถูกถามว่า ข้อใดมีความน่าจะเป็นมากกว่ากันระหว่าง:

ลินดาเป็น พนักงานธนาคาร (Bank Teller)
ลินดาเป็น พนักงานธนาคาร และมีบทบาทเคลื่อนไหวในกลุ่มสิทธิสตรี (Bank Teller & Feminist)

ผลลัพธ์ปรากฏว่าผู้เข้าร่วมการทดลองมากกว่า 85% เลือกตอบ ข้อ 2 ครับ!

แต่ในทางคณิตศาสตร์แล้ว คำตอบนั้นเป็นไปไม่ได้เลยครับ เพราะโอกาสที่เหตุการณ์ 2 เหตุการณ์จะเกิดขึ้นร่วมกัน ($P(พนักงานธนาคาร \cap สิทธิสตรี)$) จะไม่มีทางสูงไปกว่าโอกาสที่จะเกิดเหตุการณ์เพียงเหตุการณ์เดียว ($P(พนักงานธนาคาร)$) ได้เลย สมองเราเลือกตอบข้อ 2 เพียงเพราะลินดามีภาพลักษณ์ "ตรงกับนิยามในใจ" (Representativeness Heuristic) ของเรา โดยสมองละเลยความจริงทางคณิตศาสตร์ไปอย่างสิ้นเชิง

2. คดีชนแล้วหนี "The Taxi Cab Problem" (สะท้อนอคติ Base Rate Fallacy)

นี่คืออีกหนึ่งการทดลองที่ขึ้นชื่อเรื่องความขัดแย้งระหว่างการประเมินความรู้สึกและการคำนวณด้วยกฎของ Bayes ครับ ลองจินตนาการสถานการณ์นี้ไปพร้อมกันครับ:

ลองคิดว่าคุณเป็นหนึ่งในคณะลูกขุนตัดสินคดีชนแล้วหนีคดีหนึ่ง มีรถแท็กซี่คันหนึ่งชนคนเดินถนนในตอนกลางคืนแล้วหลบหนีไปทันที โดยทั้งคดีนี้ฝ่ายโจทก์มีหลักฐานสำคัญเพียงชิ้นเดียวคือคำให้การของพยานที่เป็นชายชราซึ่งมองเห็นอุบัติเหตุจากหน้าต่างห้องพักที่อยู่ห่างออกไป พยานรายนี้ให้การว่า "เขาเห็นแท็กซี่สีน้ำเงินเป็นคันที่ชนคนเดินถนน"

เพื่อพิสูจน์ข้อเท็จจริง ทนายความฝ่ายผู้เสียหายได้สืบหาข้อมูลสถิติจนได้ข้อเท็จจริงในเมืองนี้มาเพิ่มเติม ดังนี้:

ในเมืองนี้มีบริษัทแท็กซี่รันระบบอยู่แค่ 2 สี คือ แท็กซี่สีน้ำเงิน (Blue Cabs) และ แท็กซี่สีเขียว (Green Cabs)
ในคืนเกิดเหตุ แท็กซี่ทั้งหมดที่วิ่งบนถนนมีสัดส่วนเป็น แท็กซี่สีเขียว 85% และ แท็กซี่สีน้ำเงิน 15% (ค่าสัดส่วนดั้งเดิม หรือ Base Rate)
ศาลได้ทำการทดสอบประสิทธิภาพสายตาของพยานภายใต้สภาพความมืดคล้ายคลึงกับคืนเกิดเหตุ พบว่าพยานคนนี้จำแนกสีแท็กซี่ได้ถูกต้อง 80% ของจำนวนครั้งที่มอง และจำแนกสีผิดพลาดอีก 20%

คำถามคือ: ความน่าจะเป็นที่รถแท็กซี่คันที่ชนแล้วหนีไปนั้น จะเป็น "สีน้ำเงิน" จริงๆ ตามคำบอกเล่าของพยาน มีอยู่เท่าใด?

เมื่อ Kahneman และ Tversky นำโจทย์นี้ไปถามผู้คน ส่วนใหญ่มักตอบว่าโอกาสคือ 80% (ตอบตามความแม่นยำของสายตาพยานโดยตรง) แต่เมื่อคิดตามสูตร Bayes' Theorem ผลลัพธ์กลับเปลี่ยนไปอย่างสิ้นเชิงครับ:

Prior $P(Blue)$ = 0.15 (15% ของแท็กซี่ทั้งหมด)
Prior $P(Green)$ = 0.85 (85% ของแท็กซี่ทั้งหมด)
Likelihood $P(Says Blue | Blue)$ = 0.80 (โอกาสตรวจพบว่าน้ำเงินเมื่อเป็นสีน้ำเงินจริง)
False Positive $P(Says Blue | Green)$ = 0.20 (โอกาสมองแท็กซี่สีเขียวผิดเป็นสีน้ำเงิน)
หาค่ารวม $P(Says Blue)$ = (มองน้ำเงินถูก + มองเขียวผิดเป็นน้ำเงิน) $$P(Says Blue) = (0.80 \times 0.15) + (0.20 \times 0.85) = 0.12 + 0.17 = 0.29$$
หา Posterior $P(Blue | Says Blue)$: $$P(Blue | Says Blue) = \frac{0.12}{0.29} \approx 41.38%$$

คำตอบคือ โอกาสที่แท็กซี่ชนแล้วหนีคันนั้นจะเป็นสีน้ำเงินจริงๆ มีเพียง 41.38% เท่านั้น! ไม่ถึงครึ่งหนึ่งด้วยซ้ำครับ ซึ่งแปลว่าโอกาสที่รถที่ชนจะเป็นแท็กซี่สีเขียว (ที่วิ่งกันเกลื่อนเมืองแต่พยานมองผิดสีเนื่องจากความมืด) ยังมีสูงกว่าถึง 58.62% เลยครับ!

ความขัดแย้งของสมองมนุษย์ในการประเมินด้วยตรรกะเหตุผลเทียบกับการใช้สัญชาตญาณ

ความเข้าใจผิดนี้คือ Base Rate Fallacy ครับ ซึ่งเกิดจากการที่สมองมนุษย์ให้ความสำคัญกับข้อมูลใหม่ที่มีความชัดเจนสะดุดตา (คำให้การของพยานว่ามองเห็นสีน้ำเงิน 80%) จนละเลยข้อมูลตั้งต้นในภาพใหญ่ไปจนหมด (สถิติเดิมที่ว่าในเมืองมีแท็กซี่สีน้ำเงินวิ่งอยู่แค่ 15%)

บทสรุป

การเรียนรู้เรื่องความน่าจะเป็นพื้นฐานและทฤษฎีของ Bayes ไม่เพียงช่วยให้เราเขียนโปรแกรม วิเคราะห์โมเดลสถิติ หรือทำนายตลาดได้อย่างถูกต้องเท่านั้น แต่ยังเป็นเสมือน "เครื่องมือเตือนสติ" ไม่ให้เราตกเป็นเหยื่อของการคิดเร็วของสมองตัวเองตามงานวิจัยของ Kahneman & Tversky อีกด้วยครับ

การตัดสินใจที่ดีไม่ได้ขึ้นอยู่กับความรู้สึก แต่เกิดจากการมีทฤษฎีสถิติที่มั่นคงและข้อมูลอ้างอิงที่เหมาะสมนั่นเอง หวังว่าบทความนี้จะช่วยเพิ่มความเข้าใจในความน่าจะเป็นให้เพื่อนๆ ทุกคนนะครับ!

FAQ (คำถามที่พบบ่อย)

ทำไมทฤษฎี Bayes ถึงสำคัญมากในวงการ AI และ Machine Learning ครับ?

เพราะอัลกอริทึมอย่าง Naive Bayes Classifier ถูกออกแบบมาเพื่อกรองอีเมลขยะ (Spam Filter) หรือพยากรณ์ผลลัพธ์โดยอาศัยข้อมูลใหม่ที่ระบบพบเจอเข้ามาช่วยอัปเดตความถูกต้องไปเรื่อยๆ ซึ่งเป็นการถอดสูตรมาจาก Bayes' Theorem โดยตรงครับ

Conjunction Fallacy สามารถพบเจอได้บ่อยไหมในชีวิตประจำวัน?

บ่อยมากครับ เช่น เวลาเรามองเห็นเทรดเดอร์คนหนึ่งใส่สูท ถือคอมพิวเตอร์กราฟสวยงาม เรามักจะตัดสินไปว่า "เค้าต้องเป็นเทรดเดอร์ที่ได้กำไรอย่างสม่ำเสมอแน่ๆ" แทนที่จะมองตามความน่าจะเป็นพื้นฐานว่า "เค้ามีโอกาสเป็นเพียงคนทั่วไปที่ขาดทุนเฉลี่ยเหมือนๆ กับทุกคนในตลาด"

จะป้องกันไม่ให้เราตัดสินใจผิดพลาดจาก Base Rate Fallacy ได้อย่างไร?

พยายามหาตัวเลขตั้งต้นก่อนเสมอครับ! ก่อนจะตื่นตระหนกกับข่าวร้าย ข่าวเด่น หรือสัญญาณการวิเคราะห์ที่พึ่งปรากฏ ให้พิจารณาว่าความน่าจะเป็นดั้งเดิมของเหตุการณ์นั้น (Base Rate) แท้จริงแล้วมีอยู่เท่าใดในภาพใหญ่ทั้งหมดครับ

Resources: