كل شيء يمكن التنبؤ به

كل شيء يمكن التنبؤ به

 

كل شيء يمكن التنبؤ به :  كيف تفسر الإحصاءات البايزية عالمنا

 "Everything Is Predictable: How Bayesian Statistics Explain Our World" لتوم تشيفرز

عالم يمكن التنبؤ به عبر المنظور البايزي

يقدم توم تشيفرز في كتابه "Everything Is Predictable: How Bayesian Statistics Explain Our World" رحلة فكرية مثيرة ت explores كيف تشكل نظرية بايز الإحصائية إدراكنا للعالم من حولنا. 

ي argue تشيفرز أن هذه النظرية الرياضية التي وضعها القس الإنجليزي توماس بايز في القرن الثامن عشر ليست مجرد أداة إحصائية جافة، بل هي إطار عقلاني يفسر كل شيء من آليات عمل الدماغ البشري إلى تحديات الأزمات العلمية المعاصرة مثل أزمة التكرار في البحوث العلمية. 

يستعرض الكتاب بطريقة سردية شائقة وبلغة واضحة تصل إلى غير المتخصصين، القوة التفسيرية الهائلة للإحصاء البايزي في مجالات متنوعة مثل الطب، القانون، الذكاء الاصطناعي، وحتى عملية الإدراك البشري نفسه.

 الرجل والصيغة - توماس بايز وإرثه الخالد

1.1 الأصول التاريخية: القس الذي غير العالم

يغوص تشيفرز في السيرة الذاتية لتوماس بايز (1701-1761)، الذي كان عالم لاهوت من الطائفة المنشقة (Nonconformist) في إنجلترا، ورياضيًا هاويًا

لم ينشر بايز نظريته بنفسه، بل وجدت بعد وفاته وقام صديقه ريتشارد برايس بنشرها في ورقة بحثية بعنوان "An Essay towards Solving a Problem in the Doctrine of Chances". يؤكد تشيفرز على أن بايز كان مدفوعًا برغبة في دحض الشكوكية المادية التي انتشرت في عصره، والدفاع عن الإيمان العقلاني based على الأدلة والاستدلال.

1.2 الصيغة الرياضية التي هزت العالم

يشرح الكتاب نظرية بايز بطريقة سهلة دون التركيز على التعقيد الرياضي، إذ يعتقد تشيفرز، كما كان يعتقد ستيفن هوكينج، أن كل معادلة رياضية في كتاب تقلل من عدد القراء إلى النصف! .
صيغة بايز:

P(AB)=P(BA)×P(A)P(B)

حيث:

  • (P(A|B)) هي الاحتمال posterior probability (احتمال حدوث الفرضية A بشرط ظهور الدليل B).

  • (P(B|A)) هي الاحتمالية likelihood (احتمال ظهور الدليل B بشرط صحة الفرضية A).

  • (P(A)) هو الاحتمال prior probability prior (الاحتمال الأولي لصحة الفرضية A قبل ظهور الدليل B).

  • (P(B)) هو الاحتمال الهامشي marginal probability (احتمال ظهور الدليل B تحت جميع الفرضيات الممكنة).

يقدم تشيفرز مثالاً توضيحيًا classic من الفحص الطبي أصبح من كلاسيكيات شرح النظرية:

لو افترضنا أن 1% من النساء مصابات بسرطان الثدي. وأن فحص الماموغرام دقيق بنسبة 80% في اكتشاف السرطان حين يكون موجودًا بالفعل، ولكنه يعطي أيضًا نتائج إيجابية خاطئة false positives بنسبة 10% لدى النساء غير المصابات. إذا جاءت نتيجة فحص امرأة ما إيجابية، فما هو احتمال إصابتها بالسرطان حقًا؟
الحساب البايزي يظهر أن الاحتمال هو حوالي 7.5% فقط وليس 80% كما يتوهم الكثيرون! وذلك لأن الاحتمال الأولي low prior probability (1%) يؤثر بشدة على النتيجة النهائية. هذا يعني أن أكثر من 90% من النساء اللواتي تأتي نتائج فحوصهن إيجابية قد ينزعجن without داعٍ.

 معسكرا الإحصاء - البايزيون مقابل التكراريون (Frequentists vs. Bayesians)

2.1 الفلسفة التكرارية: العالم بلا معرفة سابقة

يشرح تشيفرز المدرسة التكرارية Frequentism التي هيمنت على المشهد الإحصائي والعلمي لمعظم القرن العشرين. تقوم هذه المدرسة على فكرة أن الاحتمال هو تكرار نسبي long-run frequency لحدث ما إذا ما كررنا التجربة عددًا لا نهائيًا من المرات. تعتمد هذه المدرسة على أدوات مثل قيمة P p-values وفترات الثقة confidence intervals لاختبار الفرضيات، مع افتراض أن المعاملات الثابتة fixed parameters مجهولة القيمة.
النقد الأساسي الذي يوجهه تشيفرز للنهج التكراري هو أنه لا يسمح بإدخال المعرفة السابقة أو المعتقدات الذاتية (subjectivity) في التحليل، مما يجعله أداة صلبة rigid أحيانًا في تفسير البيانات، خاصة في الحالات المعقدة أو عندما تكون البيانات نادرة.

2.2 الفلسفة البايزية: العالم كعملية تحديث مستمرة

في المقابل، يقدم الكتاب النهج البايزي على أنه إطار مرن flexible framework يجعل من الاحتمال مقياسًا لدرجة اليقين أو الاعتقاد belief في حدوث حدث ما. هذا الاعتقاد قابل للتعديل باستمرار في ضوء الأدلة الجديدة. القوة هنا تكمن في دمج المعرفة السابقة (الاحتمال الأولي Prior) مع البيانات الجديدة (الاحتمالية Likelihood) للوصول إلى معرفة محدثة (الاحتمال اللاحق Posterior).
يشبه تشيفرز هذه العملية بعملية التعلم الإنساني الطبيعية: الإنسان لديه فكرة مسبقة عن العالم، وعندما تواجهه معلومات جديدة، فإنه يعدل من أفكاره بشكل تدريجي، وليس بشكل قاطع ومطلق.

2.3 الجدال والصراع بين المدرستين

يصف الكتاب الجدال المحتدم بين المدرستين، والذي وصل إلى حد أن البايزيين في سبعينيات القرن الماضي كانوا ينشدون الأغاني الساخرة من التكراريين في المؤتمرات العلمية!.
يشير تشيفرز إلى أن أحد الفروق العملية المهمة هي في تفسير النتائج:

  • التكراري يقول: "إذا كانت الفرضية الصفرية (null hypothesis) صحيحة، فإن احتمال الحصول على هذه البيانات هو 5% (p-value = 0.05)".

  • البايزي يقول: "بناءً على البيانات وعلى اعتقادي المسبق، فإن درجة يقيني بصحة الفرضية هي X%".

الفصل الثالث: تطبيقات بايز في العالم الحقيقي - من الطب إلى الذكاء الاصطناعي

3.1 الثورة في التشخيص الطبي واتخاذ القرار

يوسع تشيفرز نطاق المثال الطبي ليوضح كيف أن الفهم الخاطئ للإحصاء يمكن أن تكون له عواقب وخيمة. 

يذكر حالة أزمة جوازات مناعة كوفيد-19 في المملكة المتحدة، حيث أن الاعتماد على اختبار الأجسام المضادة دون الأخذ في الاعتبار الاحتمالات الأولية ونسبة الإيجابيات الكاذبة العالية إلى منح "جوازات سفر مناعة" لنسبة تصل إلى ثلثي الأشخاص الذين لم يكونوا محصنين حقًا، مما يعرضهم ويعرض الآخرين للخطر.

3.2 النظام القضائي وتقييم الأدلة الجنائية

يناقش الكتاب كيف يمكن للإحصاء البايزي أن يجعل العدالة أكثر موضوعية. فبدلاً من أن يقنع المحلفون بأدلة الطب الشرعي مثل بصمة الحمض النووي DNA بشكل مطلق، يمكن تقديمها على شكل معامل احتمالي 

 يخبر المحلفين بمدى قوة هذا الدليل في تأييد اتهام النيابة مقابل ادعاءات الدفاع. هذا يساعد على تجنب المغالطات الأساسية base rate fallacy التي تضعف الأحكام القضائية أحيانًا.

3.3 محركات التوصية وتصفية البريد المزعج

يوضح تشيفرز أننا نتفاعل يوميا مع خوارزميات تعمل بنفس منطق بايز

فخوارزميات تصفية البريد Spam filter الإلكتروني، على سبيل المثال، تبني prior احتمالات أولية based على كلمات معينة (مثل "عرض مجاني" أو "وريث لثروة")، 

ثم تقوم بتحديث هذه القناعات مع كل رسالة إلكترونية جديدة لتقرر ما إذا كانت رسالة مزعجة أم لا. Similarly, تعمل أنظمة التوصية recommendation systems في نتفليكس Netflix وأمازون Amazon على تحديث توقعاتها لما قد يعجبك based على ما شاهدته أو اشتريته سابقًا.

 تطبيقات الإحصاء البايزي في مجالات مختلفة:

المجالالتطبيقكيف تعمل نظرية بايز
الطبتفسير نتائج الفحوصات التشخيصيةتجمع بين دقة الفحص (Likelihood) وانتشار المرض في المجتمع (Prior) لتقدير احتمال الإصابة الحقيقية (Posterior).
القانونتقييم قوة الأدلة الجنائيةتحسب احتمال وجود الدليل (مثل بصمة DNA) إذا كان المتهم بريئًا مقابل احتمال وجوده إذا كان مذنبًا (Likelihood Ratio).
التكنولوجياتصفية البريد الإلكتروني المزعجتتعلم من الكلمات الشائعة في الرسائل المزعجة (Prior) وتقيم كل رسالة جديدة (Evidence) لتصنيفها.
الذكاء الاصطناعيالتعلم الآلي ومعالجة اللغةتستخدم الخوارزميات (مثل GPT) البيانات السابقة (Priors) للتنبؤ بالكلمة أو الإجراء التالي في التسلسل.
الاقتصاد والتمويلإدارة المخاطر والتداول Algorithmic tradingتحدث النماذج احتمالات تقلبات السوق (Priors) بناءً على البيانات المالية الجديدة (Evidence) في الوقت الحقيقي.

بايز والعلم - من أزمة التكرار إلى السوبر فوركاستنغ

4.1 بايز كمنقذ للعلم من أزمة التكرار (Replication Crisis)

يخصص تشيفرز جزءًا مهمًا من الكتاب لشرح كيف ساهمت الممارسات الإحصائية التقليدية (التكرارية) في أزمة التكرار replication crisis، التي اتضحت أن الكثير من النتائج العلمية المنشورة، خاصة في العلوم الاجتماعية وعلم النفس، لا يمكن إعادة إنتاجها replicate في دراسات لاحقة.
أسباب الأزمة من المنظور البايزي:

  • التركيز على قيمة P (p-value): يسعى الباحثون للحصول على p-value < 0.05 كـ"كأس مقدسة" للنجاح والنشر، مما يدفعهم إلى اختراق القيمة P p-hacking (مثل تجربة تحليلات متعددة حتى تظهر نتيجة "مهمة إحصائيًا").

  • إهمال الاحتمالات الأولية: تجاهل مدى ** plausibility المعقولية المسبقة** للفرضية. فبعض الفرضيات المدهشة ذات الاحتمال الأولي المنخفض جدًا تحتاج إلى أدلة أقوى بكثير لتأييدها مقارنة بفرضية راسخة.

  • تحيز النشر publication bias: حيث تفضل المجلات العلمية نشر النتائج "الإيجابية" والمثيرة over النتائج "السلبية" أو غير الحاسمة.

الحلول البايزية التي يقترحها الكتاب:

  • عوامل بايز Bayes Factors: وهي مقياس يوازن بين قوة الدليل evidence لصالح فرضية مقابل فرضية بديلة، مما يعطي صورة أوضح من مجرد قيمة P.

  • الاحتمالات اللاحقة Posteriors: تقديم تقديرات للكميات محل الاهتمام (مثل حجم التأثير effect size) مصحوبة بقياس لعدم اليقين ريبة حولها (مثل فترات 95% فترات مصداقية فترات زمنية موثوقة).

  • التركيز على حجم التأثير Effect Size وليس الدلالة الإحصائية فقط: لأن تغييرًا ضئيلًا قد يكون ذا دلالة إحصائية إذا كانت العينة كبيرة enough دون أن يكون ذا أهمية عملية حقيقية.

4.2  فن وعلم الـ "سوبر فوركاستنغ" (Superforecasting)

ينقلنا تشيفرز إلى عالم التنبؤ بالأحداث الجيوسياسية والاقتصادية، وكيف أن المشروع البحثي الشهير "Good Judgment Project" أظهر أن بعض الأفراد (الذين سموا later بالسوبر فوركاسترز) يمكنهم التنبؤ بالأحداث المستقبلية بدقة تفوق بكثير الخبراء المتخصصين أحيانًا.
صفات هؤلاء المتنبئين العظام، والتي تعكس تفكيرًا بايزيًا صرفًا:

  1. البدء بـ"المعدلات الأساسية" Base Rates: يبدأون بالاحتمال الأولي التاريخي لأحداث مشابهة.

  2. التحديث التدريجي للقناعات: يقومون بتعديل توقعاتهم باستمرار وبدرجات صغيرة مع ظهور معلومات جديدة، تمامًا كما يفعل الإحصاء البايزي.

  3. التعبير عن عدم اليقين في صورة احتمالات رقمية دقيقة: لا يقولون "قد يحدث"، بل يقولون "احتماله 60%"، ثم يحسبون متوسط دقة these التنبؤات على المدى الطويل.

  4. البحث عن معلومات متنوعة وآراء مخالفة: فهم يبحثون  عن أدلة تخالف اعتقادهم السابق أدلة ناقضه لتجنب انحياز التأكيد .

  5. العمل الجماعي وتجميع التوقعات: فهم يعلمون أن الذكاء الجماعي الكلي غالبًا ما يتفوق على أذكى فرد في المجموعة.

الفصل الخامس: الدماغ البايزي - الوعي كهلوسة مُتحكم فيها

5.1 فرضية الدماغ البايزي (The Bayesian Brain Hypothesis)

perhaps هذا هو الجزء الأكثر إثارة وتعمقًا في الكتاب، حيث ي argues تشيفرز أن الدماغ البشري هو أفضل جهاز بايزي على الإطلاق. تقول فرضية الدماغ البايزي أن المخ لا يعمل كمستقبل سلبي للمنبهات الحسية، بل كـآلة تنبؤية prediction machine نشطة تبني باستمرار نموذجًا داخليًا internal model للعالم based على معتقداتها السابقة (Priors)، ثم تقارن تنبؤات هذا النموذج بالمدخلات الحسية الواردة من العالم الحقيقي (Evidence).
الفرق بين التنبؤ والحقيقة يسمى "خطأ التنبؤ"، وعملية التعلم والإدراك هي عملية تقليل هذا الخطأ minimising prediction error من خلال:

  • تعديل النموذج الداخلي (التحديث البايزي): أي تغيير المعتقدات لتتلاءم مع البيانات الجديدة.

  • أو القيام بفعل (الاستدلال النشط Active Inference): أي تغيير العالم الخارجي أو موضع الحواس لتتلاءم مع التوقعات (مثال: إدارة الرأس للنظر إلى شيء ما بشكل أوضح).

5.2 الإدراك الحسي كـ "هلوسة مُتحكم فيها" (Controlled Hallucination)

يذهب تشيفرز إلى أبعد من ذلك، ليصف الوعي الإنساني نفسه على أنه "هلوسة مُتحكم فيها". ما نراه ونسمعه ونتذوقه هو ليس انعكاسًا مباشرًا للواقع، بل هو أفضل تخمين Bayesian best guess للدماغ about أسباب هذه المدخلات الحسية، بناءً على خبراته السابقة. هذا يفسر ظواهر مثل الخدع البصرية optical illusions، حيث يتغلب التوقع (Prior) على البيانات الحسية الفعلية (Evidence).

مثال مكعب نيكر Necker Cube: وهو رسم مكعب يمكن رؤيته من زاويتين مختلفتين. الدماغ لا يعرف أيتهما الصحيحة، فيقفز بينهما، لأنه يحاول تطبيق أفضل نموذج تنبؤي على البيانات الغامضة. توقعاتك السابقة (أي كيف رأيت المكعب آخر مرة) تحدد ما تراه الآن.

5.3 الصحة العقلية والمرض: عندما تفشل آلية بايز

يطبق الكتاب هذا الإطار أيضًا على فهم بعض اضطرابات الصحة العقلية:

  • انفصام الشخصية (Schizophrenia): قد ينتج عن ضعف في القبليات الأولية weak priors، حيث لا يستطيع الدماغ بناء توقعات قوية، فتطغى عليه المدخلات الحسية الداخلية (مثل الأفكار الداخلية) فيفسرها كأصوات أو أوامر coming from الخارج.

  • الاكتئاب Depression): قد يكون نتيجة قبليات أولية سلبية وقوية جدًا entrenched negative priors، حيث أن الأدلة الإيجابية من العالم (مثل المدح أو النجاح) لا تكون قوية enough لتحديث هذا المعتقد السلبي الراسخ بشكل كاف.

  • المخدرات النفسية Psychedelics: قد تعمل على تفكيك هذه القبليات الأولية الصلبة temporarily dismantling these rigid priors، مما يسمح للدماغ بتشكيل نماذج جديدة للعالم وربما يساعد في علاج الاكتئاب والإدمان.

مبدأ الطاقة الحرة - نظرية كل شيء؟

يلمح تشيفرز إلى الإطار النظري الأكثر شمولاً الذي طوره العالم  Karl Friston، وهو "مبدأ الطاقة الحرة Free Energy Principle"، الذي يمتد بعيدًا خلف الإدراك ليشمل كل الكائنات الحية. باختصار، المبدأ يقول أن أي نظام viable (من خلية واحدة إلى إنسان إلى مجتمع) يسعى إلى البقاء على قيد الحياة من خلال التقليل "الطاقة الحرة" - which هي في جوهرها خطأ التنبؤ  نفسه. يفعل النظام ذلك عبر:

  1. تغيير نموذجه الداخلي (الإدراك - Perception).

  2. أو تغيير واقعه الخارجي عبر الأفعال (الفعل - Action).
    هذا يجعل من الإحصاء البايزي والاستدلال النشط Active Inference ضرورة بيولوجية أساسية لأي شكل من أشكال الحياة!.

الفصل السابع: انتقادات وحدود المنظور البايزي

على الرغم من حماس تشيفرز، إلا أنه لا يقدم النظرية كـحل سحري . فهو ينقل بعض الانتقادات الموجهة لها:

  • مشكلة الاحتمال الأولي (Prior): من يحدد الاحتمال الأولي؟ وكيف نتفق عليه؟ إذا كان شخصان لديهما معتقدات أولية متطرفة ومختلفة، فقد يحتاجان إلى كم هائل من الأدلة للتوفيق بين وجهات نظرهما. هذا يفسر الاستقطاب السياسي والفكري حتى في وجود نفس "الحقائق".

  • الإفراط في التبسيط Overfitting: قد يكون النموذج البايزي معقدًا جدًا لدرجة أنه يصف بيانات الماضي لكن كا يفشل في التنبؤ بالمستقبل بشكل جيد.

  • الذاتية Subjectivity: ينتقد التكراريون البايزية لإدخالها عنصرًا ذاتيًا (الاحتمال الأولي) في العلم الذي يفترض أن يكون موضوعيًا. رغم أن البايزيين يردون بأن تجاهل المعرفة السابقة هو نفسه قرار ذاتي.
    ويشير تشيفرز إلى أن معظم الإحصائيين اليوم ليسوا في معسكر نقي صرف، بل يأخذون أدوات من كلا المدرستين حسب ما يناسب المشكلة .

 كيف تفكر بايزيًا في حياتك اليومية؟

يختم توم تشيفرز كتابه بتقديم نصائح عملية للقارئ العادي لتبني العقلية البايزية في حياته اليومية لتحسين التفكير واتخاذ القرار:

  1. تجنب اليقين المطلق: لا تضع احتمالات 0% أو 100% لأي فكرة. دائمًا اترك مساحة صغيرة لعدم اليقين.

  2. اسأل عن المعدل الأساسي: عند تقييم موقف جديد (مثل فرصة استثمار ما)، ابدأ بالسؤال: "ما هو المعدل الأساسي للنجاح في المشاريع المشابهة؟".

  3. ابحث عن الأدلة التي تخالف اعتقادك: قاوم انحياز التأكيد تأكيد التحيز بواسطه باحثًا التنشيط عن معلومات وأدلة قد تثبت خطأك، وليس فقط ما يؤيدك.

  4. قم بالتحديث تدريجيًا: عندما تظهر أدلة جديدة، عدّل من قناعاتك بشكل تدريجي متناسب إلى قوة هذا الدليل.

  5. فكر في الاحتمالات رقميًا: حاول أن تخصص احتمالات رقمية (20%، 65%...) لمعتقداتك، فهذا يجبرك على being أكثر دقة في تقييمك.

الكتاب ليس مجرد شرح لنظرية إحصائية، بل هو دعوة للتريث وعدم القفز إلى الاستنتاجات، ودعوة للتواضع الفكري  والانفتاح على تحديث أفكارنا باستمرار في رحلة مستمرة للوصول إلى فهم أفضل لعالم لا يمكن التنبؤ به تمامًا، لكن يمكن فهمه بشكل أفضل بكثير باستخدام الأدوات المناسبة.

 بايز يعدك أنك ستقرأ هذا الملخص، وقبل أن تقرأه، كانت لديك احتمالات أولية معينة عن جودة الكتاب، والآن، بعد هذه الأدلة، حان الوقت لتحديث تلك الاحتمالات

إرسال تعليق

0 تعليقات