دليل قاعدة بايز

قاعدة بايز أو مبرهنة بايز هي قانون في الاحتمالات يحكم قوة الدليل – القانون الذي يخبرنا إلى أي مدى يجدر بنا مراجعة احتمالاتنا (تغييرنا لأفكارنا) حين نعرف حقيقةً جديدةً أو نلاحظ دليلًا جديدًا.

قد ترغب في تعلّم قاعدة بايز إذا كنت:

محترفًا يستعمل الإحصاء، كأن تكون عالمًا أو طبيبًا؛
مبرمج حاسوب يعمل على تعلم الآلة؛
كائنًا بشريًّا.

وكما يقول فيليب تيتلوك (Philip Tetlock) حين دراسته لـ”المتنبئين الخارقين”، أي الأشخاص ذوي القدرات الجيدة والاستثنائية في توقع أحداث المستقبل:⁠⁠أ

المتبنؤون الخارقون هم حفنة من الرقميين: العديد منهم يعرف مبرهنة بايز ويستطيع استخدامها إذا شعر بالحاجة لذلك. إلا أنهم نادرًا ما يتناولون الأرقام بشكلٍ صريح. الأهم من مبرهنة بايز بالنسبة للمتنبئين الخارقين هو جوهر تأملات بايز المتمثل في الاقتراب تدريجيًّا من الحقيقة من خلال التحديث المتناسب مع وزن الدليل.

تعلّم قاعدة بايز

يستعمل دليل قاعدة بايز هذا تكنولوجيا Arbital ليتيح عدة تنويعات لهذه المقدمة. تختلف حسب المستوى التقني، والسرعة، والمواضيع المغطاة. تذكّر أنه لا يزال بإمكانك التغيير بين المسارات حتى بعد اختيارك لمسارٍ ما، وبالتدقيق من خلال استعمال أزرار “ماذا يعني هذا؟” و”التقدم بسرعة”.

أي الحالات تناسبك أكثر؟

أريد اكتساب معرفة نظرية وتطبيقية أساسية لفهم قاعدة بايز.*

1. مخططات التكرار: لمحة من قاعدة بايز

يتركّز منطق بايز على كيفية مراجعتنا لمعتقداتنا على ضوء الأدلة الجديدة.

سنبدأ بالسيناريو الأول حيث قوة الدليل ممثلة بأرقام واضحة مرتبطة بها.

(لا تقلق إن لم تكن تعرف طريقة حلّ هذه المسألة. فسنرى طريقة الحل بعد قليل).

تخيّل أنّك ممرض أو ممرضة تفحص مجموعة من التلاميذ لتكشف عن مرضٍ يدعى ديسيزتيس (Diseasitis)⁠⁠ب.

أنت تعرف من خلال دراسة مجموعات سكانية سابقة، أن حوالي 20% من التلاميذ سيتعرضون للديسيزتيس خلال هذه الفترة من السنة.

أنت تفحص وجود الديسيزتيس باستعمال خافض لسانٍ يغيّر لونه، والذي يتحوّل إلى الأسود عادةً إذا كان التلميذ مصابًا بالديسيزتيس.

يسودّ خافض اللسان عند 90% من المفحوصين المصابين بالديسيزتيس.
ومع ذلك فخافض اللسان ليس مثاليًّا، فهو يسودّ 30% من المرات مع تلاميذ أصحّاء.

أتى أحد تلاميذك إلى المكتب، اجتاز الفحص، واسودّ لون خافض اللسان. ما احتماليّة أن يكون مصابًا بالديسيزتيس؟

(إذا كنت تعتقد أنك تعرف طريقة حلّ المسألة، يمكنك محاولة حلّها قبل المواصلة. ومن أجل معرفة صحّة جوابك بسرعة، يمكنك تمديد زر “الإجابة” أدناه؛ سنضع الاستنتاج فيما بعد).

يمكن حلّ المسألة بطريقة صعبةٍ أو بطريقةٍ ذكيّةٍ وسهلة. سنرى الطريقة الصعبة أوّلًا.

أوّلًا، نتخيّل مجموعةً سكانيةً مكونةً من 100 تلميذ، حيث 20 منهم مصاب بالديسيزتيا و80 غير مصابين⁠⁠ج.

الصورة تُظهر كيساً بنياً يحتوي على 42 دائرة تمثل تلاميذ، منها 18 دائرة حمراء (تمثل المصابين بديسلكسيا) و24 دائرة زرقاء (تمثل غير المصابين). يد بيضاء تمتد لالتقاط دائرة عشوائية من الكيس.

90% من التلاميذ المصابين يُسوِّدون خافض اللسان، و30% من التلاميذ الأصحاء يسوّدون خافض اللسان. ولذا فإننا نرى خافضي اللسان سودًا على $90\% \times 20 = 18$ تلميذًا مصابًا، و $30\% \times 80 = 24$ تلميذًا صحيحًا.

الصورة تُظهر مخططاً توضيحياً يحوي مجموعتين من الأيقونات المبتسمة: 18 أيقونة حمراء تمثل المصابين، و24 أيقونة زرقاء تمثل الأصحاء. جميعهم لديهم خافض لسان أسود اللون.

ما احتماليّة أن يكون تلميذ بخافص لسان أسود مصابًا بالديسيزتيس؟ من خلال المخطط، هناك 18 تلميذًا مصابًا بخافض لسان أسود. $18 + 24 = 42$ تلميذًا في المجموع سوّدوا خافض لسانهم. تخيّل أنك تضع يدك في كيسٍ مليءٍ بتلاميذ مع خافضي لسان سود، ثم تلتقط منه أحد التلاميذ عشوائيًّا؛ ما احتمالية أن يكون أحد هؤلاء التلاميذ مصابًا؟

الصورة تُظهر مجموعة من 42 تلميذاً، مقسمة إلى مجموعتين: 18 رمزاً باللون الأحمر يمثلون المصابين، و24 رمزاً باللون الأزرق يمثلون الأصحاء، داخل كيس بني اللون.

الجواب النهائي أن المفحوص بخافض لسان أسود له احتمالية $\frac{18}{42} = \frac{3}{7} \approx 43\%$ أن يكون مصابًا.

يجد العديد من طلبة الطب هذه الإجابة غير منطقية بداهةً: الفحص يكشف مرض الديسيزتيس 90% من المرات! فلماذا نجد احتمالية إصابة الفاحص بالديسيزتيس أقل من 50%؟ طيب، يكشف الفحص خاطئًا أيضًا وجود الديسيزتيس 30% من المرات عند الفاحص الصحيح، ولدينا عددٌ أكبر من المفحوصين الأصحاء مما لدينا من المفحوصين المصابين.

يقدّم لنا الفحص دليلًا لصالح كون المفحوص مصابًا. ترتفع احتمالية إصابة المفحوص من 20% قبل الفحص، إلى 43% بعد أن نرى خافض اللسان قد اسود. إلا أن هذا الدليل غير حاسم، فنحتاج القيام بفحوصاتٍ أخرى، قد تكون أغلى.

إذا كنت ترى نفسك فاهمًا لإعدادات هذه المسألة، ففكٍّر في محاولة إجابة هذا السؤال قبل المواصلة: ما احتمالية أن يكون التلميذ الذي لا يُسوّد خافض اللسان –التلميذ الذي له نتيجة فحصة سلبية- مصابًا بالديسيزتيس؟ مرةً أخرى، نبدأ بمجموعة فيها 20% من التلاميذ مصابون و80% تلاميذ أصحاء، 70% من التلاميذ الأصحاء سيحصلون على نتيجة فحص سلبية، و10% من التلاميذ المصابين فقط سيحصلون على نتيجة فحص سلبية.

والآن لننتقل إلى طريقةٍ أسرع وأسهل لحلّ المسألة.

2. مخططات الشلال والأرجحيات النسبية

تخيّل شلالًا به مجريا ماء في الأعلى، مجرى أحمر وآخر أزرق. يتقارب هذين المجريين بشكل منفصلٍ في أعلى الشلال، مع انحراف كميةٍ من المياه من كلال المجريين خلال الطريق، أما بقية المياه فإنها تسقط في حوضٍ مشتركٍ بالقاع.

الصورة تُظهر رسماً تخطيطياً لشلال مائي به مجريان متوازيان: أحدهما باللون الأحمر والآخر باللون الأزرق. يتدفق المجريان من أعلى الشلال الصخري وينحدران نحو الأسفل حيث يلتقيان في حوض مشترك، مع تدرج لوني بينهما.

تخيّل التالي:

تتدفق في قمة الشلال 20 جالونًا/الثانية من المياه الحمراء، وتتدفق نحو الأسفل 80 جالونًا/الثانية من المياه الزرقاء.
تصل 90% من المياه الحمراء إلى القاع.
تصل 30% من المياه الزرقاء إلى القاع.

من بين المياه الأرجوانية التي تصل إلى الحوض السفلي، كم قدر المياه التي كانت قادمةً في الأصل من المجرى الأحمر؟ وكم قدر المياه التي كانت قادمة في الأصل من المجرى الأزرق؟

وهذه المسألة موافقةٌ هيكليًّا لمسألة مرض الديسيزتيس السابق:

20% من المفحوصين في المجموعة السكانية المدروسة مصابون بمرض الديسيزتيس.
90% من المصابين بالديسيزتيس يُسوّدون خافض اللسان.
30% من المفحوصين غير المصابين بالديسيزتيس سيُسوِّدون خافض اللسان أيضًا.

نسبة 20% من المفحوصين المصابين مماثلة لكمية 20 جالونًا/الثانية من المياه الحمراء؛ ونسبة 80% من المفحوصين الأصحاء تماثل 80 جالونًا/الثانية من المياه الزرقاء:

الصورة تُظهر رسمًا تخطيطيًا لشلال مائي به مجريان: أحمر يمثل 20% ويقع على اليسار، وأزرق يمثل 80% ويقع على اليمين. يلتقي المجريان في الأسفل مكونين لونًا أرجوانيًا عند نقطة التقائهما.

نسبة 90% من المفحوصين المصابين الذين يسوّدون خافض اللسان تماثل نسبة 90% من المياه الحمراء التي تصل إلى قاع الشلال. نسبة 30% من المفحوصين الأصحاء الذين يُسوّدون خافض اللسان تماثل نسبة 30% من المياه الزرقاء التي تصل إلى الحوض السفلي.

الصورة تظهر رسماً تخطيطياً لشلال مائي به مجريان: أحمر (90%) وأزرق (30%). يتدفق الماء من المجريين إلى حوض سفلي حيث يختلط ليصبح أرجوانياً. النسب المئوية تشير إلى كمية المياه المتدفقة من كل مجرى.

ولهذا فالسؤال الذي يقول: “ما نسبة المياه في الحوض النهائي التي كانت قد جاءت من المجرى الأحمر؟” له نفس جواب السؤال القائل: “ما نسبة المفحوصين الذين سوّدوا خافض اللسان وهم مصابون بالديسيزتيس؟”.

والآن ننتقل إلى الطريقة الأسرع في الإجابة على هذا السؤال.

ننطلق من حالة ابتدائيةٍ حيث لدينا من المياه الزرقاء 4 أضعاف المياه الحمراء في قمة الشلال.

وبعد ذلك، كلّ جزيء ماء أحمر يمكن أن يصل إلى الحوض المشترك بنسبة 90%، وكل جزيء ماء أزرق يمكن أن يصل إلى الحوض بنسبة 30%. (90% من المياه الحمراء و30% من المياه الزرقاء تصل إلى القاع). وبالتالي فإن كل جزيء ماء أحمر له إمكانية وصول إلى القاع 3 أضعاف إمكانية وصول جزيء الماء الأزرق ( $\frac{0.90}{0.30} = 3$ ).

والآن اضرب النسب الأولية $1:4$ للمياه الحمراء مقابل المياه الزرقاء في الإمكانات النسبية $3:1$ لتصل إلى النسب النهائية $(1\cdot3):(4\cdot1) = 3:4$ ، ما يعني أن الحوض النهائي فيها 3 أجزاء المياه الحمراء و4 أجزاء المياه الزرقاء.

الصورة تُظهر رسمًا توضيحيًا لشلال مائي به مجريان: أحمر (20%) وأزرق (80%). يتدفق المجرى الأحمر بنسبة 90% والأزرق بنسبة 30% ليلتقيا في حوض سفلي بنسبة 3 أجزاء حمراء و4 أجزاء زرقاء.

لتحويل هذه الحصص النسبية إلى احتمالية مطلقة في أن يكون أحد الجزيئات في الواقع أحمر، نحسب $\frac{3}{3+4}$ لنجد أن 3 أسباع (حوالي 43%) المياه في الحوض المشترك تأتي من المجرى الأحمر.

الحصص نفسها في $18:24$ مفحوصًا مصابًا بنتيجة موجبة، مقابل المفحوصين الأصحاء الذين حصلوا على نتائج فحص موجبة، والتي نحصل عليها بالتفكير في وجود 100 مفحوص.

ولهذا فلكي تحلّ مسألة الديسيزتيس في ذهنك، عليك أن تحوّل مسألة الكلمات هذه:

20% من المفحوصين في المجموعة السكانية المدروسة مصابون بالديسيزتيس. 90% من المصابين بالديسيزتيس يُسوّدون خافض اللسان، و30% من المفحوصين غير المصابين بالديسيزتيس يُسوّدون خافض اللسان. بالعلم أنّ المفحوص سوّد خافض اللسان، فما احتمالية أن يكون مصابًا بالديسيزتيس؟

إلى هذه الحسابات:

طيب، فالأرجحيات الأولية هي $20\%:80\% = (1:4)$ ، والإمكانات هي $(90\%:30\%) = (3:1)$ . ضرب هذه الحصص النسبية يعطينا الأرجحيات النهائية $(3:4)$ ، والتي نحوّلها إلى احتماليةٍ قدرها 3 أسباع.

(قد يصعب عليك تحويل $\frac{3}{7}$ إلى 43% في ذهنك مباشرةً، لكن يمكنك التخمين أنها أقلّ من 50% بقليل).

يمكنك إجراء حساباتٍ مماثلة لهذه المسألة:

90% من الأدوات صالحة و10% منها فاسدة.
12% من الأدوات الفاسدة تُطلق شررًا.
4% فقط من الأدوات الصالحة تُطلق شررًا.

ما نسبة الأدوات المُلطقة للشرر التي هي فاسدة؟ إذا كنت مرتاحًا إلى حدٍّ ما مع هذه المعطيات، فحاول حلّ المسألة كاملةً في ذهنك.

(يمكنك تصوّرها على شكل شلّالٍ فيه أدوات صالحة وفاسدةٌ في القمة، ولا تصل إلى الحوض المشترك إلى الأدوات المُطلقة للشرر).

أظهر الجواب

هناك $(1:9)$ أدوات فاسدة مقابل الصالحة.
الأدوات الفاسدة مقابل الصالحة لها أرجحية نسبيّة لإطلاق الشرر قدرها $(12:4)$ .
يمكننا تبسيطها إلى $(1:9)\times(3:1)=(1:3)$ ، 1 أداة فاسدة مطلقة للشرر مقابل 3 أدوات صالحة مطلقة للشرر.
وهو ما يمكن تحويله إلى $\frac{1}{(1+3)}=\frac{1}{4}=25\%$ أي أن 25% من الأدوات المطلقة للشرر فاسدة.

رؤية الشرر لا يجعلنا “نعتقد أن الأداة فاسدة”؛ فقد وجدنا أن الاحتمالية تُقدّر بنسبة 25%، وهذا أقل من 50/50. لكن هذا لا يعني أيضًا أن نقول “لا زلت أعتقد أن الأداة صالحة!” ثم نرمي الدليل عرض الحائط ونتجاهله. فالأداة السيئة لها إمكانيةٌ أكبر نسبيًّا لإطلاق الشرر، وبالتالي فإن رؤيتنا للدليل يجب أن تجعلنا نفكّر بإمكانية نسبية أكبر في أن الأداة فاسدة، حتى إن كانت الاحتمالية لا تتجاوز 50%. إذ نرفع احتمالاتنا من 10% إلى 25%.

الشلالات إحدى طرق تمثيل “نموذج الأرجحيات” لـ”قاعدة بايز”، والتي تنصّ على أن الأرجحيات الأوليّة مضروبةً في الإمكانات النسبية تساوي الأرجحيّات البعدية. بالمقابل يمكن رؤية هذه القاعدة كتقعيد لعبارة “قوة الدليل” أو “إلى أي مدى يجب على دليلٍ ما أن يجعلنا نراجع اعتقاداتنا”. سنلقي نظرةً أكثر عموميةً على هذا الموضوع تاليًا.

3.

يُفترض أن تُقرأ هذه المقدمة بعد قراءة مقدمات حول تمثيلات التكرار وكذا تمثيلات الشلال.

تنصّ قاعدة بايز عمومًا على الآتي:

\text{الأرجحيات الأولية} \times \text{الإمكانات النسبية} = \text{الأرجحيات البعدية}

إذا أخذنا مثال مرض الديسيزتيس من خلال تمثيل الشلال، فيمكننا تمثيل مدى ملاءمة الاحتمالات النسبية للتفكير في نهرين أعلى الشلال.

الصورة تظهر رسماً توضيحياً لشلال مائي به مجريان: أحمر يمثل 20% من التدفق، وأزرق يمثل 80%. المجريان يتدفقان لأسفل ويختلطان ليشكلا لوناً أرجوانياً عند قاع الشلال.

تظل حصة المياه الحمراء مقابل الزرقاء نفسها سواءً كانت 200 مقابل 800 جالون في الثانية للحمراء مقابل الزرقاء في قمة الشلال، أو كانت 20,000 مقابل 80,000 جالون/ثانية، أو 1 مقابل 4 جالونات/ثانية. ما دامت بقية الشلال تتصرف بالحصص، فإننا سنحصل على نفس نسبة الحمراء مقابل الزرقاء بالقاع. ولهذا فمن المبرر تجاهل كمية المياه، والتركيز على الحصة النسبية بين الأحجام.

وعلى نفس الشاكلة فما يهم هو الحصة النسبية حول المقدار الذي يصل إلى الحوض المشترك من كلّ جالونِ مياهٍ حمراء، ومقدار كلّ جالون من المياه الزرقاء يصل إلى الحوض أيضًا. وصول 45% و15% من المياه الحمراء والزرقاء إلى القاع له نفس الحصة النسبية لوصول 90% و30% من المياه الحمراء والزرقاء إلى الحوض السفلي.

الصورة تُظهر رسمين توضيحيين متجاورين لشلالين مائيين، كل منهما به مجريان: أحمر (20%) وأزرق (80%). في الرسم الأول يصل 90% و30% من المجريين للقاع، وفي الثاني 45% و15%، موضحاً تساوي النسب النسبية في الحالتين.

وهذا يبرّر إقصاءنا للمعلومة القائلة أن 90% من مياه المجرى الأحمر و30% من مياه المجرى الأزرق تصل إلى القاع، واختصار ذلك إلى الإمكان النسبي (3 : 1).

ولنعمّم أكثر، لنفترض أن لدينا فحصا طبيًّا يكشف عن مرضٍ ما بمعدل 90% موجب حقيقي (10% سلبي كاذب) ومعدل 30% موجب كاذب (70% سلبي حقيقي). النتيجة الموجبة في هذا الفحص تمثّل نفس قوة الدليل في فحص فيه 60% موجبة حقيقي و20% موجب كاذب. النتيجة السلبية في هذا الفحص تمثل نفس قوة الدليل في فحص فيه 9% سلبية خاطئة و63% سلبية حقيقية.

وفي المجمل، تلخّص قوّة الدليل بمدى نسبة إمكان تشكيل مختلف حالات العالم لملاحظاتنا. للمزيد حول هذه الفكر اطّلع على قوة الدليل البايزي.

المعادلة

أوّلًا، حين يكون $X$ قضيةً، فإن $P(X)$ يعني احتمالية Χ.

وبعبارة أخرى فإن $X$ هو أمرٌ إما أن يكون صحيحًا أو خاطئًا في الواقع إلا أنّنا لسنا متأكدين منه، و $P(X)$ هي طريقة تعبيرنا لدرجة إيماننا بأن $X$ صحيح. فالمفحوص في الواقع إما أن يكون مصابًا فعلًا أو صحيحًا؛ لكن إذا لم نكن نعرف أي الحالتين صحيحة، فقد يقودنا الدليل إلى تحديد احتمال ذاتيٍّ قدره 43% بأن المفحوص مصاب.

$\neg X$ تعني ” $X$ خاطئ”، ولذا فإن $P(\neg X)$ تعني “احتمالية أن يكون $X$ خاطئًا”.

يحتوي مثال مرض الديسيزتيس عباراتٍ أكثر تعقيدًا من هذا، إلا أنها تشمل بالخصوص ما يلي:

احتمال قدره 90% في أن يُسوِّد المفحوص خافض اللسان، مع العلم أنه مصاب بالديسيزتيس.
احتمال قدره 30% في أن يسوّد المفحوص خافض اللسان، مع العلم أنه صحيح.
احتمال قدره 3/7 في أن يكون المفحوص مصابًا بالديسيزتيس، مع العلم أنه سوّد خافض اللسان.

في هذه الحالات نحن نريد الانتقال من بعض الحقائق التي نفترض أو نعرف أنها صحيحة (على اليسار)، إلى بعض القضايا (على اليمين) لها احتمالية جديدة نريد دراستها، مع الأخذ بعين الاعتبار تلك الافتراضات.

تُعرف مثل عبارات تلك الاحتمالات على أنها “احتمالات شرطية”. الترميز القياسي للاحتمالات الشرطية يُعبِّر عن الكميات المذكورة أعلاه كالتالي:

$P(\text{اسود} \mid \text{مريض})=0.9$
$P(\text{اسود} \mid \neg \text{مريض})=0.3$
$P(\text{مريض} \mid \text{اسود})=\frac{3}{7}$

هذا الترميز القياسي $P(X \mid Y)$ يعني “احتمالية حدوث $X$ ، مع افتراض أن $Y$ صحيح” وهذا نص متماثل عموديًّا نرجو أن يكون مفيدًا، دون أن نضطر إلى تلميحات بصرية لتتذكر أن الافتراض موجود على اليسار وأن القضية المستنجة على اليمين.

تُعرّف الاحتمالية الشرطية كالتالي. مع استعمال الترميز $X \land Y$ للدلالة على ” $X$ و $Y$ ” أو “كلًّا من $X$ و $Y$ صحيح”:

P(X \mid Y) := \frac{P(X \land Y)}{P(Y)}

مثلًا: في مثال الديسيزتيس، نحسب $P(\text{مريض} \mid \text{اسود})$ من خلال قسمة نسبة 18% من التلاميذ المصابين والذين سوّدوا خافض اللسان $P(\text{مريض} \land \text{اسود})$ ، على مجموع 42% من التلاميذ الذين سوّدوا خافض اللسان $P(\text{اسود})$ .

أو $P(\text{اسود} \mid \neg \text{مريض})$ احتمالية تسويد خافض اللسان مع العلم أنه صحيح، وهي مماثلة لـ24 تلميذا الذين هم أصحاء وقد سوّدوا خافض اللسان، مقسمةً على 80 تلميذًا من التلاميذ الأصحاء. $\frac{24}{80} = \frac{3}{10}$ ، ولذا فهذا يتوافق مع نسبة 30% من الموجب الكاذب التي تحدثنا عنها في البداية.

يمكننا أن ننظر إلى قانون الاحتمالية الشرطية على أنه يقول: “دعونا نقصُر نظرنا على العوالم حيث Y هو الحال، أو الأشياء التي يكون فيها Y صحيحًا. وبالنظر فقط إلى الحالات التي يكون فيها Y صحيحًا، كم عدد الحالات داخل هذا التحديد التي نجد فيها X صحيحًا أيضًا – حالات X وY؟”.

للمزيد حول هذا انظر الاحتمالية الشرطية.

قاعدة بايز

تقول قاعدة بايز:

\text{الأرجحيات الأولية} \times \text{نسبة الإمكان} = \text{الأرجحيات البعدية}

في مثال الديسيزتيس، هذا يعني:

\frac{P(\text{مريض})}{P(\text{سليم})} \times \frac{P(\text{اسود} \mid \text{مريض})}{P(\text{اسود} \mid \text{سليم})} = \frac{P(\text{مريض} \mid \text{اسود})}{P(\text{سليم} \mid \text{اسود})}

تشير الأرجحيات الأولية إلى الحصة النسبية للمفحوصين المصابين مقابل الأصحاء، وهي $(1 : 4)$ . تحويل هذه الأرجحيات إلى احتمالات يعطينا التالي: $P(\text{مريض}) = \frac{1}{4+1} = \frac{1}{5} = 20\%$ .

تشير الإمكانات النسبية إلى مدى إمكانية حصول كل مفحوص مصاب على نتيجة فحص موجبة مقارنة بكل مفحوص صحيح، وهي (باستعمال ترميز الاحتمالية الشرطية) كالتالي: $\frac{P(\text{موجب} \mid \text{مريض})}{P(\text{موجب} \mid \text{سليم})} = \frac{0.90}{0.30}$ ، ويمكن التعبير عنها بالإمكان النسبي $(3:1)$ .

الأرجحيات البعدية هي الحصص النسبية للمفحوصين المصابين مقابل المفحوصين الأصحاء ضمن أولئك الذين كانت نتائج فحصهم موجبة، أو $\frac{P(\text{مريض} \mid \text{موجب})}{P(\text{سليم} \mid \text{موجب})} = \frac{3}{4}$ ، ويمكن التعبير عنها بنسبة $(3:4)$ مرجحة.

لاستخراج الاحتمالية من الأرجحيات النسبية، علينا أن نتذكر أن مجموع احتمالات القضايا الحصرية والشاملة في نفس الوقت يجب ألا يتجاوز 1، أي في تلك الحالة هناك احتمال بنسبة 100% لحدوث شيءٍ ما. وبما أن الكلّ إما أن يكون مصابًا أو غير مصاب، فيمكننا تحويل نسبة الأرجحية $(3:4)$ إلى الصيغة القياسية من خلال قسمة مجموع الحدود:

\left(\frac{3}{3+4} : \frac{4}{3+4}\right) = \left(\frac{3}{7} : \frac{4}{7}\right) \approx (0.43 : 0.57)\

.. لينتهي بنا المطاف إلى $(0.43 : 0.57)$ ، متناسبة مع الحصة الأصلية $(3 : 4)$ ، إلا أنها مقسومةً على 1. وسيكون الأمر غريبًا إذا كان لشيء ما احتمالية الحدوث مساويةً للعدد 3 (أي احتمالية بنسبة 300%).

باستعمال تمثيل الشلال:

الصورة توضح رسماً تخطيطياً على شكل شلال يبين حساب قاعدة بايز. يظهر تدفق الاحتمالات من الأعلى حيث الأرجحيات الأولية (1:4) مروراً بنسبة الإيجابية (3:1) وصولاً إلى الاحتمالية البعدية (3/7).

يمكنني تعميم هذا مع أي فرضيتين أخريتين $H_j$ و $H_k$ مع الدليل $e$ ، في هذه الحالة يمكننا كتابة قاعدة بايز كالتالي:

\frac{P(H_j)}{P(H_k)} \times \frac{P(H_j)}{P(H_k)} = \frac{P(e)}{P(e)}

وهو ما يعني “نسبة الأرجحيات البعدية للفرضية $H_j$ مقابل $H_k$ (بعد رؤية الدليل $e$ ) تساوي نسبة الأرجحيات الأولية مضروبةً في نسبة جودة توقع $H_j$ للدليل مقارنةً بالفرضية $H_k$ ”.

إذا كانت الفرضيتان $H_j$ و $H_k$ حصريّتان وشاملتان في نفس الوقت، فيمكننا تحويل الأرجحيات البعدية إلى احتمالات بعدية للفرضية $H_j$ من خلال تحويل الأرجحيات إلى الصيغة القياسية – قسمة نسبة الأرجحيات على مجموع الحدود، بحيث يكون مجموع عناصر النسبة الجديدة مجموعة إلى 1.

برهان قاعدة بايز

نعيد ترتيب تعريف الاحتمالية الشرطية $P(X \land Y) = P(Y) \cdot P({X} \mid {Y})$ . على سبيل المثال: لإيجاد “نسبة جميع المفحوصين الذين هم مصابون وتلقوا نتيجة موجبة” نضرب “نسبة المفحوصين المصابين” في “احتمالية أن يسوّد مفحوص مصابٌ خافضَ اللسان”.

ومن ثمّ فهذا برهان قاعدة بايز:

\frac{P(H_j)}{P(H_k)} \cdot \frac{P({e_0} \mid {H_j})}{P({e_0}\mid{H_k})} = \frac{P(e_0 \land H_j)}{P(e_0 \land H_k)} = \frac{P(H_j \land e_0)/P(e_0)}{P(H_k \land e_0)/P(e_0)} = \frac{P({H_j}\mid{e_0})}{P({H_k}\mid{e_0})}

وهو المطلوب إثباته.

في مثال الديسيزتيس، خطوات هذا البرهان تتوافق مع التالي:

\frac{0.20}{0.80} \cdot \frac{0.90}{0.30} = \frac{0.18}{0.24} = \frac{0.18/0.42}{0.24/0.42} = \frac{0.43}{0.57}

باستعمال الأحمر للمصابين، والأزرق للأصحاء، والرمادي لخليط من المفحوصين المصابين والأصحاء، وعلامات + لنتائج الفحص الموجبة، يمكننا تمثيل خطوات الحساب كالتالي:

الصورة تظهر خمسة أزواج من الدوائر توضح خطوات حسابية في نظرية بايز. تستخدم الألوان الأحمر والأزرق والرمادي وعلامات + لتمثيل نسب المصابين والأصحاء ونتائج الفحص الموجبة في كل مرحلة من المعادلة.

تسمى عملية ملاحظة الدليل واستعمال نسبة أرجحيته لتحويل اعتقاد أولي إلى اعتقاد بعدي بـ”التحديث البايزي” أو “مراجعة الاعتقاد”.

لتعميم نموذج الأرجحيات في قاعدة بايز إلى عدة فرضيات وعدة عناصر للدليل، انظر قاعدة بايز: النموذج الشعاعي.*
*لتحويل نموذج الأرجحيات لجعل قوة الدليل أكثر وضوحًا، انظر قاعدة بايز: نموذج الأرجحيات اللوغاريتمية.

المنشور الأصلي: Centre for Effective Altruism (2022) Bayes’ rule: Guide, Effective Altruism Forum.

ترجمة: بوشن مصطفى.

دليل قاعدة بايز

بقلم Centre for Effective Altruism

Teorema de Bayes

قد ترغب في تعلّم قاعدة بايز إذا كنت:

محترفًا يستعمل الإحصاء، كأن تكون عالمًا أو طبيبًا؛
مبرمج حاسوب يعمل على تعلم الآلة؛
كائنًا بشريًّا.

المتبنؤون الخارقون هم حفنة من الرقميين: العديد منهم يعرف مبرهنة بايز ويستطيع استخدامها إذا شعر بالحاجة لذلك. إلا أنهم نادرًا ما يتناولون الأرقام بشكلٍ صريح. الأهم من مبرهنة بايز بالنسبة للمتنبئين الخارقين هو جوهر تأملات بايز المتمثل في الاقتراب تدريجيًّا من الحقيقة من خلال التحديث المتناسب مع وزن الدليل.

تعلّم قاعدة بايز

أي الحالات تناسبك أكثر؟

أريد اكتساب معرفة نظرية وتطبيقية أساسية لفهم قاعدة بايز.*

1. مخططات التكرار: لمحة من قاعدة بايز

يتركّز منطق بايز على كيفية مراجعتنا لمعتقداتنا على ضوء الأدلة الجديدة.

سنبدأ بالسيناريو الأول حيث قوة الدليل ممثلة بأرقام واضحة مرتبطة بها.

(لا تقلق إن لم تكن تعرف طريقة حلّ هذه المسألة. فسنرى طريقة الحل بعد قليل).

تخيّل أنّك ممرض أو ممرضة تفحص مجموعة من التلاميذ لتكشف عن مرضٍ يدعى ديسيزتيس (Diseasitis)⁠⁠ب.

أنت تعرف من خلال دراسة مجموعات سكانية سابقة، أن حوالي 20% من التلاميذ سيتعرضون للديسيزتيس خلال هذه الفترة من السنة.

يسودّ خافض اللسان عند 90% من المفحوصين المصابين بالديسيزتيس.
ومع ذلك فخافض اللسان ليس مثاليًّا، فهو يسودّ 30% من المرات مع تلاميذ أصحّاء.

أتى أحد تلاميذك إلى المكتب، اجتاز الفحص، واسودّ لون خافض اللسان. ما احتماليّة أن يكون مصابًا بالديسيزتيس؟

يمكن حلّ المسألة بطريقة صعبةٍ أو بطريقةٍ ذكيّةٍ وسهلة. سنرى الطريقة الصعبة أوّلًا.

أوّلًا، نتخيّل مجموعةً سكانيةً مكونةً من 100 تلميذ، حيث 20 منهم مصاب بالديسيزتيا و80 غير مصابين⁠⁠ج.

الجواب النهائي أن المفحوص بخافض لسان أسود له احتمالية $\frac{18}{42} = \frac{3}{7} \approx 43\%$ أن يكون مصابًا.

والآن لننتقل إلى طريقةٍ أسرع وأسهل لحلّ المسألة.

2. مخططات الشلال والأرجحيات النسبية

تخيّل التالي:

تتدفق في قمة الشلال 20 جالونًا/الثانية من المياه الحمراء، وتتدفق نحو الأسفل 80 جالونًا/الثانية من المياه الزرقاء.
تصل 90% من المياه الحمراء إلى القاع.
تصل 30% من المياه الزرقاء إلى القاع.

وهذه المسألة موافقةٌ هيكليًّا لمسألة مرض الديسيزتيس السابق:

20% من المفحوصين في المجموعة السكانية المدروسة مصابون بمرض الديسيزتيس.
90% من المصابين بالديسيزتيس يُسوّدون خافض اللسان.
30% من المفحوصين غير المصابين بالديسيزتيس سيُسوِّدون خافض اللسان أيضًا.

والآن ننتقل إلى الطريقة الأسرع في الإجابة على هذا السؤال.

ننطلق من حالة ابتدائيةٍ حيث لدينا من المياه الزرقاء 4 أضعاف المياه الحمراء في قمة الشلال.

ولهذا فلكي تحلّ مسألة الديسيزتيس في ذهنك، عليك أن تحوّل مسألة الكلمات هذه:

20% من المفحوصين في المجموعة السكانية المدروسة مصابون بالديسيزتيس. 90% من المصابين بالديسيزتيس يُسوّدون خافض اللسان، و30% من المفحوصين غير المصابين بالديسيزتيس يُسوّدون خافض اللسان. بالعلم أنّ المفحوص سوّد خافض اللسان، فما احتمالية أن يكون مصابًا بالديسيزتيس؟

إلى هذه الحسابات:

طيب، فالأرجحيات الأولية هي $20\%:80\% = (1:4)$ ، والإمكانات هي $(90\%:30\%) = (3:1)$ . ضرب هذه الحصص النسبية يعطينا الأرجحيات النهائية $(3:4)$ ، والتي نحوّلها إلى احتماليةٍ قدرها 3 أسباع.

(قد يصعب عليك تحويل $\frac{3}{7}$ إلى 43% في ذهنك مباشرةً، لكن يمكنك التخمين أنها أقلّ من 50% بقليل).

يمكنك إجراء حساباتٍ مماثلة لهذه المسألة:

90% من الأدوات صالحة و10% منها فاسدة.
12% من الأدوات الفاسدة تُطلق شررًا.
4% فقط من الأدوات الصالحة تُطلق شررًا.

أظهر الجواب

هناك $(1:9)$ أدوات فاسدة مقابل الصالحة.
الأدوات الفاسدة مقابل الصالحة لها أرجحية نسبيّة لإطلاق الشرر قدرها $(12:4)$ .
يمكننا تبسيطها إلى $(1:9)\times(3:1)=(1:3)$ ، 1 أداة فاسدة مطلقة للشرر مقابل 3 أدوات صالحة مطلقة للشرر.
وهو ما يمكن تحويله إلى $\frac{1}{(1+3)}=\frac{1}{4}=25\%$ أي أن 25% من الأدوات المطلقة للشرر فاسدة.

3.

يُفترض أن تُقرأ هذه المقدمة بعد قراءة مقدمات حول تمثيلات التكرار وكذا تمثيلات الشلال.

تنصّ قاعدة بايز عمومًا على الآتي:

\text{الأرجحيات الأولية} \times \text{الإمكانات النسبية} = \text{الأرجحيات البعدية}

المعادلة

أوّلًا، حين يكون $X$ قضيةً، فإن $P(X)$ يعني احتمالية Χ.

$\neg X$ تعني ” $X$ خاطئ”، ولذا فإن $P(\neg X)$ تعني “احتمالية أن يكون $X$ خاطئًا”.

يحتوي مثال مرض الديسيزتيس عباراتٍ أكثر تعقيدًا من هذا، إلا أنها تشمل بالخصوص ما يلي:

احتمال قدره 90% في أن يُسوِّد المفحوص خافض اللسان، مع العلم أنه مصاب بالديسيزتيس.
احتمال قدره 30% في أن يسوّد المفحوص خافض اللسان، مع العلم أنه صحيح.
احتمال قدره 3/7 في أن يكون المفحوص مصابًا بالديسيزتيس، مع العلم أنه سوّد خافض اللسان.

$P(\text{اسود} \mid \text{مريض})=0.9$
$P(\text{اسود} \mid \neg \text{مريض})=0.3$
$P(\text{مريض} \mid \text{اسود})=\frac{3}{7}$

تُعرّف الاحتمالية الشرطية كالتالي. مع استعمال الترميز $X \land Y$ للدلالة على ” $X$ و $Y$ ” أو “كلًّا من $X$ و $Y$ صحيح”:

P(X \mid Y) := \frac{P(X \land Y)}{P(Y)}

للمزيد حول هذا انظر الاحتمالية الشرطية.

قاعدة بايز

تقول قاعدة بايز:

\text{الأرجحيات الأولية} \times \text{نسبة الإمكان} = \text{الأرجحيات البعدية}

في مثال الديسيزتيس، هذا يعني:

\frac{P(\text{مريض})}{P(\text{سليم})} \times \frac{P(\text{اسود} \mid \text{مريض})}{P(\text{اسود} \mid \text{سليم})} = \frac{P(\text{مريض} \mid \text{اسود})}{P(\text{سليم} \mid \text{اسود})}

\left(\frac{3}{3+4} : \frac{4}{3+4}\right) = \left(\frac{3}{7} : \frac{4}{7}\right) \approx (0.43 : 0.57)\

باستعمال تمثيل الشلال:

يمكنني تعميم هذا مع أي فرضيتين أخريتين $H_j$ و $H_k$ مع الدليل $e$ ، في هذه الحالة يمكننا كتابة قاعدة بايز كالتالي:

\frac{P(H_j)}{P(H_k)} \times \frac{P(H_j)}{P(H_k)} = \frac{P(e)}{P(e)}

برهان قاعدة بايز

ومن ثمّ فهذا برهان قاعدة بايز:

\frac{P(H_j)}{P(H_k)} \cdot \frac{P({e_0} \mid {H_j})}{P({e_0}\mid{H_k})} = \frac{P(e_0 \land H_j)}{P(e_0 \land H_k)} = \frac{P(H_j \land e_0)/P(e_0)}{P(H_k \land e_0)/P(e_0)} = \frac{P({H_j}\mid{e_0})}{P({H_k}\mid{e_0})}

وهو المطلوب إثباته.

في مثال الديسيزتيس، خطوات هذا البرهان تتوافق مع التالي:

\frac{0.20}{0.80} \cdot \frac{0.90}{0.30} = \frac{0.18}{0.24} = \frac{0.18/0.42}{0.24/0.42} = \frac{0.43}{0.57}

المنشور الأصلي: Centre for Effective Altruism (2022) Bayes’ rule: Guide, Effective Altruism Forum.

ترجمة: بوشن مصطفى.