الاتصال عبر MCP →

أدخل الحساب

صيغة رياضية

اعلان

نتائج

القيمة الاحتمالية ثنائية الذيل
٠٫٠٣٥٥
Z-score = ٢٫١٠٣
ذو دلالة إحصائية
هل النتيجة ذات دلالة؟ Yes
معدّل تحويل النسخة A ١٠%
معدّل تحويل النسخة B ١٣%
التحسّن النسبي (B مقابل A) ٣٠%
الثقة الملاحَظة ٩٦٫٤٥%
قيمة Z الحرجة (العتبة) ١٫٩٦

ماذا تفعل هذه الحاسبة

تخبرك حاسبة الدلالة الإحصائية لاختبار A/B بما إذا كان الفرق بين معدّلي تحويل حقيقيًا على الأرجح أم مجرّد تذبذب عشوائي. تطبّق الحاسبة اختبار Z الكلاسيكي لنسبتين على عدد الزوار والتحويلات في النسخة الضابطة (النسخة A) والنسخة المنافِسة (النسخة B)، وتعيد لك قيمة Z والقيمة الاحتمالية ثنائية الذيل ونسبة التحسّن النسبي، إضافةً إلى حكم واضح: «ذو دلالة» أو «غير ذي دلالة» عند مستوى الثقة الذي تختاره.

نسختان A وB تعرض كل منهما الزوار والتحويلات لمقارنة معدلات التحويل
يقارن اختبار A/B معدلات التحويل لنسختين لمعرفة ما إذا كان الفرق حقيقيًا.

طريقة الاستخدام

أدخل عدد الزوار وعدد التحويلات لكل نسخة، ثم اختر مستوى الثقة (90% أو 95% أو 99%). الخيار الأكثر شيوعًا هو 95%، وهو يقابل قيمة Z حرجة تساوي \(1.96\). فإذا بلغت القيمة المطلقة لـ Z العتبة الحرجة أو تجاوزتها، تُصنَّف النتيجة على أنها ذات دلالة إحصائية.

شرح المعادلة

يُحسب كل معدّل تحويل بالصيغة \(\hat{p} = \text{التحويلات} \div \text{الزوار}\). ويجمع الاختبار العيّنتين في نسبة واحدة مجمّعة $$\hat{p} = \frac{c_A + c_B}{n_A + n_B}$$ لتقدير خطأ معياري مشترك. أما قيمة Z فهي الفرق الملاحَظ بين المعدّلين مقسومًا على هذا الخطأ المعياري: $$z = \frac{\hat{p}_B - \hat{p}_A}{\sqrt{\hat{p}(1-\hat{p})\left(\frac{1}{n_A}+\frac{1}{n_B}\right)}}$$ وكلما كبرت القيمة المطلقة لـ Z قلّ احتمال أن يكون الفرق ناتجًا عن الصدفة. والقيمة الاحتمالية ثنائية الذيل تساوي ضعف مساحة الذيل العلوي خلف قيمة Z تحت منحنى التوزيع الطبيعي القياسي.

اعلان
منحنى جرسي للتوزيع الطبيعي مع تحديد درجة Z وتظليل منطقة ذيل قيمة p
تحدد درجة Z موقع نتيجتك على المنحنى الطبيعي؛ مساحة الذيل المظللة هي قيمة p.

مثال محلول

النسخة A: 1000 زائر، 100 تحويل (10.0%). النسخة B: 1000 زائر، 130 تحويلًا (13.0%). النسبة المجمّعة هي \(230/2000 = 0.115\)، والخطأ المعياري هو الجذر التربيعي لـ $$\sqrt{0.115 \times 0.885 \times \left(\frac{1}{1000} + \frac{1}{1000}\right)} \approx 0.01427$$ ومن ثَمّ $$z \approx \frac{0.03}{0.01427} \approx 2.10$$ وعند مستوى ثقة 95% (قيمة Z الحرجة = \(1.96\)) تكون النتيجة ذات دلالة إحصائية، مع قيمة احتمالية ثنائية الذيل تقارب \(0.036\).

القيم الحرجة للدرجة المعيارية (Z) حسب مستوى الثقة

في اختبار Z ثنائي الذيل، تُقارن الدرجة المعيارية (Z-score) المرصودة بقيمة حرجة تعتمد على مستوى الثقة المختار. مستوى الثقة يساوي \(1-\alpha\)، حيث \(\alpha\) هو حد الدلالة الإحصائية (أقصى احتمال مقبول لنتيجة إيجابية خاطئة). تُعتبر النتيجة دالة إحصائياً عندما تتجاوز القيمة المطلقة للدرجة المعيارية القيمة الحرجة، أو بشكل معادل عندما تكون قيمة p أقل من \(\alpha\).

مستوى الثقة مستوى الدلالة \(\alpha\) حد قيمة p الدرجة المعيارية الحرجة (ثنائية الذيل)
90% 0.10 < 0.10 1.645
95% 0.05 < 0.05 1.960
99% 0.01 < 0.01 2.576

تأتي هذه القيم الحرجة من التوزيع الطبيعي المعياري: كل منها يترك \(\alpha/2\) من الاحتمالية في كل ذيل. المستوى 95% (الدرجة المعيارية الحرجة = 1.96) هو الافتراضي الأكثر شيوعاً في اختبار معدل التحويل.

المصطلحات الأساسية معرّفة

معدل التحويل
نسبة الزوار الذين أكملوا إجراء الهدف، \(p = \text{التحويلات} / \text{الزوار}\)، لمتغير معين.
الفرضية الصفرية
الافتراض الافتراضي بأن المتغيرين لهما نفس معدل التحويل الحقيقي، أي \(p_A = p_B\) وأي فرق مرصود يعود إلى الصدفة العشوائية.
النسبة المجمعة
معدل التحويل المدمج لكلا المتغيرين، \(\bar{p} = (\text{conv}_A + \text{conv}_B)/(n_A + n_B)\)، يُستخدم لتقدير التباين بموجب الفرضية الصفرية.
الخطأ المعياري
الانحراف المعياري المقدر للفرق في معدلات التحويل، \(\sqrt{\bar{p}(1-\bar{p})(1/n_A + 1/n_B)}\)؛ يتناقص مع زيادة حجم العينة.
الدرجة المعيارية (Z-score)
الفرق المرصود في معدلات التحويل معبراً عنه بوحدات الخطأ المعياري؛ الحجم الأكبر يعني أن الفرق أقل احتمالاً بموجب الفرضية الصفرية.
قيمة p
احتمالية ملاحظة فرق على الأقل بنفس درجة الطرفية المرصودة، بافتراض أن الفرضية الصفرية صحيحة. قيم p الأصغر توفر أدلة أقوى ضد الفرضية الصفرية.
الاختبار ثنائي الذيل
اختبار يكتشف فرقاً في أي اتجاه (B أفضل أم أسوأ من A)، مقسماً \(\alpha\) على كلا ذيلي التوزيع.
مستوى الثقة
\(1-\alpha\)، الحد الفاصل (مثلاً 95%) الذي تُحكم النتيجة بناءً عليه دالة إحصائياً؛ يحدد مدى ندرة رفض الفرضية الصفرية الحقيقية بشكل خاطئ.
الدلالة الإحصائية
الخلاصة بأن الفرق المرصود غير محتمل أن يكون بسبب الصدفة وحدها، وتُستنتج عندما تقع قيمة p تحت \(\alpha\).
الارتفاع النسبي
التغير النسبة المئوية للمتغير B على المتغير A، \((p_B - p_A)/p_A \times 100\%\)، يصف حجم التأثير.
اعلان

تفسير نتيجتك

تعني النتيجة الدالة إحصائياً أن قيمة p أقل من \(\alpha\) المختار (على سبيل المثال أقل من 0.05 عند ثقة 95%)، لذا فإن الفرق المرصود بين المتغيرات غير محتمل أن ينشأ بالصدفة بموجب الفرضية الصفرية. تعني النتيجة غير الدالة إحصائياً أن البيانات متسقة مع عدم وجود فرق حقيقي — لا تثبت أن المتغيرات متساوية، بل فقط أنك تفتقر إلى أدلة كافية للتمييز بينهما.

مثال عملي: مع 5,000 زائر و 250 تحويل في A (\(p_A = 0.05\)) و 5,000 زائر و 300 تحويل في B (\(p_B = 0.06\))، النسبة المجمعة هي \(\bar p = 550/10000 = 0.055\). الخطأ المعياري هو \(\sqrt{0.055\times0.945\times(1/5000+1/5000)} \approx 0.004558\)، مما يعطي \(Z = (0.06-0.05)/0.004558 \approx\) 2.19. نظراً لأن 2.19 > 1.96، تكون النتيجة دالة إحصائياً عند ثقة 95%، مع ارتفاع نسبي بنسبة 20%.

تتبع عدة تحفظات مباشرة من كيفية تعريف هذه الإحصائيات:

  • قيمة p ليست احتمالية أن يكون B أفضل من A. إنها احتمالية البيانات المرصودة (أو الأكثر طرفية) بافتراض أن الفرضية الصفرية صحيحة — بيان عن البيانات بناءً على فرضية، وليس عن فرضية بناءً على البيانات.
  • الدلالة الإحصائية ليست نفس الأهمية. مع عينات كبيرة جداً، يمكن أن يكون ارتفاع صغير وغير ذي صلة تجارياً دالاً إحصائياً. اقرأ دائماً الارتفاع النسبي وقيمته العملية، وليس فقط النتيجة.
  • حجم العينة يقود الحساسية. العينات الصغيرة تنتج أخطاء معيارية كبيرة، لذا يمكن أن يبدو التأثير الحقيقي غير دال إحصائياً؛ العينات الكبيرة تكتشف تأثيرات أصغر. خطط لحجم عينة مستهدف قبل الاختبار بدلاً من التوقف عند القراءة الدالة الأولى.
  • تجنب الاختلسة النظر والاختبار المتعدد. التحقق المتكرر من النتائج والتوقف بمجرد p < 0.05 يرفع معدل النتائج الإيجابية الخاطئة بشكل كبير فوق \(\alpha\) الاسمي. اختبار Z ذو الأفق الثابت يفترض أنك تقيم مرة واحدة عند حجم عينة محدد مسبقاً؛ اختبار متغيرات أو مقاييس عديدة بطريقة مماثلة يضاعف فرصة "الفوز" الزائف ويستدعي حد أقسى.

تقرر هذه الأداة اختبار Z ثنائي الذيل متكرر المنهج للنسب؛ إنها معلومات إحصائية عامة وليست بديلاً عن التصميم التجريبي المخصص عندما تكون المخاطر عالية.

الأسئلة الشائعة

كم عدد الزوار الذي أحتاجه؟ لا يوجد رقم ثابت — فالفروق الصغيرة تتطلّب عيّنات كبيرة. إذا كانت نتيجتك على الحدّ الفاصل، فاجمع مزيدًا من البيانات قبل اتخاذ القرار.

ماذا تعني القيمة الاحتمالية؟ هي احتمال ملاحظة فرق بهذا الحجم (أو أكبر) فيما لو كانت النسختان متطابقتين فعلًا. وكلما صغُرت كانت دليلًا أقوى على وجود فرق حقيقي.

هل أوقف الاختبار بمجرّد ظهور دلالة؟ لا. فالتحقّق المتكرّر («التلصّص» على النتائج) يضخّم الإيجابيات الكاذبة. حدّد حجم العيّنة أو مدّة الاختبار مسبقًا ثم قيّم النتيجة عندها.

آخر تحديث: