फाइव-नंबर समरी क्या है?
फाइव-नंबर समरी किसी डेटा सेट के वितरण का एक संक्षिप्त विवरण है। इसमें पाँच मान होते हैं: न्यूनतम (minimum), पहला चतुर्थक (Q1), माध्यिका (median / Q2), तीसरा चतुर्थक (Q3), और अधिकतम (maximum)। ये पाँचों संख्याएँ मिलकर आपके डेटा का केंद्र, फैलाव और तिरछापन (skew) दर्शाती हैं, और बॉक्स-एंड-व्हिस्कर प्लॉट का आधार बनती हैं।
इस कैलकुलेटर का उपयोग कैसे करें
अपनी संख्याएँ बॉक्स में दर्ज करें — कॉमा, स्पेस या नई लाइन से अलग करके। कैलकुलेटर इन्हें अपने आप क्रम में लगा देता है और पाँचों समरी मानों के साथ-साथ इंटरक्वार्टाइल रेंज (\(\text{IQR} = Q_3 - Q_1\)) भी बताता है, जो आपके डेटा के बीच के 50% हिस्से के फैलाव को मापती है।
सूत्र
डेटा को क्रम में लगाने के बाद, माध्यिका बीच का मान होती है (या सम संख्या होने पर बीच के दो मानों का औसत)। डेटा को निचले आधे और ऊपरी आधे भाग में बाँटा जाता है। Q1 निचले आधे भाग की माध्यिका है और Q3 ऊपरी आधे भाग की माध्यिका है। जब डेटा की संख्या विषम हो, तो बीच का मान दोनों भागों से बाहर रखा जाता है (एक्सक्लूसिव / Tukey विधि)। IQR बस Q3 − Q1 के बराबर होता है।
$$\begin{gathered} \{\,\text{Min},\ Q_1,\ \text{Median},\ Q_3,\ \text{Max}\,\} \\[1.4em] \text{from sorted}\ \text{Data set} \\[1.2em] \text{where}\quad \left\{ \begin{aligned} \text{Min} &= x_{(1)}, \quad \text{Max} = x_{(n)} \\ \text{Median} &= \operatorname{med}(x_{(1)},\dots,x_{(n)}) \\ Q_1 &= \operatorname{med}(\text{lower half}) \\ Q_3 &= \operatorname{med}(\text{upper half}) \\ \text{IQR} &= Q_3 - Q_1 \end{aligned} \right. \end{gathered}$$
हल किया हुआ उदाहरण
डेटा सेट 2, 4, 6, 8, 10, 12, 14 लीजिए। क्रम में लगाने पर न्यूनतम 2 और अधिकतम 14 है। माध्यिका चौथा मान, यानी 8 है। निचला आधा भाग {2, 4, 6} है, जिसकी माध्यिका (Q1) 4 है। ऊपरी आधा भाग {10, 12, 14} है, जिसकी माध्यिका (Q3) 12 है। \(\text{IQR} = 12 - 4 = 8\) है।
अक्सर पूछे जाने वाले सवाल
चतुर्थक निकालने की अलग-अलग विधियाँ क्यों होती हैं? सांख्यिकी सॉफ्टवेयर कई तरह के नियमों का इस्तेमाल करते हैं। यह टूल सामान्य एक्सक्लूसिव विधि का उपयोग करता है, जो विषम लंबाई वाले डेटा सेट को बाँटते समय कुल माध्यिका को छोड़ देती है।
IQR मुझे क्या बताती है? यह दर्शाती है कि आपके मानों का केंद्रीय आधा हिस्सा कितना फैला हुआ है, और इसका उपयोग आउटलायर (चतुर्थकों से \(1.5 \times \text{IQR}\) से ज़्यादा दूर के मान) पहचानने में होता है।
मुझे कितनी संख्याओं की ज़रूरत है? कम से कम दो मान चाहिए, लेकिन जितने ज़्यादा डेटा पॉइंट होंगे, चतुर्थक उतने ही सार्थक बनेंगे।