आउटलायर कैलकुलेटर क्या है?
आउटलायर वह डेटा बिंदु होता है जो आपके बाकी डेटा सेट से बहुत दूर पड़ा रहता है। यह कैलकुलेटर लोकप्रिय इंटरक्वार्टाइल रेंज (IQR) विधि का उपयोग करता है, जिसे टकी फेंसेस (Tukey's fences) भी कहा जाता है, ताकि असामान्य रूप से ऊँचे या नीचे मानों को चिह्नित किया जा सके। बस अपने अंक दर्ज करें और यह क्वार्टाइल, IQR, निचली व ऊपरी सीमा और मिले हुए सभी आउटलायर की सूची लौटा देता है।
इसका उपयोग कैसे करें
अपना डेटा सेट बॉक्स में टाइप करें, जिसमें मानों को कॉमा या स्पेस से अलग करें (उदाहरण के लिए 4, 5, 6, 7, 8, 100)। कैलकुलेटर मानों को क्रम में लगाता है, पहला क्वार्टाइल (Q1), तीसरा क्वार्टाइल (Q3) और इंटरक्वार्टाइल रेंज निकालता है, फिर क्वार्टाइल से \(1.5\,\text{IQR}\) आगे पड़ने वाले किसी भी मान को आउटलायर के रूप में चिह्नित कर देता है।
फॉर्मूला समझें
इंटरक्वार्टाइल रेंज है
$$\text{IQR} = Q_3 - Q_1$$सीमाएँ इस प्रकार हैं:
$$\text{निचली सीमा} = Q_1 - 1.5\cdot\text{IQR}$$$$\text{ऊपरी सीमा} = Q_3 + 1.5\cdot\text{IQR}$$निचली सीमा से नीचे या ऊपरी सीमा से ऊपर पड़ने वाला कोई भी मान आउटलायर माना जाता है। \(1.5\) का गुणक मानक परंपरा है; कुछ विश्लेषक "अत्यधिक" आउटलायर के लिए \(3.0\) का उपयोग करते हैं।
हल किया गया उदाहरण
10, 12, 14, 15, 18, 20, 22, 25, 90 (\(n = 9\)) के लिए, माध्यिका डेटा को निचले आधे भाग {10, 12, 14, 15} और ऊपरी आधे भाग {18, 20, 22, 25} में बाँटती है। \(Q_1 = (12+14)/2 = 13\) और \(Q_3 = (20+22)/2 = 21\)... यहाँ वैकल्पिक सेट के लिए \(Q_3 = 23.5\) है। \(\text{IQR} = 10.5\), इसलिए निचली सीमा \(-2.75\) और ऊपरी सीमा \(39.25\) है। मान \(90\), \(39.25\) से अधिक है, इसलिए इसे एकमात्र आउटलायर के रूप में चिह्नित किया जाता है।
अक्सर पूछे जाने वाले प्रश्न
कौन-सी क्वार्टाइल विधि उपयोग होती है? एक्सक्लूसिव माध्यिका विधि: जब n विषम हो, तो कुल माध्यिका को दोनों आधे भागों से बाहर रखा जाता है।
IQR का 1.5 गुना ही क्यों? यह जॉन टकी द्वारा सुझाई गई परंपरागत सीमा है; यह लगभग डेटा के सामान्य फैलाव से परे की पुच्छ (tails) को पकड़ती है।
क्या आउटलायर वैध भी हो सकते हैं? हाँ — आउटलायर बस सांख्यिकीय रूप से असामान्य होता है, जरूरी नहीं कि वह कोई त्रुटि ही हो। किसी को हटाने से पहले हमेशा उसकी जाँच करें।