मानक विचलन बनाम माध्य
वर्णनात्मक और अनुमानात्मक आँकड़ों में, इसकी केंद्रीय प्रवृत्ति, फैलाव और विषमता के अनुरूप डेटा सेट का वर्णन करने के लिए कई सूचकांकों का उपयोग किया जाता है। सांख्यिकीय अनुमान में, इन्हें आमतौर पर अनुमानक के रूप में जाना जाता है क्योंकि वे जनसंख्या पैरामीटर मानों का अनुमान लगाते हैं।
केंद्रीय प्रवृत्ति मूल्यों के वितरण के केंद्र को संदर्भित करती है और उसका पता लगाती है। डेटा सेट की केंद्रीय प्रवृत्ति का वर्णन करने के लिए माध्य, मोड और माध्यिका सबसे अधिक उपयोग किए जाने वाले सूचकांक हैं। फैलाव वितरण के केंद्र से डेटा के प्रसार की मात्रा है। परास और मानक विचलन फैलाव के सबसे अधिक इस्तेमाल किए जाने वाले उपाय हैं।डेटा के वितरण की विषमता का वर्णन करने के लिए पियर्सन के तिरछापन गुणांक का उपयोग किया जाता है। यहाँ, तिरछापन यह दर्शाता है कि डेटा सेट केंद्र के बारे में सममित है या नहीं और यदि नहीं तो यह कितना विषम है।
क्या मतलब है?
माध्य केंद्रीय प्रवृत्ति का सबसे अधिक इस्तेमाल किया जाने वाला सूचकांक है। एक डेटा सेट को देखते हुए माध्य की गणना सभी डेटा मानों का योग लेकर और फिर इसे डेटा की संख्या से विभाजित करके की जाती है। उदाहरण के लिए, 10 लोगों (किलोग्राम में) का वजन 70, 62, 65, 72, 80, 70, 63, 72, 77 और 79 मापा जाता है। तब दस लोगों का औसत वजन (किलोग्राम में) हो सकता है निम्नानुसार गणना की जाती है। भार का योग 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710 है। माध्य=(योग) / (डेटा की संख्या)=710/10=71 (किलोग्राम में)।
जैसा कि इस विशेष उदाहरण में, डेटा सेट का माध्य मान सेट का डेटा बिंदु नहीं हो सकता है, लेकिन किसी दिए गए डेटा सेट के लिए अद्वितीय होगा। माध्य में मूल डेटा के समान इकाइयाँ होंगी। इसलिए, इसे डेटा के समान अक्ष पर चिह्नित किया जा सकता है और तुलना में इसका उपयोग किया जा सकता है।साथ ही, डेटा सेट के माध्य के लिए कोई संकेत प्रतिबंध नहीं है। यह नकारात्मक, शून्य या सकारात्मक हो सकता है, क्योंकि डेटा सेट का योग नकारात्मक, शून्य या सकारात्मक हो सकता है।
मानक विचलन क्या है?
मानक विचलन फैलाव का सबसे अधिक इस्तेमाल किया जाने वाला सूचकांक है। मानक विचलन की गणना करने के लिए, पहले माध्य से डेटा मानों के विचलन की गणना की जाती है। विचलन का मूल वर्ग माध्य मानक विचलन कहलाता है।
पिछले उदाहरण में, माध्य से संबंधित विचलन हैं (70 - 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 और (79-71)=8. विचलन के वर्गों का योग है (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. मानक विचलन है (366/10)=6.05 (किलोग्राम में)। इससे यह निष्कर्ष निकाला जा सकता है कि अधिकांश डेटा 71±6 के अंतराल में है।05, बशर्ते डेटा सेट बहुत अधिक विषम न हो, और वास्तव में इस विशेष उदाहरण में ऐसा ही है।
चूंकि मानक विचलन में मूल डेटा के समान इकाइयाँ होती हैं, यह हमें एक माप देता है कि डेटा केंद्र से कितना विचलित है; मानक विचलन जितना अधिक होगा, फैलाव उतना ही अधिक होगा। साथ ही, डेटा सेट में डेटा की प्रकृति की परवाह किए बिना मानक विचलन एक गैर-ऋणात्मक मान होगा।
मानक विचलन और माध्य में क्या अंतर है?
• मानक विचलन केंद्र से फैलाव का एक माप है, जबकि माध्य डेटा सेट के केंद्र के स्थान को मापता है।
• मानक विचलन हमेशा एक गैर-ऋणात्मक मान होता है, लेकिन माध्य कोई भी वास्तविक मान ले सकता है।