पैरामीट्रिक बनाम गैर पैरामीट्रिक
सांख्यिकी अध्ययन की एक शाखा है जो हमें ब्याज की एक निश्चित आबादी से लिए गए नमूनों का उपयोग करके जनसंख्या की गतिशीलता को समझने की अनुमति देती है। यह आवश्यक है कि ये नमूने यादृच्छिक हों। जनसंख्या मापदंडों के बारे में अनुमान लगाने के लिए गणित को शामिल करके कई सूत्र बनाए जाते हैं। स्वाभाविक रूप से किसी भी आबादी में "सामान्य वितरण" हो सकता है जहां डेटा/नमूनों के फैलाव में आवृत्ति ग्राफ में घंटी का आकार होता है। एक सामान्य वितरण में, अधिकांश नमूने माध्य के आसपास केंद्रित होते हैं और 68%, 95%, 99% डेटा क्रमशः 1, 2, और 3 मानक विचलन के भीतर पाए जाते हैं।पैरामीट्रिक और गैर-पैरामीट्रिक आंकड़े इस बात पर निर्भर करते हैं कि सामान्य वितरण पर विचार किया जाता है या नहीं।
पैरामीट्रिक सांख्यिकी क्या है?
पैरामीट्रिक आँकड़े वे आँकड़े हैं जिनमें डेटा/नमूनों को सामान्य वितरण से लिया गया माना जाता है। पैरामीट्रिक आँकड़ों की परिभाषा है "वे आँकड़े जो मानते हैं कि डेटा एक प्रकार के संभाव्यता वितरण से आया है और वितरण के मापदंडों के बारे में अनुमान लगाता है"। अधिकांश ज्ञात प्राथमिक सांख्यिकीय विधियां इसी समूह से संबंधित हैं। वास्तव में, उन्हें सामान्य रूप से वितरित नहीं किया जा सकता है। इसलिए, यह सांख्यिकी प्रकार अधिक मान्यताओं पर आधारित है। यदि डेटा/नमूने सामान्य रूप से वितरित किए जाते हैं या लगभग-सामान्य रूप से वितरित किए जाते हैं, तो सूत्र सटीक परिणाम और अनुमान उत्पन्न कर सकते हैं। हालांकि, अगर सामान्य रूप से वितरित होने की धारणा गलत है, तो पैरामीट्रिक आंकड़े काफी भ्रामक हो सकते हैं।
गैर-पैरामीट्रिक सांख्यिकी क्या है?
गैर पैरामीट्रिक सांख्यिकी को वितरण-मुक्त सांख्यिकी के रूप में भी जाना जाता है।इस आँकड़ा प्रकार का लाभ यह है कि इसमें पहले की तरह पैरामीट्रिक के साथ अनुमान लगाने की आवश्यकता नहीं होती है। गैर-पैरामीट्रिक सांख्यिकीय गणना माध्यिका को साधनों की तुलना में ध्यान में रखती है। इसलिए, यदि एक या दो माध्य मान से विचलित होते हैं, तो उनके प्रभाव की उपेक्षा की जाती है। आम तौर पर पैरामीट्रिक आंकड़ों को इससे अधिक पसंद किया जाता है क्योंकि इसमें गैर-पैरामीट्रिक पद्धति की तुलना में झूठी परिकल्पना को अस्वीकार करने की अधिक शक्ति होती है। सबसे ज्ञात गैर-पैरामीट्रिक परीक्षणों में से एक ची-स्क्वायर परीक्षण है। कुछ पैरामीट्रिक परीक्षणों के लिए गैर-पैरामीट्रिक एनालॉग हैं जैसे, युग्मित नमूना टी-टेस्ट के लिए विलकॉक्सन टी टेस्ट, स्वतंत्र नमूने टी-टेस्ट के लिए मान-व्हिटनी यू टेस्ट, पियर्सन के सहसंबंध के लिए स्पीयरमैन का सहसंबंध आदि। एक नमूना टी-टेस्ट के लिए, कोई नहीं है तुलनीय गैर पैरामीट्रिक परीक्षण।
पैरामीट्रिक और गैर-पैरामीट्रिक में क्या अंतर है?
• पैरामीट्रिक आँकड़े सामान्य वितरण पर निर्भर करते हैं, लेकिन गैर-पैरामीट्रिक आँकड़े सामान्य वितरण पर निर्भर नहीं करते हैं।
• पैरामीट्रिक आंकड़े गैर-पैरामीट्रिक आंकड़ों की तुलना में अधिक अनुमान लगाते हैं।
• पैरामीट्रिक आंकड़े गैर-पैरामीट्रिक आंकड़ों की तुलना में सरल सूत्रों का उपयोग करते हैं।
• जब किसी आबादी को सामान्य रूप से वितरित या सामान्य रूप से वितरित होने के करीब माना जाता है, तो पैरामीट्रिक आंकड़ों का सबसे अच्छा उपयोग किया जाता है। यदि नहीं, तो यह सबसे अच्छा है कि एक गैर-पैरामीट्रिक पद्धति का उपयोग किया जाए।
• सामान्यतः ज्ञात प्राथमिक सांख्यिकी विधियों में से अधिकांश पैरामीट्रिक सांख्यिकी से संबंधित हैं। गैर पैरामीट्रिक आँकड़ों का बहुत कम उपयोग किया जाता है और विशेष मामलों के लिए लागू किया जाता है।