रैखिक बनाम लॉजिस्टिक रिग्रेशन
सांख्यिकीय विश्लेषण में, अध्ययन से संबंधित चर के बीच संबंधों की पहचान करना महत्वपूर्ण है। कभी-कभी यह स्वयं विश्लेषण का एकमात्र उद्देश्य हो सकता है। संबंध के अस्तित्व को स्थापित करने और संबंध की पहचान करने के लिए नियोजित एक मजबूत उपकरण प्रतिगमन विश्लेषण है।
प्रतिगमन विश्लेषण का सबसे सरल रूप रैखिक प्रतिगमन है, जहां चर के बीच संबंध एक रैखिक संबंध है। सांख्यिकीय शब्दों में, यह व्याख्यात्मक चर और प्रतिक्रिया चर के बीच संबंध को सामने लाता है। उदाहरण के लिए, प्रतिगमन का उपयोग करके हम एक यादृच्छिक नमूने से एकत्र किए गए डेटा के आधार पर कमोडिटी की कीमत और खपत के बीच संबंध स्थापित कर सकते हैं।रिग्रेशन विश्लेषण डेटा सेट के एक रिग्रेशन फ़ंक्शन का उत्पादन करेगा, जो एक गणितीय मॉडल है जो उपलब्ध डेटा को सर्वोत्तम रूप से फिट करता है। इसे आसानी से एक स्कैटर प्लॉट द्वारा दर्शाया जा सकता है। रेखांकन प्रतिगमन दिए गए डेटा सेट के लिए सबसे अच्छा फिटिंग वक्र खोजने के बराबर है। वक्र का कार्य प्रतिगमन कार्य है। गणितीय मॉडल का उपयोग करके किसी दिए गए मूल्य के लिए किसी वस्तु के उपयोग का अनुमान लगाया जा सकता है।
इसलिए, प्रतिगमन विश्लेषण व्यापक रूप से भविष्यवाणी और पूर्वानुमान में उपयोग किया जाता है। इसका उपयोग प्रायोगिक डेटा में, भौतिकी, रसायन विज्ञान के क्षेत्र में, और कई प्राकृतिक विज्ञान और इंजीनियरिंग विषयों में संबंध स्थापित करने के लिए भी किया जाता है। यदि संबंध या प्रतीपगमन फलन एक रेखीय फलन है, तो इस प्रक्रिया को रेखीय प्रतीपगमन के रूप में जाना जाता है। स्कैटर प्लॉट में, इसे एक सीधी रेखा के रूप में दर्शाया जा सकता है। यदि फ़ंक्शन मापदंडों का एक रैखिक संयोजन नहीं है, तो प्रतिगमन गैर-रैखिक है।
लॉजिस्टिक रिग्रेशन मल्टीवेरिएट रिग्रेशन के बराबर है, और यह रिस्पॉन्स वेरिएबल पर मल्टीपल प्रेडिक्टर्स के प्रभाव को समझाने के लिए एक मॉडल बनाता है।हालांकि, लॉजिस्टिक रिग्रेशन में, अंतिम परिणाम चर श्रेणीबद्ध होना चाहिए (आमतौर पर विभाजित; यानी, प्राप्य परिणामों की एक जोड़ी, जैसे मृत्यु या उत्तरजीविता, हालांकि विशेष तकनीकें अधिक वर्गीकृत जानकारी को मॉडलिंग करने में सक्षम बनाती हैं)। एक सतत परिणाम चर को एक श्रेणीगत चर में परिवर्तित किया जा सकता है, जिसका उपयोग लॉजिस्टिक रिग्रेशन के लिए किया जा सकता है; हालांकि, इस तरह से निरंतर चरों को ध्वस्त करना ज्यादातर हतोत्साहित किया जाता है क्योंकि यह सटीकता को कम करता है।
लीनियर रिग्रेशन के विपरीत, माध्य की ओर, लॉजिस्टिक रिग्रेशन में प्रेडिक्टर वेरिएबल को लीनियरली कनेक्टेड, आमतौर पर वितरित, या हर क्लस्टर के अंदर समान विचरण करने के लिए मजबूर करने की आवश्यकता नहीं होती है। नतीजतन, भविष्यवक्ता और परिणाम चर के बीच संबंध एक रैखिक कार्य होने की संभावना नहीं है।
लॉजिस्टिक और लीनियर रिग्रेशन में क्या अंतर है?
• रैखिक प्रतिगमन में, व्याख्यात्मक चर और प्रतिक्रिया चर के बीच एक रैखिक संबंध माना जाता है और सटीक संबंध देने के लिए विश्लेषण द्वारा मॉडल को संतुष्ट करने वाले पैरामीटर पाए जाते हैं।
• मात्रात्मक चर के लिए रैखिक प्रतिगमन किया जाता है, और परिणामी कार्य एक मात्रात्मक होता है।
• लॉजिस्टिक रिग्रेशन में उपयोग किया गया डेटा या तो श्रेणीबद्ध या मात्रात्मक हो सकता है, लेकिन परिणाम हमेशा श्रेणीबद्ध होता है।