मुख्य अंतर - पर्यवेक्षित बनाम अनुपयोगी मशीन लर्निंग
पर्यवेक्षित शिक्षण और अनुपयोगी शिक्षण मशीन लर्निंग की दो मुख्य अवधारणाएं हैं। सुपरवाइज्ड लर्निंग एक फ़ंक्शन सीखने का एक मशीन लर्निंग कार्य है जो इनपुट-आउटपुट जोड़े के उदाहरण के आधार पर आउटपुट में इनपुट को मैप करता है। अनसुपरवाइज्ड लर्निंग बिना लेबल वाले डेटा से छिपी संरचना का वर्णन करने के लिए एक फ़ंक्शन का अनुमान लगाने का मशीन लर्निंग कार्य है। पर्यवेक्षित और बिना पर्यवेक्षित मशीन लर्निंग के बीच मुख्य अंतर यह है कि पर्यवेक्षित शिक्षण लेबल किए गए डेटा का उपयोग करता है जबकि अनुपयोगी शिक्षण बिना लेबल वाले डेटा का उपयोग करता है।
मशीन लर्निंग कंप्यूटर साइंस का एक क्षेत्र है जो कंप्यूटर सिस्टम को स्पष्ट रूप से प्रोग्राम किए बिना डेटा से सीखने की क्षमता देता है।यह डेटा का विश्लेषण करने और उसमें पैटर्न की भविष्यवाणी करने की अनुमति देता है। मशीन लर्निंग के कई अनुप्रयोग हैं। उनमें से कुछ चेहरे की पहचान, हावभाव पहचान और वाक् पहचान हैं। मशीन लर्निंग से संबंधित विभिन्न एल्गोरिदम हैं। उनमें से कुछ प्रतिगमन, वर्गीकरण और क्लस्टरिंग हैं। मशीन लर्निंग आधारित अनुप्रयोगों को विकसित करने के लिए सबसे आम प्रोग्रामिंग भाषाएं आर और पायथन हैं। जावा, सी++ और मैटलैब जैसी अन्य भाषाओं का भी उपयोग किया जा सकता है।
पर्यवेक्षित शिक्षण क्या है?
मशीन लर्निंग आधारित सिस्टम में, मॉडल एक एल्गोरिथम के अनुसार काम करता है। पर्यवेक्षित शिक्षण में, मॉडल की देखरेख की जाती है। सबसे पहले, मॉडल को प्रशिक्षित करने की आवश्यकता है। प्राप्त ज्ञान के साथ, यह भविष्य के उदाहरणों के लिए उत्तरों की भविष्यवाणी कर सकता है। मॉडल को लेबल किए गए डेटासेट का उपयोग करके प्रशिक्षित किया जाता है। जब सिस्टम को आउट ऑफ सैंपल डेटा दिया जाता है, तो यह परिणाम की भविष्यवाणी कर सकता है। लोकप्रिय IRIS डेटासेट से एक छोटा सा अंश निम्नलिखित है।
उपरोक्त तालिका के अनुसार, सेपल की लंबाई, सेपल की चौड़ाई, पटेल की लंबाई, पटेल की चौड़ाई और प्रजाति को विशेषता कहा जाता है। कॉलम सुविधाओं के रूप में जाना जाता है। एक पंक्ति में सभी विशेषताओं का डेटा होता है। इसलिए, एक पंक्ति को अवलोकन कहा जाता है। डेटा या तो संख्यात्मक या श्रेणीबद्ध हो सकता है। मॉडल को इनपुट के रूप में संबंधित प्रजातियों के नाम के साथ अवलोकन दिए गए हैं। जब एक नया अवलोकन दिया जाता है, तो मॉडल को उस प्रजाति के प्रकार का अनुमान लगाना चाहिए जिससे वह संबंधित है।
पर्यवेक्षित शिक्षण में, वर्गीकरण और प्रतिगमन के लिए एल्गोरिदम हैं। वर्गीकरण लेबल किए गए डेटा को वर्गीकृत करने की प्रक्रिया है। मॉडल ने सीमाएँ बनाईं जो डेटा की श्रेणियों को अलग करती हैं। जब मॉडल को नया डेटा प्रदान किया जाता है, तो यह उस बिंदु के आधार पर वर्गीकृत कर सकता है जहां बिंदु मौजूद है।K-निकटतम पड़ोसी (KNN) एक वर्गीकरण मॉडल है। k मान के आधार पर, श्रेणी तय की जाती है। उदाहरण के लिए, जब k 5 है, यदि कोई विशेष डेटा बिंदु श्रेणी A में आठ डेटा बिंदुओं और श्रेणी B में छह डेटा बिंदुओं के पास है, तो डेटा बिंदु को A के रूप में वर्गीकृत किया जाएगा।
प्रतिगमन नए डेटा के परिणाम की भविष्यवाणी करने के लिए पिछले डेटा की प्रवृत्ति की भविष्यवाणी करने की प्रक्रिया है। प्रतिगमन में, आउटपुट में एक या अधिक निरंतर चर शामिल हो सकते हैं। भविष्यवाणी एक लाइन का उपयोग करके की जाती है जो अधिकांश डेटा बिंदुओं को कवर करती है। सबसे सरल प्रतिगमन मॉडल एक रैखिक प्रतिगमन है। यह तेज़ है और KNN जैसे ट्यूनिंग मापदंडों की आवश्यकता नहीं है। यदि डेटा एक परवलयिक प्रवृत्ति दिखाता है, तो रेखीय प्रतिगमन मॉडल उपयुक्त नहीं है।
वे पर्यवेक्षित शिक्षण एल्गोरिदम के कुछ उदाहरण हैं। आम तौर पर, पर्यवेक्षित शिक्षण विधियों से उत्पन्न परिणाम अधिक सटीक और विश्वसनीय होते हैं क्योंकि इनपुट डेटा अच्छी तरह से जाना जाता है और लेबल किया जाता है। इसलिए, मशीन को केवल छिपे हुए पैटर्न का विश्लेषण करना है।
अनपर्यवेज़्ड लर्निंग क्या है?
अनपर्यवेक्षित शिक्षण में, मॉडल की निगरानी नहीं की जाती है। परिणामों की भविष्यवाणी करने के लिए मॉडल अपने आप काम करता है। यह बिना लेबल वाले डेटा पर निष्कर्ष निकालने के लिए मशीन लर्निंग एल्गोरिदम का उपयोग करता है। आम तौर पर, अनुपयोगी शिक्षण एल्गोरिदम पर्यवेक्षित शिक्षण एल्गोरिदम की तुलना में कठिन होते हैं क्योंकि कुछ जानकारी होती है। क्लस्टरिंग एक प्रकार का अप्रशिक्षित शिक्षण है। इसका उपयोग एल्गोरिदम का उपयोग करके अज्ञात डेटा को समूहीकृत करने के लिए किया जा सकता है। k-माध्य और घनत्व-आधारित क्लस्टरिंग दो क्लस्टरिंग एल्गोरिदम हैं।
k-मीन एल्गोरिथम, प्रत्येक क्लस्टर के लिए यादृच्छिक रूप से k सेंट्रोइड रखता है। फिर प्रत्येक डेटा बिंदु को निकटतम केन्द्रक को सौंपा जाता है। यूक्लिडियन दूरी का उपयोग डेटा बिंदु से केंद्रक तक की दूरी की गणना करने के लिए किया जाता है। डेटा बिंदुओं को समूहों में वर्गीकृत किया गया है। k सेंट्रोइड्स के लिए पदों की गणना फिर से की जाती है। नई केन्द्रक स्थिति समूह में सभी बिंदुओं के माध्य से निर्धारित होती है। फिर से प्रत्येक डेटा बिंदु को निकटतम केन्द्रक को सौंपा गया है।यह प्रक्रिया तब तक दोहराई जाती है जब तक कि केन्द्रक नहीं बदलते। k-मीन एक तेज़ क्लस्टरिंग एल्गोरिथम है, लेकिन क्लस्टरिंग बिंदुओं का कोई निर्दिष्ट आरंभीकरण नहीं है। इसके अलावा, क्लस्टर बिंदुओं के आरंभीकरण के आधार पर क्लस्टरिंग मॉडल की एक उच्च भिन्नता है।
एक अन्य क्लस्टरिंग एल्गोरिदम घनत्व आधारित क्लस्टरिंग है। इसे शोर के साथ घनत्व आधारित स्थानिक क्लस्टरिंग अनुप्रयोगों के रूप में भी जाना जाता है। यह क्लस्टर को घनत्व से जुड़े बिंदुओं के अधिकतम सेट के रूप में परिभाषित करके काम करता है। वे घनत्व आधारित क्लस्टरिंग के लिए उपयोग किए जाने वाले दो पैरामीटर हैं। वे Ɛ (एप्सिलॉन) और न्यूनतम अंक हैं। पड़ोस की अधिकतम त्रिज्या है। न्यूनतम अंक एक क्लस्टर को परिभाषित करने के लिए पड़ोस में न्यूनतम अंक हैं। वे क्लस्टरिंग के कुछ उदाहरण हैं जो अनुपयोगी शिक्षण में आते हैं।
आम तौर पर, बिना पर्यवेक्षित शिक्षण एल्गोरिदम से उत्पन्न परिणाम अधिक सटीक और विश्वसनीय नहीं होते हैं क्योंकि मशीन को छिपे हुए पैटर्न और कार्यों को निर्धारित करने से पहले इनपुट डेटा को परिभाषित और लेबल करना होता है।
पर्यवेक्षित और अनुपयोगी मशीन लर्निंग के बीच समानता क्या है?
पर्यवेक्षित और अनुपयोगी दोनों तरह की शिक्षा मशीन लर्निंग के प्रकार हैं।
पर्यवेक्षित और अनुपयोगी मशीन लर्निंग में क्या अंतर है?
पर्यवेक्षित बनाम अनुपयोगी मशीन लर्निंग |
|
पर्यवेक्षित शिक्षण एक फ़ंक्शन सीखने का मशीन लर्निंग कार्य है जो इनपुट-आउटपुट जोड़े के उदाहरण के आधार पर आउटपुट में इनपुट को मैप करता है। | अनसुपरवाइज्ड लर्निंग, बिना लेबल वाले डेटा से छिपी संरचना का वर्णन करने के लिए एक फ़ंक्शन का अनुमान लगाने का मशीन लर्निंग कार्य है। |
मुख्य कार्यक्षमता | |
पर्यवेक्षित शिक्षण में, मॉडल लेबल किए गए इनपुट डेटा के आधार पर परिणाम की भविष्यवाणी करता है। | अनपर्यवेक्षित शिक्षण में, मॉडल अपने आप पैटर्न की पहचान करके लेबल किए गए डेटा के बिना परिणाम की भविष्यवाणी करता है। |
परिणामों की सटीकता | |
पर्यवेक्षित शिक्षण विधियों से उत्पन्न परिणाम अधिक सटीक और विश्वसनीय होते हैं। | अनपर्यवेक्षित शिक्षण विधियों से उत्पन्न परिणाम अधिक सटीक और विश्वसनीय नहीं होते हैं। |
मुख्य एल्गोरिदम | |
पर्यवेक्षित शिक्षण में प्रतिगमन और वर्गीकरण के लिए एल्गोरिदम हैं। | अनपर्यवेक्षित शिक्षण में क्लस्टरिंग के लिए एल्गोरिदम हैं। |
सारांश - पर्यवेक्षित बनाम अनुपयोगी मशीन लर्निंग
सुपरवाइज्ड लर्निंग और अनसुपरवाइज्ड लर्निंग दो तरह की मशीन लर्निंग हैं।सुपरवाइज्ड लर्निंग एक फ़ंक्शन सीखने का मशीन लर्निंग कार्य है जो इनपुट-आउटपुट जोड़े के उदाहरण के आधार पर आउटपुट में इनपुट को मैप करता है। अनसुपरवाइज्ड लर्निंग, बिना लेबल वाले डेटा से छिपी संरचना का वर्णन करने के लिए एक फ़ंक्शन का अनुमान लगाने का मशीन लर्निंग कार्य है। पर्यवेक्षित और अनुपयोगी मशीन लर्निंग के बीच का अंतर यह है कि पर्यवेक्षित शिक्षण लेबल किए गए डेटा का उपयोग करता है जबकि असुरक्षित झुकाव बिना लेबल वाले डेटा का उपयोग करता है।