डीबीएमएस बनाम डाटा माइनिंग
एक DBMS (डेटाबेस मैनेजमेंट सिस्टम) डिजिटल डेटाबेस के प्रबंधन के लिए उपयोग की जाने वाली एक पूर्ण प्रणाली है जो डेटाबेस सामग्री के भंडारण, डेटा के निर्माण / रखरखाव, खोज और अन्य कार्यात्मकताओं की अनुमति देता है। दूसरी ओर, डेटा माइनिंग कंप्यूटर विज्ञान का एक क्षेत्र है, जो कच्चे डेटा से पहले की अज्ञात और दिलचस्प जानकारी के निष्कर्षण से संबंधित है। आमतौर पर, डेटा माइनिंग प्रक्रिया के लिए इनपुट के रूप में उपयोग किया जाने वाला डेटा डेटाबेस में संग्रहीत होता है। आंकड़ों की ओर झुकाव रखने वाले उपयोगकर्ता डेटा माइनिंग का उपयोग करते हैं। वे डेटा में छिपे हुए पैटर्न को देखने के लिए सांख्यिकीय मॉडल का उपयोग करते हैं। डेटा खनिक विभिन्न डेटा तत्वों के बीच उपयोगी संबंध खोजने में रुचि रखते हैं, जो अंततः व्यवसायों के लिए लाभदायक है।
डीबीएमएस
DBMS, जिसे कभी-कभी सिर्फ एक डेटाबेस मैनेजर कहा जाता है, कंप्यूटर प्रोग्राम का एक संग्रह है जो एक सिस्टम (यानी हार्ड ड्राइव या नेटवर्क) में स्थापित सभी डेटाबेस के प्रबंधन (यानी संगठन, भंडारण और पुनर्प्राप्ति) के लिए समर्पित है।. दुनिया में विभिन्न प्रकार के डेटाबेस मैनेजमेंट सिस्टम मौजूद हैं, और उनमें से कुछ विशिष्ट उद्देश्यों के लिए कॉन्फ़िगर किए गए डेटाबेस के उचित प्रबंधन के लिए डिज़ाइन किए गए हैं। सबसे लोकप्रिय वाणिज्यिक डेटाबेस प्रबंधन प्रणाली Oracle, DB2 और Microsoft Access हैं। ये सभी उत्पाद अलग-अलग उपयोगकर्ताओं के लिए विशेषाधिकारों के विभिन्न स्तरों के आवंटन के साधन प्रदान करते हैं, जिससे यह संभव हो जाता है कि डीबीएमएस को एक ही व्यवस्थापक द्वारा केंद्रीय रूप से नियंत्रित किया जा सके या कई अलग-अलग लोगों को आवंटित किया जा सके। किसी भी डेटाबेस मैनेजमेंट सिस्टम में चार महत्वपूर्ण तत्व होते हैं। वे मॉडलिंग भाषा, डेटा संरचना, क्वेरी भाषा और लेनदेन के लिए तंत्र हैं। मॉडलिंग भाषा DBMS में होस्ट किए गए प्रत्येक डेटाबेस की भाषा को परिभाषित करती है।वर्तमान में कई लोकप्रिय दृष्टिकोण जैसे पदानुक्रम, नेटवर्क, संबंधपरक और वस्तु व्यवहार में हैं। डेटा संरचनाएं डेटा को व्यवस्थित करने में मदद करती हैं जैसे व्यक्तिगत रिकॉर्ड, फाइलें, फ़ील्ड और उनकी परिभाषाएं और दृश्य मीडिया जैसे ऑब्जेक्ट। डेटा क्वेरी भाषा सिस्टम में डेटा जोड़ने के लिए लॉगिन डेटा, विभिन्न उपयोगकर्ताओं तक पहुंच अधिकार, और प्रोटोकॉल की निगरानी करके डेटाबेस की सुरक्षा बनाए रखती है। SQL एक लोकप्रिय क्वेरी भाषा है जिसका उपयोग रिलेशनल डेटाबेस मैनेजमेंट सिस्टम में किया जाता है। अंत में, लेन-देन की अनुमति देने वाला तंत्र समवर्ती और बहुलता में मदद करता है। वह तंत्र यह सुनिश्चित करेगा कि एक ही रिकॉर्ड को एक ही समय में कई उपयोगकर्ताओं द्वारा संशोधित नहीं किया जाएगा, इस प्रकार डेटा अखंडता को बरकरार रखा जाएगा। इसके अतिरिक्त, DBMS बैकअप और अन्य सुविधाएं भी प्रदान करता है।
डेटा माइनिंग
डेटा माइनिंग को डेटा में नॉलेज डिस्कवरी (KDD) के रूप में भी जाना जाता है। जैसा कि ऊपर उल्लेख किया गया है, यह कंप्यूटर विज्ञान का एक फेलिड है, जो कच्चे डेटा से पहले अज्ञात और दिलचस्प जानकारी के निष्कर्षण से संबंधित है।डेटा की घातीय वृद्धि के कारण, विशेष रूप से व्यवसाय जैसे क्षेत्रों में, डेटा माइनिंग डेटा के इस बड़े धन को व्यावसायिक बुद्धिमत्ता में बदलने के लिए बहुत महत्वपूर्ण उपकरण बन गया है, क्योंकि पिछले कुछ दशकों में पैटर्न का मैन्युअल निष्कर्षण असंभव प्रतीत होता है। उदाहरण के लिए, वर्तमान में इसका उपयोग विभिन्न अनुप्रयोगों जैसे सोशल नेटवर्क विश्लेषण, धोखाधड़ी का पता लगाने और विपणन के लिए किया जाता है। डेटा माइनिंग आमतौर पर निम्नलिखित चार कार्यों से संबंधित है: क्लस्टरिंग, वर्गीकरण, रिग्रेशन और एसोसिएशन। क्लस्टरिंग असंरचित डेटा से समान समूहों की पहचान कर रहा है। वर्गीकरण सीखने के नियम हैं जिन्हें नए डेटा पर लागू किया जा सकता है और इसमें आम तौर पर निम्नलिखित चरण शामिल होंगे: डेटा का प्रीप्रोसेसिंग, मॉडलिंग डिजाइन करना, सीखना/फीचर चयन और मूल्यांकन/सत्यापन। प्रतिगमन मॉडल डेटा में न्यूनतम त्रुटि वाले फ़ंक्शन ढूंढ रहा है। और एसोसिएशन चरों के बीच संबंधों की तलाश में है। डेटा माइनिंग का उपयोग आमतौर पर सवालों के जवाब देने के लिए किया जाता है जैसे कि मुख्य उत्पाद कौन से हैं जो अगले साल वॉल-मार्ट में उच्च लाभ प्राप्त करने में मदद कर सकते हैं?
DBMS और डेटा माइनिंग में क्या अंतर है?
DBMS डिजिटल डेटाबेस के एक सेट को रखने और प्रबंधित करने के लिए एक पूर्ण प्रणाली है। हालाँकि डेटा माइनिंग कंप्यूटर विज्ञान में एक तकनीक या अवधारणा है, जो कच्चे डेटा से उपयोगी और पहले की अज्ञात जानकारी निकालने से संबंधित है। अधिकांश समय, ये कच्चे डेटा बहुत बड़े डेटाबेस में संग्रहीत होते हैं। इसलिए डेटा माइनर डेटा माइनिंग प्रक्रिया से पहले और उसके दौरान कच्चे डेटा को संभालने, प्रबंधित करने और यहां तक कि प्रीप्रोसेस करने के लिए डीबीएमएस की मौजूदा कार्यक्षमता का उपयोग करते हैं। हालाँकि, डेटा का विश्लेषण करने के लिए अकेले DBMS सिस्टम का उपयोग नहीं किया जा सकता है। लेकिन, कुछ डीबीएमएस में वर्तमान में इनबिल्ट डेटा एनालिसिस टूल या क्षमताएं हैं।