ssis क्या कोई कृपया डेटा खनन, एसएसआईएस, बीआई, ईटीएल और अन्य संबंधित प्रौद्योगिकियों को समझा सकता है?




business-intelligence data-mining (4)

आपके सहकर्मी को स्ट्रिंग के "बुद्धिमान पार्सिंग" के रूप में बेहतर वर्णित किया जा सकता है। यह परिष्कार के कई स्तरों पर किया जा सकता है - उदाहरण के लिए, सांख्यिकीय मॉडल का उपयोग करके आपको संभावना है कि "डॉ।" एक नमस्कार है और पहला नाम नहीं है या यह सिर्फ सामान्य नमस्कार की एक साधारण लुकअप सूची का उपयोग कर सकता है, जिस स्थिति में यह सिर्फ नियमित प्रक्रियात्मक कोड है, और कुछ नहीं।

SSIS SQL सर्वर एकीकरण सेवाओं के लिए छोटा है यह मूलतः स्टेरॉयड पर डीटीएस है; कुछ लोग इसे पसंद करते हैं, और कुछ लोग इससे नफरत करते हैं यह आप के बारे में बात कर रहे हैं जिस तरह से करने के लिए अपने आप से उस का उपयोग करने के लिए मुश्किल हो जाएगा; यह मुख्य रूप से सिर्फ विभिन्न स्रोतों से डेटा लेने और संयोजन करने, इसे बदलने, और कहीं और इसे लोड करने के लिए है। यह कुछ निफ्टी चीजों को कर सकता है, जिनमें से कई डेटा-खनन की तरह होते हैं, लेकिन अंततः यह डेटा एक दिशा या किसी अन्य को क्रमा करने के लिए एक उपकरण है। यह डेटा खनन समुदाय में विशेष रूप से अच्छी तरह से सम्मानित नहीं है।

डाटा माइनिंग एक संपूर्ण शैक्षणिक अनुशासन है, जो कि डेटा के कुछ (आमतौर पर बड़ी) मात्रा का उपयोग करने पर ध्यान केंद्रित करती है, या तो भविष्य के उत्तरों की भविष्यवाणी करती है या मौजूदा डेटा में पैटर्न को बेहतर ढंग से समझती है। निश्चित रूप से इसमें शामिल होने के लिए एक महान क्षेत्र है, लेकिन कुछ नहीं जिसे आप केवल गठजोड़ और गणित और एल्गोरिदम के कुछ गहन अध्ययन के बिना कर सकते हैं। विषय पर एक अच्छी किताब यह एक है

"बिजनेस इंटेलिजेंस" वाकई एक विशिष्ट तकनीक की तुलना में वास्तव में अधिक है, और इसका अर्थ अलग-अलग लोगों के लिए अलग-अलग हो सकता है आधार पर, यह विचार व्यापार डेटा के साथ कम गूंगा सामान करने का सुझाव देता है, और आमतौर पर यह समय के साथ रुझानों का विश्लेषण करता है, अक्सर ओएलएपी का उपयोग करते हुए इसमें डेटा खनन या एआई एल्गोरिदम भी शामिल हो सकते हैं, लेकिन चूंकि कोई कठोर परिभाषा नहीं है, बस किसी के बारे में जो आपको कुछ बेचना चाहता है, आपको बताएगा कि वह "बिजनेस इंटेलिजेंस" प्रदान करता है, और आशा करता है कि आप आगे नहीं खुलेंगे।

मैं कल सहकर्मी से बात कर रहा था एक स्थिति के बारे में जहां उन्होंने एसएसआईएस (या ऐसा कुछ) का इस्तेमाल किया था, जिसमें एसएसआईएस पैकेज के साथ कुछ वाकई अच्छी बात थी, जहां उन्होंने "डॉ। रेगिनलड विलियम्स, पीएचडी" नाम से एक पास किया। और कुछ वेटिंग स्कीम के आधार पर सिस्टम को यह समझने में काफी मज़बूत था कि इसे कैसे टोकाना और इसे डेटाबेस में "नमस्कार - प्रथम नाम - अंतिम नाम - प्रत्यय" के रूप में संग्रहीत करना है। उन्होंने बिज़, और एसएसआईएस, ईटीएल, और डाटा खनन जैसे कुछ बुझानेवालों को फेंक दिया। मैं वास्तव में अधिक जानकारी चाहता था, लेकिन यह भी नहीं पता था कि कहां शुरू करना है।

मैं एक। नेट डेवलपर हूं और सी #, वीबी नेट, WPF, आदि में पूरी तरह से वाकिफ हूं ... लेकिन मुझे यह पता नहीं है कि ये तकनीक क्या हैं, उन्हें मेरे कौशल सेट में कैसे जोड़ना है और यह कुछ ऐसा है या नहीं मैं वास्तव में पर ध्यान केंद्रित किया जाना चाहिए। कोई और सभी दिशा उपयोगी होगा


एसएसआईएस एसक्यूएल सर्वर एकीकरण सेवाएं है और ETL (निकालें, ट्रांसफ़ॉर्म, और लोड) करने के लिए उपयोगी है जो कई डेटा वेयरहाउसिंग / व्यवसायिक खुफिया समाधानों के सामने अंत हैं जो डेटा आयामी मॉडलों का उपयोग करने में आसान डेटा को एकीकृत करते हैं। एसएसआईएस भी छोटी परियोजनाओं के लिए उपयोगी है क्योंकि विरासत डेटा या अन्य रिपॉजिटरी या फाइलों के डेटा को लोड करने का एक सुविधाजनक तरीका है।

डाटा माइनिंग आमतौर पर सूचनाओं का अनुमान लगाने के लिए एकीकृत स्रोतों से डेटा का उपयोग करने का तात्पर्य करती है जो लेन-देन संबंधी डेटा से स्पष्ट नहीं होगा (कई स्रोतों के एकीकरण के माध्यम से डेटा को "आयाम" देने के लिए।

द्विपक्षीय एक बड़ा विषय है, इसलिए जब तक आप उस क्षेत्र में नहीं जाना चाहते हैं, पर ध्यान केंद्रित करने के लिए कुछ नहीं हो सकता है, लेकिन SSIS छोटी परियोजनाओं पर उपयोगी हो सकता है और किसी भी घटना में सीखने के लायक है।


इन सभी "नई" शर्तों का कारण वास्तव में दुनिया में डेटा की तीव्रता (घातीय) बढ़ रही है। बीआई (विकिपीज) जोरदार "डेटा वेअरहाउस" शब्द के साथ जुड़ा हुआ है (यह बीआई प्रक्रियाओं के भीतर केंद्रीय इकाई है) और साथ ही "डाटा माइनिंग" शब्द के साथ।
ईटीएल पर अधिक मैं केवल यह जोड़ूंगा कि एसएसआईएस माइक्रोसॉफ्ट का एक उत्पाद है, लेकिन कई अन्य ईटीएल उपकरण हैं, जिनमें सबसे प्रसिद्ध हैं: इनफॉरमैटिका, पट्टाहो, आईबीएम इंफोसिअर इंफॉर्मेशन सर्वर, ओरेकल का डाटा इंटिग्रेटर और तालेंड आदि। ईटीएल भी अक्सर लिखित हैं किसी भी प्रोग्रामिंग भाषा (हम उन्हें अजगर और यहां तक ​​कि गोलांग में भी था)।


एसएसआईएस == एसक्यूएल सर्वर इंटीग्रेशन सर्विसेज और यह एक एक्स्ट्रेक्ट ट्रांसफोर्म एंड लोड (ईटीएल) टूल है, यह SQL7, एसक्यूएल 2 के युग में डेटा ट्रांसफ़ॉर्मेशन सर्विसेज या डीटीएस में क्या था, इसका अब तक बेहतर कार्यान्वयन है। वर्कफ़्लो प्रक्रियाओं को व्यक्त करने के लिए यह एक महान उपकरण है जिसमें डेटा को बिंदु A से बी (और सी और डी आदि) पर ले जाया जाता है और उस प्रक्रिया के माध्यम से परिवर्तन की प्रक्रिया होती है जैसे डिनोर्मालाइज्ड डिज़ाइन या डेटा सफाई के लिए समेकन।

द्विपक्षीय या व्यापार खुफिया तकनीक दुनिया में एक पूरी श्रेणी के लिए एक moniker है और यह अभी ठीक होने के लिए एक महान जगह है। द्विपक्षीय कौशल बहुत मूल्यवान और कठिन हैं, एक कारण यह है कि यह एक प्रयोगशाला में एक सच्चे द्विपक्षीय मामले को फिर से बनाना मुश्किल है, क्योंकि शिक्षण लगभग हमेशा एक वास्तविक स्थिति में किया जाता है।

उच्च स्तर से, द्विपक्षीय परियोजनाओं में आमतौर पर रिपोर्टिंग का अंत बिंदु होता है कई बार डेवलपर्स के रूप में हम लेनदेन रिपोर्ट लिखने के लिए उपयोग किए जाते हैं जैसे पीओ का विवरण, लेकिन बीआई बहुत व्यापक रिपोर्टों में मिल सकता है जो दशकों से उत्पाद की बिक्री के रुझान को कवर करता है और लाखों रिकॉर्डों के साथ काम करता है। जिस तरह से हम अनुप्रयोगों के लिए डेटाबेस डिज़ाइन करते हैं, इस प्रकार की रिपोर्टिंग के लिए आदर्श नहीं है, इसलिए अन्य उपकरण और तकनीकों का आविष्कार किया गया है और द्विपक्षीय अंतरिक्ष में उपयोग किया जाता है। ये क्यूब्स जैसी चीजें हैं जिन्हें आप ओएलएपी क्यूब्स नामक अक्सर सुनाते हैं। ओएलएपी क्यूब्स आमतौर पर एक डेटा गोदाम से उत्पन्न होता है जो एक और डाटाबेस से ज्यादा कुछ नहीं है - लेकिन ठेठ गोदामों में एक से अधिक डेटा आते हैं, और कई अन्य दर्जनों अन्य अनुप्रयोग डाटाबेस भी होते हैं आपकी इन्वेंट्री ऐप, क्रय ऐप, एचआर ऐप और दूसरों की एक पूरी गुच्छा में सभी बिट्स और डेटा के टुकड़े होते हैं जो व्यापार की पूरी तस्वीर बनाते हैं, एक द्विपदीय आर्किटेक्ट एसएसआईएस जैसी कुछ चीजों को इन सभी सिस्टमों से डेटा खींचने के लिए इस्तेमाल करेगा, इसे मालिश करें और इसे डेटा गोदाम में संग्रहीत करता है जिसे रिपोर्टिंग के लिए एक अलग तरह के डिजाइन के साथ डिज़ाइन किया गया है। गोदाम में आने के बाद वह उस डेटा पर क्यूब्स बनाने के लिए विश्लेषण सेवाओं का उपयोग करेगा और रिपोर्टिंग सेवाओं की तरह आपको उस डेटा पर रिपोर्ट दिखाने के लिए कुछ भी करेगा।

संपादित करें: क्षमा करें, डेटा माइनिंग को भूल गया, यह एक और गैर-विशिष्ट शब्द है जो वर्णन करता है और अवधारणा या प्रक्रिया और एक ऐसा उपकरण नहीं है। एक सरल उदाहरण में, यह डेटा में पैटर्न की पहचान करने के लिए एक पद्धतिगत दृष्टिकोण है। अतीत में एक अच्छा व्यवसाय एनालिसी प्रवृत्तियों के लिए डेटा के माध्यम से देखेगा लेकिन आधुनिक डाटाबेस के साथ आप डेटासेट के बारे में बात कर रहे हैं जिसकी मैन्युअल रूप से मैन्युअल कंजिंग से बात कर रहे हैं - डेटा खनन आपको उस डेटा के माध्यम से कंघी बनाने के लिए कंप्यूटर को निर्देश देने और रुचियों के पैटर्न की पहचान करने की अनुमति देता है ।

उम्मीद है की वो मदद करदे