machine learning आईआरआईएस डाटासेट के साथ एक छिपी नोड के साथ मुझे अच्छी सटीकता क्यों मिलती है?




machine-learning neural-network (2)

बस डीएमएलैश के अच्छे उत्तर को जोड़ना: आईरिस डेटा सेट का केवल एक विशेषता पर सिर्फ तीन सरल नियमों का उपयोग करके बहुत उच्च सटीकता (96%) के साथ भविष्यवाणी की जा सकती है:

If Petal.Width = (0.0976,0.791] then Species = setosa
If Petal.Width = (0.791,1.63]   then Species = versicolor
If Petal.Width = (1.63,2.5]     then Species = virginica

सामान्य तंत्रिका नेटवर्क में काले बक्से होते हैं, जहां आप वास्तव में कभी नहीं जानते हैं कि वे क्या सीख रहे हैं लेकिन इस मामले में बैक-इंजीनियरिंग को आसान होना चाहिए। यह कल्पनीय है कि यह ऊपर की तरह कुछ सीखा है

आईआरआईएस डेटा सेट पर परीक्षण करने के लिए मेरे पास एक बैक-प्रचार ट्रेनर के साथ एक तंत्रिका नेटवर्क का एक न्यूनतम उदाहरण है। मैंने 7 छुपा नोड्स के साथ शुरू किया और यह अच्छी तरह से काम किया।

मैंने छिपी परत में नोड्स की संख्या 1 को कम कर दी (यह असफल होने की उम्मीद), लेकिन यह देखकर हैरान हुआ कि सटीकता बढ़ गई

मैंने एज़ूर एमएल में प्रयोग की स्थापना की, बस मान्य करने के लिए कि यह मेरा कोड नहीं था वही बात है, एक छिपा नोड के साथ 98.3333% सटीकता।

क्या कोई मुझे समझा सकता है कि यहां क्या हो रहा है?


सबसे पहले, यह अच्छी तरह से स्थापित किया गया है कि विभिन्न प्रकार के वर्गीकरण मॉडल आईरिस पर बहुत अच्छे परिणाम देते हैं (आईरिस बहुत उम्मीदवार हैं); उदाहरण के लिए, यहां देखें।

दूसरे, हम देख सकते हैं कि आईरिस डाटासेट में अपेक्षाकृत कम विशेषताएं हैं। इसके अलावा, यदि आप डेटासेट विवरण को देख सकते हैं तो आप देख सकते हैं कि दो विशेषताओं का क्लास परिणामों से अत्यधिक संबंध है।

ये सहसंबंध मूल्य रैखिक, एकल-फीचर सहसंबंध हैं, जो इंगित करता है कि कोई एक रैखिक मॉडल को लागू कर सकता है और अच्छे परिणाम देख सकता है। तंत्रिका जाल अत्यधिक गैररेखा है; वे अधिक से अधिक जटिल हो जाते हैं और छिपे हुए नोड्स और छिपी हुई परतों की संख्या बढ़ने के कारण अधिक से अधिक और अधिक गैर-अक्षीय सुविधा संयोजनों को कैप्चर करते हैं।

इन तथ्यों को ध्यान में रखते हुए, कि (ए) के साथ शुरू करने के लिए कुछ विशेषताएं हैं और (बी) कि कक्षा के साथ उच्च रैखिक सहसंबंध हैं, सभी एक कम जटिल, रेखीय समारोह के लिए उपयुक्त भविष्यवाणी मॉडल के रूप में इंगित करेंगे - एक छिपी नोड, आप लगभग एक रैखिक मॉडल का उपयोग कर रहे हैं

यह भी ध्यान दिया जा सकता है कि, किसी भी छिपी हुई परत (यानी, सिर्फ इनपुट और आउटपुट नोड्स) के अभाव में, और जब रसद हस्तांतरण फ़ंक्शन का उपयोग किया जाता है, तो यह तर्कसंगत प्रतिगमन के बराबर है।







azure-machine-learning