artificial intelligence वर्गीकरण एल्गोरिथ्म के प्रदर्शन को मापना




artificial-intelligence machine-learning (2)

आप इसके लिए 10-गुना क्रॉस-वैल्यूशन इस्तेमाल कर सकते हैं। मेरा मानना ​​है कि यह वर्गीकरण एल्गोरिदम प्रदर्शन मूल्यांकन के लिए बहुत मानक दृष्टिकोण है।

मूल विचार आपके सीखने के नमूनों को 10 सबसेट्स में विभाजित करना है फिर टेस्ट डेटा के लिए टेस्ट डेटा और अन्य लोगों के लिए एक सबसेट का उपयोग करें। प्रत्येक उपसमुच्चय के लिए इसे दोहराएं और अंत में औसत प्रदर्शन की गणना करें।

मेरे हाथ में एक वर्गीकरण समस्या है, जो मैं एक मशीन सीखने एल्गोरिदम (Bayes, या Markovian शायद, सवाल क्लासीफायर पर उपयोग करने के लिए स्वतंत्र है) के साथ पता करना चाहते हैं कई प्रशिक्षण उदाहरणों को देखते हुए, मैं एक कार्यान्वयन वाले वर्गीय के प्रदर्शन को मापने के लिए एक मार्ग की तलाश कर रहा हूं, जिससे डेटा को अधिक मात्रा में लेना पड़ता है।

यही है: एन [1..100] प्रशिक्षण नमूने दिए गए हैं, अगर मैं नमूने के हर एक पर प्रशिक्षण एल्गोरिथ्म चलाता हूं, और फिटनेस को मापने के लिए बहुत ही नमूनों का इस्तेमाल करता हूं, तो यह एक डेटा की समस्या से अधिक फंस सकता है-क्लासिफ़िकेटर को पता चल जाएगा प्रशिक्षण के उदाहरणों के लिए सटीक उत्तर, बहुत भविष्य कहनेवाली शक्ति के बिना, फिटनेस के परिणाम बेकार के लिए प्रदान करते हैं

एक स्पष्ट समाधान हाथ से टैग किए गए नमूनों को प्रशिक्षण में अलग करना होगा, और टेस्ट नमूने; और मैं प्रशिक्षण के लिए सांख्यिकीय महत्वपूर्ण नमूने चुनने के तरीकों के बारे में सीखना चाहता हूं।

सफेद कागज़ात, किताब संकेतक, और पीडीएफ बहुत सराहना करते हैं!


श्री ब्राउनस्टोन ने कहा कि 10-गुना क्रॉस-वैलिडेशन शायद सबसे अच्छा तरीका है। मुझे हाल ही में इसके लिए विभिन्न क्लासिफायरों के प्रदर्शन का मूल्यांकन करना था I जिनके पास एपीआई और टूल्स का भार है जो आपको विभिन्न क्लासिफायरों के प्रदर्शन की आसानी से परीक्षा देने की सुविधा देता है।