python अजगर में कोई बेवकूफ Bayesian वर्गीकृत?




machine-learning (5)

मैंने बेवकूफ Bayesian वर्गीकरण के लिए ऑरेंज फ्रेमवर्क की कोशिश की है। विधियां बेहद अनजान हैं, और दस्तावेज़ीकरण बेहद असंगठित है। क्या यहां किसी को भी सिफारिश करने के लिए एक और ढांचा है?

मैं अब ज्यादातर NaiveBayesian का उपयोग करें। मैं nltk के NaiveClassification का उपयोग करने के बारे में सोच रहा था लेकिन तब उन्हें नहीं लगता कि वे लगातार चर को संभाल सकते हैं।

मेरे विकल्प क्या हैं?


scikit-learn में scikit-learn बेयसियन वर्गीकरण का implementation है। आम तौर पर, इस पुस्तकालय का लक्ष्य कोड के बीच एक अच्छा व्यापार प्रदान करना है जो पढ़ने और उपयोग करने में आसान और दक्षता है। उम्मीद है कि यह एल्गोरिदम काम सीखने के लिए एक अच्छी पुस्तकालय होना चाहिए।


मैंने अभी पॉल ग्राहम की एलआईएसपी सामग्री ली और पाइथन http://www.paulgraham.com/spam.html परिवर्तित कर दिया


This शुरू करने के लिए एक अच्छी जगह हो सकती है। यह एक बेवकूफ Bayesian वर्गीकरण के एक पायथन कार्यान्वयन के लिए पूर्ण स्रोत कोड (पाठ पार्सर, डेटा भंडारण, और वर्गीकृत) है। हालांकि यह पूरा हो गया है, यह अभी भी एक सत्र में पचाने के लिए काफी छोटा है। मुझे लगता है कि कोड उचित रूप से अच्छी तरह से लिखा है और अच्छी तरह से टिप्पणी की है। यह प्रोग्रामिंग कलेक्टिव इंटेलिजेंस पुस्तक के लिए स्रोत कोड फ़ाइलों का हिस्सा है।

स्रोत प्राप्त करने के लिए, मुख्य फ़ोल्डर 'पीसीआई_Cओडी' से लिंक, डीएल और ज़िप को अनपैक करें, फ़ोल्डर 'अध्याय 6' पर जाएं, जिसमें एक पायथन स्रोत फ़ाइल 'docclass.py है। बेयसियन स्पैम फ़िल्टर के लिए यह पूर्ण स्रोत कोड है। प्रशिक्षण डेटा (ईमेल) एक एसक्लाइट डेटाबेस में बनाए रखा जाता है जिसे एक ही फ़ोल्डर ('test.db') में भी शामिल किया जाता है, आपको केवल एकमात्र बाहरी लाइब्रेरी की आवश्यकता होती है जो कि स्क्लाइट (pysqlite) के लिए पाइथन बाइंडिंग होती है; यदि आपको पहले से इंस्टॉल नहीं किया गया है तो आपको खुद को स्क्लाइट की भी आवश्यकता है)।



SpamBayes भी हैं, जो मुझे लगता है कि स्पैम के बजाय, सामान्य बेवकूफ बेयसियन क्लैसिफ़ियर के रूप में उपयोग किया जा सकता है।





bayesian