python - अजगर में कोई बेवकूफ Bayesian वर्गीकृत?




machine-learning (4)

मैंने बेवकूफ Bayesian वर्गीकरण के लिए ऑरेंज फ्रेमवर्क की कोशिश की है। विधियां बेहद अनजान हैं, और दस्तावेज़ीकरण बेहद असंगठित है। क्या यहां किसी को भी सिफारिश करने के लिए एक और ढांचा है?

मैं अब ज्यादातर NaiveBayesian का उपयोग करें। मैं nltk के NaiveClassification का उपयोग करने के बारे में सोच रहा था लेकिन तब उन्हें नहीं लगता कि वे लगातार चर को संभाल सकते हैं।

मेरे विकल्प क्या हैं?


मैंने अभी पॉल ग्राहम की एलआईएसपी सामग्री ली और पाइथन http://www.paulgraham.com/spam.html परिवर्तित कर दिया


मैंने पाइथन बेयसियन वर्गीकरण का उपयोग करने के लिए सबसे आसान और आसान होने के लिए डिवमोड रेवरेंड पाया।


This शुरू करने के लिए एक अच्छी जगह हो सकती है। यह एक बेवकूफ Bayesian वर्गीकरण के एक पायथन कार्यान्वयन के लिए पूर्ण स्रोत कोड (पाठ पार्सर, डेटा भंडारण, और वर्गीकृत) है। हालांकि यह पूरा हो गया है, यह अभी भी एक सत्र में पचाने के लिए काफी छोटा है। मुझे लगता है कि कोड उचित रूप से अच्छी तरह से लिखा है और अच्छी तरह से टिप्पणी की है। यह प्रोग्रामिंग कलेक्टिव इंटेलिजेंस पुस्तक के लिए स्रोत कोड फ़ाइलों का हिस्सा है।

स्रोत प्राप्त करने के लिए, मुख्य फ़ोल्डर 'पीसीआई_Cओडी' से लिंक, डीएल और ज़िप को अनपैक करें, फ़ोल्डर 'अध्याय 6' पर जाएं, जिसमें एक पायथन स्रोत फ़ाइल 'docclass.py है। बेयसियन स्पैम फ़िल्टर के लिए यह पूर्ण स्रोत कोड है। प्रशिक्षण डेटा (ईमेल) एक एसक्लाइट डेटाबेस में बनाए रखा जाता है जिसे एक ही फ़ोल्डर ('test.db') में भी शामिल किया जाता है, आपको केवल एकमात्र बाहरी लाइब्रेरी की आवश्यकता होती है जो कि स्क्लाइट (pysqlite) के लिए पाइथन बाइंडिंग होती है; यदि आपको पहले से इंस्टॉल नहीं किया गया है तो आपको खुद को स्क्लाइट की भी आवश्यकता है)।


scikit-learn में scikit-learn बेयसियन वर्गीकरण का implementation है। आम तौर पर, इस पुस्तकालय का लक्ष्य कोड के बीच एक अच्छा व्यापार प्रदान करना है जो पढ़ने और उपयोग करने में आसान और दक्षता है। उम्मीद है कि यह एल्गोरिदम काम सीखने के लिए एक अच्छी पुस्तकालय होना चाहिए।







bayesian