java - जावा में माल्ट पार्सर के साथ कच्चे पाठ को पार्स करें



parsing nlp (1)

मुझे पता चला कि अजगर में एनएलकेटी * कच्चे_प्रेरक * फ़ंक्शन के माध्यम से करता है लेकिन मुझे जावा का उपयोग करने की आवश्यकता है मैंने पाया कि क्लीर्टक में माल्टपर्सर आवरण है लेकिन इसके बारे में कोई दस्तावेज नहीं है। मैं किसी फ़ंक्शन या एक प्रोजेक्ट की तलाश कर रहा हूं जो पहले कन्वर्ट किया गया इंग्लिश पाठ को conll फ़ाइल में परिवर्तित करता है जो कि माल्टपर्सर इसे माल्टपर्सर के साथ उपयोग और पार्स कर सकता है किसी भी मदद की सराहना की है


फ़ोल्डर उदाहरण / एपीएक्सम्प्लेज़ / एसआरसीएक्स में माल्ट पार्सर 1.7.2 वितरण के साथ आने वाले उदाहरण हैं।

हालांकि, ये उदाहरण केवल दिखाते हैं कि कैसे माल्टीपीर्स प्रोग्राम को टॉकेनाइजेशन और पॉज़-टैगिंग के बाद पहले से ही चलाया जाता है (और इन चरणों के आउटपुट को कनएल-जैसी प्रारूप में कनवर्ट किया गया है)।

चूंकि मैं वर्तमान में एक बेहतर (सरल / छोटे) विकल्प प्रदान नहीं कर सकता, इसलिए कम से कम मैं आपके साथ ग्रोवी स्क्रिप्ट के लिए एक लिंक साझा कर सकता हूं जो टोकनिंग, भाग-की-स्पीच टैगिंग (ओपनएनएलपी का उपयोग करके) और निर्भरता पार्सिंग (माल्टापार्सर का उपयोग करके) करता है। उपकरण को यूआईएमए का उपयोग करके इंटरऑपरेट किया जाता है। यदि कोई मैवेन से परिचित है, तो उस स्क्रिप्ट के जावा संस्करण को प्राप्त करने के लिए काफी सीधे आगे होना चाहिए।

मन, यह सबसे अच्छा जवाब नहीं है, लेकिन इस बिंदु पर संभवतः कुछ भी नहीं है।

नोट: मैं दोनों पर एक डेवलपर हूं, अपाचे यूआईएमए और डीकेपी कोर (परियोजना के लिए लिंक बिंदु)।





cleartk