language agnostic - वजन - Paraphrasing के लिए उपयोग करने के लिए एक अच्छी प्राकृतिक भाषा पुस्तकालय क्या है?




हिंदी में पुस्तकालय विज्ञान के लिए यूजीसी नेट हल प्रश्न पत्र (4)

वास्तव में एआई टाइप डोमेन से वास्तव में दूर हो रहा है मैंने मुख्य रूप से Attempto Controlled English (देखें: http://attempto.ifi.uzh.ch/site/ ) का प्रयोग करते हुए मशीन में पाठ परिवर्तन में व्यापक कार्य किया है, यह एक स्वाभाविक भाषा है (अंग्रेजी) जो पूरी तरह से कंप्यूटर में संसाधित होती है विभिन्न ओटोलॉजीज, जैसे कि ओडब्ल्यूडब्ल्यूडीएल

ऐसा लगता है कि हम जिस तरह से उपज होगा ...

क्या आपके ब्लॉग पोस्ट के पहले कुछ वाक्यों को न केवल लेने के लिए और फिर अपने सारांश के लिए अंडाकार जोड़ना क्या कोई कारण है?

मैं मौजूदा पुस्तकालयों को संक्षेप करने या सामग्री की व्याख्या करने के लिए देख रहा हूं (मैं ब्लॉग पोस्ट के लिए लक्ष्य बना रहा हूं) - मौजूदा प्राकृतिक भाषा संसाधन पुस्तकालयों के साथ कोई अनुभव?

मैं विभिन्न भाषाओं के लिए खोल रहा हूं, इसलिए मुझे क्षमताओं और सटीकता में अधिक दिलचस्पी है।


उन लिंक्स के लिए धन्यवाद ऐसा लगता है कि GROK मर चुका है - लेकिन यह मेरे उद्देश्यों के लिए अभी भी काम कर सकता है

2 और लिंक:

Attempto नियंत्रित अंग्रेजी एक दिलचस्प अवधारणा है: क्योंकि यह समस्या को देखने का एक पूरी तरह से रिवर्स तरीका है। मैं क्या करने की कोशिश कर रहा हूं, वास्तव में व्यावहारिक नहीं है

@ एमएमएटीएक्स कुछ वाक्य लेने के सुझाव के लिए - मैं सारांश प्रस्तुत करने की कोशिश नहीं कर रहा हूं: अन्यथा यह एक अच्छा जूडो समाधान होगा मैं वास्तव में सामग्री को अन्य मूल्यांकन उद्देश्यों के लिए उपयोग करने के लिए संक्षेप में देख रहा हूं।


शायद गेट या बंद स्रोत, स्वामित्व और महँगा TextAnalyst COM API का प्रयास करना चाहते हैं


ग्रोक की कुछ चर्चा हुई थी यह अब ओपनसीसीजी के रूप में समर्थित है, और साथ ही ओपनएनएलपी में फिर से कार्यान्वित किया जाएगा।

आप ओपनसीसीजी http://openccg.sourceforge.net/ पर पा सकते हैं मैं यहां कुरान और क्लार्क सीसीजी पार्सर्स का भी सुझाव दे सकता हूं: http://svn.ask.it.usyd.edu.au/trac/candc/wiki

असल में, संक्षेप के लिए, आपको क्या करने की ज़रूरत है कुछ लिखना है जो पहले ब्लॉग पोस्ट के वाक्य का निष्कर्ष बताता है, इन पदों का अर्थिक अर्थ निष्कर्ष निकालता है, और फिर शब्दकोष के शब्दों के माध्यम से खोजता है जो रचनात्मक रूप से एक ही शब्दार्थ जिसका अर्थ है, और फिर वह एक चुनें जो मौजूदा वाक्य से मेल नहीं खाता है। यह एक लंबा समय लगेगा और यह बहुत सारा अर्थ नहीं बना सकता है यह मत भूलो कि ऐसा करने के लिए, आपको पास-परिपूर्ण anaphora संकल्प और प्रवचन-स्तर के निष्कर्ष लेने की क्षमता की आवश्यकता होगी।

यदि आप बस ब्लॉग पोस्ट बनाने की तलाश कर रहे हैं जिसमें मशीन-पहचान योग्य डुप्लिकेट सामग्री नहीं है, तो आप हमेशा विषय और फ़ोकस परिवर्तन और वर्डनेट समालोचना का उपयोग कर सकते हैं। निश्चित रूप से ऐसी साइटें हैं, जिन्होंने ऐडवर्ड्स से पैसा कमाया है, जो इससे पहले किया था





nlp