language agnostic वजन Paraphrasing के लिए उपयोग करने के लिए एक अच्छी प्राकृतिक भाषा पुस्तकालय क्या है?




हिंदी में पुस्तकालय विज्ञान के लिए यूजीसी नेट हल प्रश्न पत्र (4)

मैं मौजूदा पुस्तकालयों को संक्षेप करने या सामग्री की व्याख्या करने के लिए देख रहा हूं (मैं ब्लॉग पोस्ट के लिए लक्ष्य बना रहा हूं) - मौजूदा प्राकृतिक भाषा संसाधन पुस्तकालयों के साथ कोई अनुभव?

मैं विभिन्न भाषाओं के लिए खोल रहा हूं, इसलिए मुझे क्षमताओं और सटीकता में अधिक दिलचस्पी है।


ग्रोक की कुछ चर्चा हुई थी यह अब ओपनसीसीजी के रूप में समर्थित है, और साथ ही ओपनएनएलपी में फिर से कार्यान्वित किया जाएगा।

आप ओपनसीसीजी http://openccg.sourceforge.net/ पर पा सकते हैं मैं यहां कुरान और क्लार्क सीसीजी पार्सर्स का भी सुझाव दे सकता हूं: http://svn.ask.it.usyd.edu.au/trac/candc/wiki

असल में, संक्षेप के लिए, आपको क्या करने की ज़रूरत है कुछ लिखना है जो पहले ब्लॉग पोस्ट के वाक्य का निष्कर्ष बताता है, इन पदों का अर्थिक अर्थ निष्कर्ष निकालता है, और फिर शब्दकोष के शब्दों के माध्यम से खोजता है जो रचनात्मक रूप से एक ही शब्दार्थ जिसका अर्थ है, और फिर वह एक चुनें जो मौजूदा वाक्य से मेल नहीं खाता है। यह एक लंबा समय लगेगा और यह बहुत सारा अर्थ नहीं बना सकता है यह मत भूलो कि ऐसा करने के लिए, आपको पास-परिपूर्ण anaphora संकल्प और प्रवचन-स्तर के निष्कर्ष लेने की क्षमता की आवश्यकता होगी।

यदि आप बस ब्लॉग पोस्ट बनाने की तलाश कर रहे हैं जिसमें मशीन-पहचान योग्य डुप्लिकेट सामग्री नहीं है, तो आप हमेशा विषय और फ़ोकस परिवर्तन और वर्डनेट समालोचना का उपयोग कर सकते हैं। निश्चित रूप से ऐसी साइटें हैं, जिन्होंने ऐडवर्ड्स से पैसा कमाया है, जो इससे पहले किया था


वास्तव में एआई टाइप डोमेन से वास्तव में दूर हो रहा है मैंने मुख्य रूप से Attempto Controlled English (देखें: http://attempto.ifi.uzh.ch/site/ ) का प्रयोग करते हुए मशीन में पाठ परिवर्तन में व्यापक कार्य किया है, यह एक स्वाभाविक भाषा है (अंग्रेजी) जो पूरी तरह से कंप्यूटर में संसाधित होती है विभिन्न ओटोलॉजीज, जैसे कि ओडब्ल्यूडब्ल्यूडीएल

ऐसा लगता है कि हम जिस तरह से उपज होगा ...

क्या आपके ब्लॉग पोस्ट के पहले कुछ वाक्यों को न केवल लेने के लिए और फिर अपने सारांश के लिए अंडाकार जोड़ना क्या कोई कारण है?


उन लिंक्स के लिए धन्यवाद ऐसा लगता है कि GROK मर चुका है - लेकिन यह मेरे उद्देश्यों के लिए अभी भी काम कर सकता है

2 और लिंक:

Attempto नियंत्रित अंग्रेजी एक दिलचस्प अवधारणा है: क्योंकि यह समस्या को देखने का एक पूरी तरह से रिवर्स तरीका है। मैं क्या करने की कोशिश कर रहा हूं, वास्तव में व्यावहारिक नहीं है

@ एमएमएटीएक्स कुछ वाक्य लेने के सुझाव के लिए - मैं सारांश प्रस्तुत करने की कोशिश नहीं कर रहा हूं: अन्यथा यह एक अच्छा जूडो समाधान होगा मैं वास्तव में सामग्री को अन्य मूल्यांकन उद्देश्यों के लिए उपयोग करने के लिए संक्षेप में देख रहा हूं।


मुझे लगता है कि वह स्वचालित रूप से स्पष्टीकरण के माध्यम से ब्लॉग पोस्ट उत्पन्न करना चाहता है जो कि यह सिस्टम इस प्रणाली की निगरानी कर रहा है।

यह वास्तव में दिलचस्प होगा यदि आप 2 से 10 ब्लॉग पोस्ट जो समान हैं, लेकिन अलग-अलग स्रोतों से जोड़ सकते हैं और फिर स्वचालित रूप से एक "असली" सारांश (1 ब्लॉग पोस्ट का आकार) कर सकते हैं।

यह होमवर्क के लिए भी महान हो सकता है दुर्भाग्य से ऐसा करना आसान नहीं है

मैं देख सकता था कि एकमात्र तरीका हर वाक्य को "अर्थ" में विघटित करने में सक्षम होना है, और फिर बेतरतीब ढंग से वाक्य संरचना और अर्थ को बनाए रखने के कुछ शब्दों को बदलना है।

ये वाक्यों का मतलब वही है:

  • मैं इस आदमी से नफरत करता हूं, वह बहुत गूंगा है।
  • यह आदमी बेवकूफ है, मैं उससे नफरत करता हूं
  • मैं इस गूंगा आदमी को तुच्छ जानता हूँ
  • वह गूंगा है, मैं उसे नफरत करता हूं

ये वाक्यों में से किसी एक को बदलने के लिए एक कार्यक्रम लिखने के लिए उत्तरदायी नहीं होगा, और यह साधारण वाक्य हैं, ब्लॉगों से असली वाक्यों को और अधिक जटिल है।





nlp