search - videos - मैच स्कोर




लुसीन स्कोर परिणाम (2)

ल्यूसीन में यदि आपके पास एकाधिक इंडेक्स थे जो प्रत्येक को केवल एक विभाजन को कवर करते थे। विभिन्न इंडेक्स पर एक ही खोज अलग-अलग स्कोर के साथ परिणाम क्यों लौटाती है? विभिन्न सर्वरों के परिणाम बिल्कुल मेल खाते हैं।

यानी अगर मैंने खोज की:

  • नाम - जॉन स्मिथ
  • डीओबी - 11/11/1934

विभाजन 0 0.345 का स्कोर लौटाएगा

विभाजन 1 0.337 का स्कोर लौटाएगा

दोनों बिल्कुल नाम और डीओबी पर मेल खाते हैं।


चूंकि मैं पूरी तरह से गलत नहीं हूं, तो सूचकांक पर स्कोर निर्धारित किया जाता है।

यदि आपके पास अलग-अलग अनुक्रमणिका हैं (अधिक / कम या अलग डेटा जो अनुक्रमित किया गया था), तो स्कोर अलग-अलग होगा:

http://lucene.apache.org/core/3_6_0/scoring.html

(चेतावनी: गणित शामिल है :-))


scoring में व्यस्त दस्तावेज़ आवृत्ति (आईडीएफ) शामिल है। यदि "जॉन स्मिथ" शब्द एक विभाजन में है, 0, 100 बार और विभाजन 1 में, एक बार। जॉन स्मिथ की खोज के लिए स्कोर विभाजन 1 में उच्च खोज होगा क्योंकि यह शब्द अधिक दुर्लभ है।

इसे पाने के लिए आपको अपने विभाजन को सभी विभाजनों पर होना होगा, या आपको आईडीएफ को ओवरराइड करना होगा।





lucene