search - सोलर बनाम लोचदार खोज




solr lucene (8)

इन प्रौद्योगिकियों के बीच मुख्य वास्तुकला अंतर क्या हैं?

इसके अलावा, आम तौर पर प्रत्येक के लिए केस का उपयोग अधिक उपयुक्त होता है?


अद्यतन करें

अब सवाल दायरे को सही किया गया है, मैं इस संबंध में कुछ भी जोड़ सकता हूं:

अपाचे सोलर और ElasticSearch बीच कई ElasticSearch उपलब्ध हैं, इसलिए मैं उन लोगों का संदर्भ दूंगा जो मुझे सबसे उपयोगी साबित हुए हैं, यानी सबसे महत्वपूर्ण पहलुओं को कवर करना:

  • बॉब योप्लाइट ने पहले ही एलिचस्टर्च, स्फिंक्स, लुसीन, सोलर, ज़ापियन के किम्मी के जवाब को जोड़ा है। किस उपयोग के लिए फिट बैठता है? , जो कारणों को सारांशित करता है कि वह आगे क्यों गए और एलैस्टिकशर्च बनाया , जो उनकी राय में एक बेहतर वितरण मॉडल प्रदान करता है और सोलर की तुलना में उपयोग में आसानी प्रदान करता है

  • रयान सोननेक रीयलटाइम सर्च: सोलर बनाम लोचदार खोज एक अंतर्दृष्टिपूर्ण विश्लेषण / तुलना प्रदान करता है और बताता है कि वह पहले से ही एक खुश सौर उपयोगकर्ता होने के बावजूद सोलर से लोचदार से स्विच क्यों कर रहा है - वह इसे निम्नानुसार सारांशित करता है:

    मानक खोज अनुप्रयोगों का निर्माण करते समय सोलर पसंद का हथियार हो सकता है, लेकिन लोचदार खोज आधुनिक रीयलटाइम खोज अनुप्रयोग बनाने के लिए इसे आर्किटेक्चर के साथ अगले स्तर पर ले जाता है। पर्कोलेशन एक रोमांचक और अभिनव विशेषता है जो अकेले पानी से बाहर सौर को उड़ाती है। Elasticsearch स्केलेबल, तेज़ और एक सपना एकीकृत करने के लिए है । Adios Solr, यह आपको जानकर अच्छा लगा। [जोर मेरा]

  • लोचदार खोज पर विकिपीडिया लेख प्रतिष्ठित जर्मन आईएक्स पत्रिका से comparison करता है, लिस्टिंग फायदे और नुकसान, जो कि पहले से ऊपर क्या कहा गया है, संक्षेप में संक्षेप में बताता है:

    फायदे :

    • लोचदार खोज वितरित की जाती है। कोई अलग परियोजना की आवश्यकता नहीं है। प्रतिकृतियां वास्तविक समय के पास भी हैं, जिन्हें "पुश प्रतिकृति" कहा जाता है।
    • लोचदार खोज पूरी तरह से अपाचे ल्यूसीन की वास्तविक वास्तविक समय की खोज का समर्थन करती है।
    • बहुसंख्यक हैंडलिंग एक विशेष विन्यास नहीं है, जहां सोलर के साथ एक और उन्नत सेटअप आवश्यक है।
    • लोचदार खोज गेटवे की अवधारणा का परिचय देती है, जो पूर्ण बैकअप को आसान बनाती है।

    नुकसान :

प्रारंभिक उत्तर

वे पूरी तरह से अलग-अलग तकनीकों को पूरी तरह से अलग-अलग उपयोग मामलों को संबोधित करते हैं, इस प्रकार किसी भी सार्थक तरीके से इसकी तुलना नहीं की जा सकती है:

  • अपाचे सोलर - अपाचे सोलर आसान उपयोग में ल्यूसीन की क्षमताओं की पेशकश करता है, फास्ट सर्च सर्वर जैसे फीचर्स, स्केलेबिलिटी और बहुत कुछ

  • अमेज़ॅन ElastiCache - अमेज़ॅन ElastiCache एक वेब सेवा है जो क्लाउड में एक मेमोरी कैश को तैनात, संचालित और स्केल करना आसान बनाता है।

    • कृपया ध्यान दें कि अमेज़ॅन ElastiCache मेमकैच के साथ प्रोटोकॉल-अनुपालन है, व्यापक रूप से अपनाया जाने वाला मेमोरी ऑब्जेक्ट कैशिंग सिस्टम, इसलिए कोड, एप्लिकेशन और लोकप्रिय टूल जो आप आज मौजूदा मेमकैच वातावरण के साथ उपयोग करते हैं, सेवा के साथ सहजता से काम करेंगे (विवरण के लिए Memcached देखें)।

[जोर मेरा]

हो सकता है कि यह निम्नलिखित दो संबंधित प्रौद्योगिकियों के साथ एक या दूसरे तरीके से उलझन में है:

  • ElasticSearch - यह एक ओपन सोर्स (अपाचे 2) है, वितरित, रीस्टफुल, खोज इंजन अपाचे ल्यूसीन के शीर्ष पर बनाया गया है।

  • अमेज़ॅन क्लाउडशर्च - अमेज़ॅन क्लाउडशर्च क्लाउड में पूरी तरह से प्रबंधित खोज सेवा है जो ग्राहकों को अपने अनुप्रयोगों में तेज़ी से और अत्यधिक स्केलेबल खोज कार्यक्षमता को आसानी से एकीकृत करने की अनुमति देती है।

सोलर और लोचदार खोज प्रसाद पहली नजर में समान रूप से समान लगते हैं, और दोनों ही बैकएंड सर्च इंजन, जैसे अपाचे ल्यूसीन का उपयोग करते हैं

जबकि सौर पुराना है, काफी बहुमुखी और परिपक्व और व्यापक रूप से तदनुसार उपयोग किया जाता है, लोचदार खोज विशेष रूप से आधुनिक बादल वातावरण में स्केलेबिलिटी आवश्यकताओं के साथ सोलर कमियों को संबोधित करने के लिए विकसित किया गया है, जो सोलर के साथ संबोधित करने के लिए कठिन (एर) हैं।

हाल ही में हाल ही में पेश किए गए अमेज़ॅन क्लाउडशर्च के साथ लोचदार खोज की तुलना करने के लिए यह संभवतः सबसे उपयोगी होगा (प्रारंभिक पोस्ट देखें $ 100 / माह से कम के लिए एक घंटे में खोजना प्रारंभ करें ), क्योंकि दोनों सिद्धांतों में समान उपयोग मामलों को कवर करने का दावा करते हैं।


अपाचे सोलर के लंबे इतिहास के बाद से, मुझे लगता है कि सौर की एक ताकत इसके पारिस्थितिकी तंत्र है । विभिन्न प्रकार के डेटा और उद्देश्यों के लिए कई सोलर प्लगइन्स हैं।

निम्न परतों में नीचे से ऊपर तक प्लेटफॉर्म खोजें:

  • डेटा
    • उद्देश्य: विभिन्न डेटा प्रकारों और स्रोतों का प्रतिनिधित्व करें
  • दस्तावेज़ निर्माण
    • उद्देश्य: अनुक्रमण के लिए दस्तावेज़ जानकारी बनाएं
  • अनुक्रमण और खोज
    • उद्देश्य: दस्तावेज़ अनुक्रमणिका बनाएं और क्वेरी करें
  • तर्क वृद्धि
    • उद्देश्य: खोज क्वेरी और परिणामों को संसाधित करने के लिए अतिरिक्त तर्क
  • खोज मंच सेवा
    • उद्देश्य: एक सेवा मंच प्रदान करने के लिए खोज इंजन कोर की अतिरिक्त कार्यक्षमताओं को जोड़ें।
  • यूआई आवेदन
    • उद्देश्य: अंतिम उपयोगकर्ता खोज इंटरफ़ेस या अनुप्रयोग

संदर्भ लेख: एंटरप्राइज़ खोज


मैं केवल लोचदार-खोज का उपयोग करता हूं। चूंकि मैंने पाया कि हलर शुरू करना बहुत मुश्किल है। लोचदार खोज की विशेषताएं:

  1. शुरू करने में आसान, बहुत कम सेटिंग। यहां तक ​​कि एक नौसिखिया कदम से क्लस्टर चरण भी स्थापित कर सकता है।
  2. सरल Restful API जो NoSQL क्वेरी का उपयोग कर रहा है। और आसान पहुंच के लिए कई भाषा पुस्तकालयों।
  3. अच्छा दस्तावेज़, आप पुस्तक पढ़ सकते हैं:। आधिकारिक वेबसाइट पर एक वेब संस्करण है।

मैं देखता हूं कि उपर्युक्त उत्तरों में से कुछ अब तारीख से बाहर हैं। मेरे परिप्रेक्ष्य से, और मैं दैनिक आधार पर सोलर (क्लाउड और गैर-क्लाउड) और लोचदार खोज दोनों के साथ काम करता हूं, यहां कुछ दिलचस्प अंतर हैं:

  • समुदाय: सोलर का एक बड़ा, अधिक परिपक्व उपयोगकर्ता, देव और योगदानकर्ता समुदाय है। ईएस में उपयोगकर्ताओं का एक छोटा, लेकिन सक्रिय समुदाय और योगदानकर्ताओं का बढ़ता समुदाय है
  • परिपक्वता: सौर अधिक परिपक्व है, लेकिन ईएस तेजी से बढ़ी है और मैं इसे स्थिर मानता हूं
  • प्रदर्शन: न्याय करने के लिए मुश्किल है। मैंने / हमने प्रत्यक्ष प्रदर्शन मानक नहीं किए हैं। लिंक्डइन में एक व्यक्ति ने सोलर बनाम ईएस बनाम सेंसी की तुलना एक बार की थी, लेकिन प्रारंभिक परिणामों को अनदेखा किया जाना चाहिए क्योंकि उन्होंने सोलर और ईएस दोनों के लिए गैर-विशेषज्ञ सेटअप का उपयोग किया था।
  • डिज़ाइन: लोग सोलर से प्यार करते हैं। जावा एपीआई कुछ हद तक वर्बोज़ है, लेकिन लोगों को यह कैसे लगाया जाता है। सोलर कोड दुर्भाग्य से हमेशा बहुत सुंदर नहीं है। इसके अलावा, ईएस में शेर्डिंग, रीयल-टाइम प्रतिकृति, दस्तावेज़ और रूटिंग अंतर्निहित है। हालांकि इनमें से कुछ सोलर में भी मौजूद हैं, लेकिन यह एक विचार के बाद थोड़ा सा लगता है।
  • समर्थन: सोलर और लोचदार खोज दोनों के लिए तकनीक और परामर्श सहायता प्रदान करने वाली कंपनियां हैं। मुझे लगता है कि एकमात्र कंपनी जो दोनों के लिए समर्थन प्रदान करती है वह सेमेटेक्स्ट है (प्रकटीकरण: मैं सेमेटेक्स्ट संस्थापक हूं)
  • स्केलेबिलिटी: दोनों को बहुत बड़े समूहों में स्केल किया जा सकता है। एसओएल के प्री-सोलर 4.0 संस्करण की तुलना में ईएस स्केल करना आसान है, लेकिन सोलर 4.0 के साथ अब यह मामला नहीं है।

सोलर बनाम लोचदार खोज विषय के अधिक गहन कवरेज के लिए http://blog.sematext.com/2012/08/23/solr-vs-elasticsearch-part-1-overview/ पर एक नज़र डालें। सेमेटेक्स्ट से सीधी और तटस्थ सोलर बनाम लोचदार खोज तुलना करने वाली पोस्ट की श्रृंखला में यह पहला पोस्ट है। प्रकटीकरण: मैं सेमेटेक्स्ट पर काम करता हूं।


मैं नेट अनुप्रयोगों के लिए सोलर और लोचदार खोज दोनों पर काम कर रहा हूं। मेरे सामने जो बड़ा अंतर है, वह है

लोचदार खोज:

  • अधिक कोड और कम कॉन्फ़िगरेशन, हालांकि एपीआई बदलने के लिए हैं लेकिन अभी भी एक कोड परिवर्तन है
  • जटिल प्रकारों के लिए, प्रकारों के प्रकार टाइप करें यानी नेस्टेड प्रकार (सोलर में प्राप्त करने में सक्षम नहीं था)

सौर:

  • कम कोड और अधिक विन्यास और इसलिए कम रखरखाव
  • पूछताछ के दौरान परिणामों को समूहीकृत करने के लिए (लोचदार खोज में प्राप्त करने के लिए बहुत सारे काम कम से कम रास्ते में)

मैंने 3 साल के लिए लोचदार खोज का उपयोग किया है और लगभग एक महीने तक सोलर, मुझे लगता है कि सौर स्थापना की तुलना में लोचदार खोज क्लस्टर स्थापित करना काफी आसान है। Elasticsearch में महान स्पष्टीकरण के साथ सहायता दस्तावेज़ों का एक पूल है। उपयोग के मामले में से एक मैं हिस्टोग्राम एकत्रीकरण के साथ फंस गया था जो ईएस में उपलब्ध था हालांकि सोलर में नहीं मिला था।


सोलर में एक घोंसला वाला दस्तावेज़ बहुत जटिल और नेस्टेड डेटा खोज भी बहुत जटिल है। लेकिन लोचदार खोज नेस्टेड दस्तावेज़ और खोज जोड़ने के लिए आसान है


हालांकि उपर्युक्त सभी लिंक मेरिट हैं, और पिछले कुछ वर्षों से विभिन्न ल्यूसीन सर्च इंजनों के लिए भाषाविद के रूप में "उजागर" के रूप में, मुझे यह कहना है कि पाइथन में लोचदार खोज विकास बहुत तेज है। ऐसा कहा जा रहा है कि, कुछ कोड मेरे लिए सहज नहीं थे। तो, मैं एक ओपन सोर्स परिप्रेक्ष्य से ईएलके स्टैक, किबाना के एक घटक तक पहुंच गया, और पाया कि मैं किबाना में बहुत आसानी से लोचदार खोज का कुछ गूढ़ कोड उत्पन्न कर सकता हूं। इसके अलावा, मैं क्रोम सेंस ए प्रश्नों को किबाना में भी खींच सकता हूं। यदि आप ईएस का मूल्यांकन करने के लिए किबाना का उपयोग करते हैं, तो यह आपके मूल्यांकन को और तेज करेगा। अन्य प्लेटफ़ॉर्म पर चलाने के लिए घंटों का समय कुछ समय में सबसे खराब (सबसे बड़ा डेटा सेट) में लोचदार खोज (रीस्टफुल इंटरफ़ेस) के शीर्ष पर सेंस में जेएसओएन में चल रहा था और चल रहा था; सेकंड में सबसे अच्छा। लोचदार खोज के लिए प्रलेखन, जबकि 700+ पृष्ठों ने उन प्रश्नों का उत्तर नहीं दिया जो सामान्य रूप से एसओएलआर या अन्य लुसीन दस्तावेज में हल किए जाएंगे, जो स्पष्ट रूप से विश्लेषण के लिए अधिक समय लेते थे। साथ ही, आप लोचदार-खोज में एग्रीगेट्स को देखना चाह सकते हैं, जिसने फ़ेसटिंग को नए स्तर पर ले लिया है।

बड़ी तस्वीर: यदि आप डेटा साइंस, टेक्स्ट एनालिटिक्स, या कम्प्यूटेशनल भाषाविज्ञान कर रहे हैं, तो लोचदार खोज में कुछ रैंकिंग एल्गोरिदम हैं जो सूचना पुनर्प्राप्ति क्षेत्र में अच्छी तरह से नवाचार करने लगते हैं। यदि आप किसी भी टीएफ / आईडीएफ एल्गोरिदम का उपयोग कर रहे हैं, टेक्स्ट फ्रीक्वेंसी / इनवर्स डॉक्यूमेंट फ्रीक्वेंसी, लोचदार खोज इस 1960 के एल्गोरिदम को एक नए स्तर तक बढ़ाता है, यहां तक ​​कि बीएम 25, बेस्ट मैच 25 और अन्य प्रासंगिकता रैंकिंग एल्गोरिदम का उपयोग भी करता है। इसलिए, यदि आप शब्दों, वाक्यांशों या वाक्यों को स्कोरिंग या रैंकिंग कर रहे हैं, तो लोचदार खोज फ्लाई पर यह स्कोरिंग करता है, अन्य डेटा एनालिटिक्स के बड़े ओवरहेड के बिना घंटों लगते हैं - एक और लोचदार समय बचत। एसएस के साथ, रीयल-टाइम जेएसओएन डेटा प्रासंगिकता स्कोरिंग और रैंकिंग के साथ समेकन से बाल्टीिंग की कुछ ताकतों को जोड़कर, आप अपने चुस्त (कहानियों) या वास्तुशिल्प (मामलों का उपयोग) दृष्टिकोण के आधार पर एक विजेता संयोजन पा सकते हैं।

नोट: उपरोक्त समेकन पर एक समान चर्चा देखी गई, लेकिन समेकन और प्रासंगिकता स्कोरिंग पर नहीं - किसी भी ओवरलैप के लिए मेरी माफ़ी। प्रकटीकरण: मैं लोचदार के लिए काम नहीं करता हूं और एक अलग वास्तुकला पथ के कारण निकट भविष्य में अपने उत्कृष्ट काम से लाभ नहीं उठा पाऊंगा, जब तक कि मैं लोचदार खोज के साथ कुछ दान कार्य नहीं करता, जो एक बुरा विचार नहीं होगा





elasticsearch