development environment - एक अच्छा स्रोत कोड खोज इंजन क्या है?




development-environment search-engine (8)

मैं जिस कोडबेस पर काम करता हूं वह बहुत बड़ा है, और इसे प्रदर्शित करने में लगभग 20 मिनट लगते हैं। मैं एक अच्छा वेब आधारित स्रोत कोड खोज इंजन की खोज कर रहा हूं..कुडर्स.कॉम के इंट्रानेट संस्करण की तरह कुछ।

मैंने जो कुछ भी पाया है, वह कूर्ल्ल एंटरप्राइज संस्करण है, जो इसकी कीमतों को पोस्ट नहीं करता है ... और अगर आपको पूछना है, तो आप इसे बर्दाश्त नहीं कर सकते।

मैं वास्तव में एक पुरानी खोज इंजन पसंद करता हूं, बिना कई घंटियाँ और सीटी

स्रोत ज्यादातर एएसपी। नेट / सी # और जावास्क्रिप्ट है।


यदि आपके पास यह बहुत स्रोत कोड है, तो आपको उसे खोज इंजन के लिए एक खोज इंजन सेट करने में थोड़ा समय लगाना पड़ सकता है मैं ल्यूसीन की सिफारिश करेगा- इसका निशुल्क, इसका तेज, प्रोग्रामिंग अनुभव वाले किसी भी व्यक्ति के लिए किसी भी सामग्री पर एक शक्तिशाली सूचकांक सेट करना बहुत आसान है

http://lucene.apache.org/


शायद आपको कुछ समय और / या एक संपादक या IDE में पैसे का निवेश करना चाहिए जो प्रतीक टैगिंग का समर्थन करता है। आपको पूरे स्रोत के पेड़ के माध्यम से एक ही गुजारने के लिए इसे टैग करने की जरूरत है, और उसके बाद संपादक एक प्रतीक खोज या मानचित्र खोज का प्रयोग करता है जिससे कि प्रतीक परिभाषा या संदर्भ मिल सके।

संपादकों या आईडीई के कुछ उदाहरण जो टैगिंग का समर्थन करते हैं, एक्लिप्स, विज़ुअल स्टूडियो, स्लिकएडिट। कुछ आईडीई सुविधा प्रतीक ब्राउज़र या कुछ इसी तरह से फोन कर सकते हैं।


20 मिनट अपमानजनक है! मैं इन दिनों एक मिलियन + लाइन स्रोत कोड आधार के साथ काम कर रहा हूं और grepping को कुछ सेकेंड्स में सबसे ज्यादा लेता है (मैं एके का उपयोग करता हूं)। हमारी होम डायरेक्टरी एक फाइल सर्वर पर संग्रहीत होती है और एनएफएस पर घुड़सवार होती है, और हम उस फ़ाइल को सर्वर पर लॉग इन करते समय ग्रिप्परिंग को गति प्रदान करते हैं। मुझे यकीन नहीं है कि एनएफएस पर कितना समय लगता है, लेकिन यह निश्चित रूप से लंबा है

हम इसी तरह के प्रदर्शन कारणों से फ़ाइल सर्वर में लॉग इन करते समय स्रोत नियंत्रण संचालन करते हैं।


चूंकि आप 'grepping' कह रहे हैं I imagine आप कमांड-लाइन समाधानों में उदासीन नहीं हैं

सीटीएड्स जैसे उपकरण इंडेक्स और सी # और जावास्क्रिप्ट कोडबसेज़ (कई अन्य लोगों के बीच) खोज करेंगे।

सीटीएड्स के बारे में बहुत ही साफ है कि यह कोड के प्लगइन के साथ वीआईएम के साथ संयोजित किया जा सकता है ताकि कोड कोडिंग को सक्षम किया जा सके या फिर कोड कोडिंग को सक्षम किया जा सके।


मैंने कुछ समय के लिए सीएस 2 प्रोजेक्ट का उपयोग किया है, यह एक खुला स्रोत सी # कोड खोज इंजन है जो कि ल्यूसीन.नेट पर आधारित है। दुर्भाग्य से अब इसे विकसित नहीं किया जा रहा है



हमारा एसडी सोर्स कोड खोज इंजन देखें भाषा कई भाषाओं (सी, सी ++, सी #, जावा, ऑब्जेक्टिव सी, पीएचपी, वीबीनेट, वीबी 6, एडा, फोरट्रान, कोबोल, ...) से परिचित और संभालती है। लिनक्स कर्नेल (7.3 मिलियन लाइनें, 18000+ फाइलें) में खोज करने के लिए 2.8 सेकंड लगते हैं।

क्योंकि यह भाषा का पता है, यह आपकी खोज के लिए लैंगेज तत्वों को अप्रासंगिक देख सकता है (उदाहरण के लिए, यदि आप केवल एक पहचानकर्ता या अभिव्यक्ति में रुचि रखते हैं तो टिप्पणियां, स्वरूपण और सफेद स्थान पर ध्यान न दें) यह पहचानकर्ता, तार और टिप्पणियों के अंदर खोज सकता है। यदि आप वास्तव में ऐसा करना चाहते हैं तो इसमें एक पूर्ण नियमित अभिव्यक्ति स्ट्रिंग खोज विकल्प है।

इसका इस्तेमाल लाखों लिंक्स कोड के सिस्टम के लिए किया गया है, और एक मामले में हम जानते हैं, एक लाख से अधिक फाइलों वाला एक सिस्टम।