web crawler वेबसाइट्स पर sitemap.xml पथ कैसे खोजें?




web-crawler (4)

मुझे नहीं लगता कि साइटमैप के स्थान पर कोई मानक है। यही कारण है कि जब आप Google के वेबमास्टर टूल का उपयोग करके एक जोड़ रहे हैं, तो आपको अपने साइटमैप में एक मनमाना URL निर्दिष्ट करना चाहिए।

मैं वेबसाइटों की साइटमैप। Xml फ़ाइल कैसे पा सकता हूँ?

उदा। स्टैकओवरफ्लो / साइटमैप पर जाना। xml मुझे 404 मिलता है।

Stackoverflow में / robots.txt को निम्नलिखित लिखा जाता है:

"यह तकनीकी रूप से मान्य नहीं है, क्योंकि कुछ गॉडफ़ोर्सन के कारण साइटमैप पथ ABSOLUTE और सापेक्ष नहीं होना चाहिए। साइटमैप: /sitemap.xml


कोई मानक नहीं है, इसलिए कोई गारंटी नहीं है। इसके साथ ही, साइटमैप के लिए स्वयं लेबल होना और रूट पर इस तरह से होना आम है:

example.com/sitemap.xml

मामला कुछ सर्वरों पर संवेदनशील है, इसलिए इसे ध्यान में रखें। यदि वहाँ नहीं है, तो रूट पर रोबोट फ़ाइल में देखें:

example.com/robots.txt

यदि आप इसे Google में रोबोट फ़ाइल हेड में सूचीबद्ध नहीं देखते हैं और इसे खोजते हैं:

site:example.com filetype:xml

यह आपके लक्ष्य डोमेन पर XML फ़ाइलों के परिणामों को सीमित करेगा। इस बिंदु पर इसका परीक्षण और त्रुटि और उस वेबसाइट की बारीकियों के आधार पर जिसके साथ आप काम कर रहे हैं। यदि आपको ऊपर Google खोज वाक्यांश से परिणामों के कई पृष्ठ मिलते हैं तो परिणामों को आगे सीमित करने का प्रयास करें:

filetype:xml site:example.com inurl:sitemap

या

filetype:xml site:example.com inurl:products

यदि आप अभी भी इसे नहीं ढूंढ पा रहे हैं तो आप right-click > "View Source" कर सकते हैं और कोड में इसका संदर्भ होने पर देखने के लिए .xml लिए खोज (उर्फ: "नियंत्रण खोजें" या Ctrl + F ) करें।


इसे खोजने के लिए Google खोज ऑपरेटर का उपयोग करें

नीचे दिए गए कोड के साथ गूगल सर्च करें ।।

inurl: domain.com filetype: xml

जिस साइट पर आप साइटमैप खोजना चाहते हैं, उसके लिए domain.com बदलें। यह दी गई डोमेन के लिए सूचीबद्ध सभी xml फ़ाइलों को सूचीबद्ध करना चाहिए .. सभी साइटमैप सहित :)


प्रोटोकॉल प्रलेखन के अनुसार खोज इंजन के लिए साइटमैप को सूचित करने के लिए कम से कम तीन विकल्प वेबसाइट डिज़ाइनर उपयोग कर सकते हैं:

  • स्थान के प्रत्येक खोज इंजन को उनके दिए गए इंटरफ़ेस के माध्यम से सूचित करना
  • Robots.txt फ़ाइल में url जोड़ना
  • Http के माध्यम से खोज इंजन के लिए यूआरएल को सबमिट करना

इसलिए, जब तक कि उन्होंने अपने robots.txt फ़ाइल पर साइटमैप स्थान प्रकाशित करने के लिए नहीं चुना है, आप वास्तव में यह नहीं जान सकते हैं कि उन्होंने अपनी साइटमैप। Xml फ़ाइलें कहाँ रखी हैं।





sitemap