android - हिंदी में html तत्वों




XMLPullParser का उपयोग करके HTML टैग वाले सामग्री को पार्स करना (2)

मैं एंड्रॉइड में XmlPullParser का उपयोग कर एक ऐप का निर्माण कर रहा हूं।

मैं इस तरह से स्वरूपित एक html से सामग्री कैसे प्राप्त कर सकता हूँ?

<div class="content">
"Some text is here."
<br>
"some more text "<a class="link" href="adress">continues here</a>
<br>
</div>

मैं इस तरह की सभी सामग्री को पार्स करना चाहता हूं:

"Some text is here. 
 some more text continues here"

"यहाँ जारी" हिस्सा भी हाइपरलिंक होना चाहिए

कुछ टिप्पणियों के बाद में: HTML पहले याहू YQL में डाल दिया गया है और YQL एक XML बनाता है मैं कोड में उत्पन्न XML फ़ाइल का उपयोग करता हूं उपर्युक्त भाग के ऊपर जो मैं पार्स करना चाहता हूँ, वह व्युत्पन्न एक्सएमएल से है।


XmlPullParser XML से निपटने के लिए है वेब पर अच्छी तरह से संरचित XHMTL पृष्ठों का सामना करने के लिए यह वास्तव में दुर्लभ है। एक एक्सएमएल पार्सर बहुत अच्छी तरह से स्वरूपित डेटा की अपेक्षा करता है और इसे सहिष्णु दोष नहीं माना जाता है। दूसरी ओर, एचटीएमएल आमतौर पर ढीले से संगठित होता है।

तो, नहीं, यह एक अच्छा विचार नहीं है। आपको अन्य लाइब्रेरीज़ पसंद करना चाहिए जैसे टैगोपुप या गेरोनिमो

पी एस: और सबसे अच्छा जब आप प्रवाह के सवाल पर एक स्टैक पूछते हैं तो अपने आप से कुछ प्रयास करें और यदि अवरुद्ध हो, तो पूछें। कोई और रास्ता नही।


दोनों HTML और XML, हालांकि वे कुछ मामलों में साझा वाक्य-रचना साझा करते हैं, ये अलग - अलग हैं मुझे लगता है कि उस उद्देश्य के लिए एक XmlPullParser का उपयोग करना एक अच्छा विचार नहीं है मैं इसके लिए कई जावा एचटीएमएल पार्सरों में से एक का उपयोग करने की सलाह देता हूं।







xmlpullparser