python - वेब पेज को पार्स करने के दौरान मैं सभी स्मार्ट कोट्स से छुटकारा कैसे प्राप्त करूं?



beautifulsoup nltk (1)

इस कोड के साथ अपने कोड की अंतिम पंक्ति को बदलें:

name = name.replace(u"\u2018", "").replace(u"\u2019", "").replace(u"\u201c","").replace(u"\u201d", "")

replace पद्धति एक संशोधित स्ट्रिंग देता है लेकिन यह उस स्टिंग को प्रभावित नहीं करता है जिसे आप इसे कहते हैं, इसलिए आपको ऊपर दिए गए वैरिएबल को वापस मान देना होगा।

यह मेरा कोड है:

name = namestr.decode("utf-8")

name.replace(u"\u2018", "").replace(u"\u2019", "").replace(u"\u201c","").replace(u"\u201d", "")

यह काम करने के लिए नहीं लगता है मैं अभी भी अपने पाठ में &ldquo , &rdquo आदि पाता हूं इसके अलावा इस पाठ को सुंदर सूप का इस्तेमाल करके पार्स किया गया है





smart-quotes