python - वेब पेज को पार्स करने के दौरान मैं सभी स्मार्ट कोट्स से छुटकारा कैसे प्राप्त करूं?



beautifulsoup nltk (1)

इस कोड के साथ अपने कोड की अंतिम पंक्ति को बदलें:

name = name.replace(u"\u2018", "").replace(u"\u2019", "").replace(u"\u201c","").replace(u"\u201d", "")

replace पद्धति एक संशोधित स्ट्रिंग देता है लेकिन यह उस स्टिंग को प्रभावित नहीं करता है जिसे आप इसे कहते हैं, इसलिए आपको ऊपर दिए गए वैरिएबल को वापस मान देना होगा।

https://code.i-harness.com

यह मेरा कोड है:

name = namestr.decode("utf-8")

name.replace(u"\u2018", "").replace(u"\u2019", "").replace(u"\u201c","").replace(u"\u201d", "")

यह काम करने के लिए नहीं लगता है मैं अभी भी अपने पाठ में &ldquo , &rdquo आदि पाता हूं इसके अलावा इस पाठ को सुंदर सूप का इस्तेमाल करके पार्स किया गया है





smart-quotes