[Python] उदात्त पाठ 3, पायथन 3 और यूटीएफ -8 एक दूसरे को पसंद नहीं करते हैं



Answers

मुझे अजगर 3.4 और उदात्त पाठ 2 के साथ एक ही समस्या हो रही है। यहां तक ​​कि स्पष्ट रूप से कोड की एन्कोडिंग (# - - कोडिंग: UTF-8 - - फाइल की पहली पंक्ति पर) को बताते हुए मदद नहीं मिली। मैंने कोई अपवाद नहीं करने के लिए, अपमानजनक स्ट्रिंग्स को स्पष्ट रूप से एन्कोड करने की भी कोशिश की है।

यह एक शानदार आंतरिक समस्या / बग लगता है क्योंकि मैंने भी उसी परिणाम के साथ अपमानजनक हिस्सों के स्रोत दस्तावेज़ (नोटपैड ++ को यूओटीएम-एओएम में बिना एन्कोडेड में) को एनकोड करने का प्रयास किया है।

हालांकि मुझे नहीं पता कि सब्लाइम 2/3 के भीतर समस्या को कैसे तय किया जाए, मैं केवल काम के आस-पास ==> सीएमडी / पावरशेल का उपयोग कर सकता हूं, जो मेरे लिए सही आउटपुट के साथ पूरी तरह ठीक काम करता है

पुनश्च: मुझे आशा है कि यह मददगार है लेकिन कृपया ध्यान दें कि मैं न तो एक अनुभवी प्रोग्रामर हूं और न ही अजगर या उदात्त का गहरा ज्ञान है I मैं सिर्फ 2 सेंट का योगदान करना चाहता था

Question

मैं सब्लाइम टेक्स्ट में चलने वाले पायथन स्क्रिप्ट का उपयोग करके एक HTML पृष्ठ को पार्स करने की कोशिश कर रहा हूं। इस पृष्ठ में गैर- ASCII वर्ण हैं मुझे [Decode error - output not utf-8] मिल रहा था, इसलिए मैंने थोड़ा जांच की और इस अजीब कोड स्निपेट पर उतर आया:

import codecs

#print((1, codecs.decode(codecs.encode('ò', 'utf-8'), 'utf-8')))
print('ò')

जो [Decode error - output not utf-8] प्रिंट करता है। अगर मैं एएससीआईआई वर्ण को एन्कोड करता हूं तो यह त्रुटि नहीं होती है यह एक संकलन त्रुटि नहीं है - कार्यक्रम चलता है और पूरा करता है - इसलिए मुझे संदेह है कि यह स्क्रिप्ट आउटपुट के साथ शुभकामनात्मक पाठ प्रसंस्करण के साथ एक समस्या है, लेकिन मैं इसे और आगे नहीं संकीर्ण कर सकता हूं। मैं यह काम कैसे पूरा कर सकता हूं?




Links