python 3.x UnicodeEncodeError: 'charmap' कोडेक चरित्र '\ u2010' को एन्कोड नहीं कर सकता: चरित्र मानचित्र<अपरिभाषित>



python-3.x selenium (1)

पहले से ही यह पता चला है। जैसा कि this जवाब में उल्लेख किया गया है, एन्कोडिंग त्रुटि पायथन से नहीं आती है, लेकिन कंसोल का उपयोग कर रहे एन्कोडिंग से। तो इसे ठीक करने का तरीका आदेश (विंडोज़ में) चलाने के लिए है:

chcp 65001

जो यूटीएफ -8 में एन्कोडिंग सेट करता है और फिर प्रोग्राम को फिर से चलाता है। या यदि मैं था, तो पिचर्म पर काम करना, सेटिंग> संपादक> फ़ाइल एन्कोडिंग पर जाएं और आईडीई और प्रोजेक्ट एन्कोडिंग को सेट करें।

जब मैं अजगर 3.4 में सेलेनियम का उपयोग करने के लिए अनुरोध की गई वेबसाइट से मिलता हूं, तो मुझे 'एए' प्रिंट करने का प्रयास करते समय यूनिकोड एन्कोड त्रुटि प्राप्त होती रहती है।

मैंने पहले ही अपनी .py फ़ाइल के शीर्ष पर परिभाषित किया है

# -*- coding: utf-8 -*-

डीफ़ इस तरह कुछ है:

from selenium import webdriver

b = webdriver.Firefox()
b.get('http://fisica.uniandes.edu.co/personal/profesores-de-planta')
dataProf = b.find_elements_by_css_selector('td[width="508"]')
for dato in dataProf:
        print(datos.text)

और अपवाद:

Traceback (most recent call last):
  File "C:/Users/Andres/Desktop/scrap/scrap.py", line 444, in <module>
    dar_p_fisica()
  File "C:/Users/Andres/Desktop/scrap/scrap.py", line 390, in dar_p_fisica
    print(datos.text) #.encode().decode('ascii', 'ignore')
  File "C:\Python34\lib\encodings\cp1252.py", line 19, in encode
    return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\u2010' in position 173: character maps to <undefined>

अग्रिम में धन्यवाद





utf-8