pandas 0.23 - exception pandas.errors.DtypeWarning[source]

pandas.errors.DtypeWarning




pandas

pandas.errors.DtypeWarning

exception pandas.errors.DtypeWarning [source]

किसी फ़ाइल से कॉलम में विभिन्न dtypes पढ़ते समय चेतावनी।

एक dtype असंगतता के लिए उठाया गया। यह तब भी हो सकता है जब किसी दिए गए CSV फ़ाइल के कॉलम (s) में read_csv या read_table सामना गैर-समान dtypes से हो।

यह भी देखें

pandas.read_csv
डेटाफ़्रेम में CSV (अल्पविराम से अलग) फ़ाइल पढ़ें।
pandas.read_table
एक DataFrame में सामान्य सीमांकित फ़ाइल पढ़ें।

टिप्पणियाँ

यह चेतावनी बड़ी फ़ाइलों के साथ काम करते समय जारी की जाती है क्योंकि dtype की जाँच प्रति पाठ के अनुसार होती है।

चेतावनी के बावजूद, CSV फ़ाइल को एकल कॉलम में मिश्रित प्रकारों के साथ पढ़ा जाता है जो एक ऑब्जेक्ट प्रकार होगा। इस मुद्दे को बेहतर ढंग से समझने के लिए नीचे दिए गए उदाहरण देखें।

उदाहरण

यह उदाहरण एक बड़े CSV फ़ाइल को बनाता है और पढ़ता है जिसमें एक कॉलम होता है जिसमें int और str

>>> df = pd.DataFrame({'a': (['1'] * 100000 + ['X'] * 100000 +
...                          ['1'] * 100000),
...                    'b': ['b'] * 300000})
>>> df.to_csv('test.csv', index=False)
>>> df2 = pd.read_csv('test.csv')
... # DtypeWarning: Columns (0) have mixed types

यह ध्यान df2 महत्वपूर्ण है कि df2 में एक ही इनपुट के लिए str और int दोनों होंगे, '1'।

>>> df2.iloc[262140, 0]
'1'
>>> type(df2.iloc[262140, 0])
<class 'str'>
>>> df2.iloc[262150, 0]
1
>>> type(df2.iloc[262150, 0])
<class 'int'>

इस समस्या को हल करने का एक तरीका यह है कि रूपांतरण को स्पष्ट करने के लिए read_csv और read_table फ़ंक्शन में dtype पैरामीटर का उपयोग किया dtype :

>>> df2 = pd.read_csv('test.csv', sep=',', dtype={'a': str})

कोई चेतावनी जारी नहीं की गई थी।

>>> import os
>>> os.remove('test.csv')