pandas 0.23 - pandas.get_dummies()

pandas.get_dummies




pandas

pandas.get_dummies

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) [source]

श्रेणीबद्ध चर को डमी / संकेतक चर में बदलें

पैरामीटर:
data : array-like, Series, or DataFrame

उपसर्ग : स्ट्रिंग, स्ट्रिंग्स की सूची, या स्ट्रिंग्स का ताना-बाना, डिफ़ॉल्ट कोई नहीं

DataFrame कॉलम नामों को जोड़ने के लिए स्ट्रिंग। DataFrame पर get_dummies को कॉल करते समय स्तंभों की संख्या के बराबर एक सूची पास करें। वैकल्पिक रूप से, prefix उपसर्गों के लिए एक शब्दकोश मानचित्रण स्तंभ नाम हो सकता है।

उपसर्ग_सेप : स्ट्रिंग, डिफ़ॉल्ट '_'

यदि उपसर्ग को जोड़ना, विभाजक / सीमांकक का उपयोग करना। या prefix. साथ एक सूची या शब्दकोश पास करें prefix.

dummy_na : बूल, डिफ़ॉल्ट गलत

यदि NaNs को अनदेखा किया जाता है, तो NaNs को इंगित करने के लिए एक कॉलम जोड़ें।

कॉलम : सूची जैसा, डिफ़ॉल्ट कोई नहीं

DataFrame में स्तंभ नाम एन्कोड किया गया। यदि columns कोई नहीं है, तो object या category dtype वाले सभी कॉलम कनवर्ट किए जाएंगे।

विरल : बूल, डिफ़ॉल्ट गलत

डमी कॉलम को विरल होना चाहिए या नहीं। यदि data एक श्रृंखला है या यदि सभी कॉलम शामिल हैं, तो SparseDataFrame लौटाता है। अन्यथा कुछ SparseBlocks के साथ एक DataFrame लौटाता है।

drop_first : बूल, डिफ़ॉल्ट गलत

पहले स्तर को हटाकर k श्रेणीबद्ध स्तरों से k-1 डमी प्राप्त करना है या नहीं।

संस्करण में नया 0.18.0।

dtype : dtype, default np.uint8

नए कॉलम के लिए डेटा प्रकार। केवल एक ही dtype की अनुमति है।

संस्करण में नया 0.23.0।

यह दिखाता है:
dummies : DataFrame or SparseDataFrame

यह भी देखें

Series.str.get_dummies

उदाहरण

>>> import pandas as pd
>>> s = pd.Series(list('abca'))
>>> pd.get_dummies(s)
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0
>>> s1 = ['a', 'b', np.nan]
>>> pd.get_dummies(s1)
   a  b
0  1  0
1  0  1
2  0  0
>>> pd.get_dummies(s1, dummy_na=True)
   a  b  NaN
0  1  0    0
1  0  1    0
2  0  0    1
>>> df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
...                    'C': [1, 2, 3]})
>>> pd.get_dummies(df, prefix=['col1', 'col2'])
   C  col1_a  col1_b  col2_a  col2_b  col2_c
0  1       1       0       0       1       0
1  2       0       1       1       0       0
2  3       1       0       0       0       1
>>> pd.get_dummies(pd.Series(list('abcaa')))
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0
4  1  0  0
>>> pd.get_dummies(pd.Series(list('abcaa')), drop_first=True)
   b  c
0  0  0
1  1  0
2  0  1
3  0  0
4  0  0
>>> pd.get_dummies(pd.Series(list('abc')), dtype=float)
     a    b    c
0  1.0  0.0  0.0
1  0.0  1.0  0.0
2  0.0  0.0  1.0