pandas 0.23 - pandas.qcut()

pandas.qcut




pandas

pandas.qcut

pandas.qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise') [source]

मात्रात्मक-आधारित विवेकाधीन कार्य। वैरिएबल को समान आकार की बाल्टियों में रैंक के आधार पर या नमूना मात्राओं के आधार पर अलग करें। उदाहरण के लिए 10 मात्राओं के लिए 1000 मान प्रत्येक डेटा बिंदु के लिए मात्रात्मक सदस्यता को इंगित करने वाली एक श्रेणीबद्ध वस्तु का उत्पादन करेगा।

पैरामीटर:
x : 1d ndarray or Series

q : क्वांटाइल का पूर्णांक या सरणी

मात्राओं की संख्या। डिकिल के लिए 10, चतुर्थक के लिए 4, आदि। क्वांटाइल्स के वैकल्पिक रूप से, उदाहरणार्थ [0, .25, .5, .75, 1.]।

लेबल : सरणी या बूलियन, डिफ़ॉल्ट कोई नहीं

परिणामी डिब्बे के लिए लेबल के रूप में उपयोग किया जाता है। परिणामी डिब्बे के समान लंबाई का होना चाहिए। यदि गलत है, तो डिब्बे के केवल पूर्णांक संकेतक लौटें।

रेटबिंस : बूल, वैकल्पिक

(डिब्बे, लेबल) वापस करना है या नहीं। उपयोगी हो सकता है अगर डिब्बे एक स्केलर के रूप में दिया जाता है।

परिशुद्धता : int, वैकल्पिक

जिस पर bins लेबल को संग्रहीत करने और प्रदर्शित करने की शुद्धता

डुप्लिकेट : {डिफ़ॉल्ट 'बढ़ा', 'ड्रॉप'}, वैकल्पिक

यदि बिन किनारे अद्वितीय नहीं हैं, तो ValueError बढ़ाएँ या गैर-चिह्न हटा दें।

संस्करण में नया 0.20.0।

यह दिखाता है:

बाहर : लेबल गलत है तो पूर्णांक की श्रृंखला या श्रृंखला

रिटर्न प्रकार (श्रेणीबद्ध या श्रृंखला) इनपुट पर निर्भर करता है: यदि इनपुट एक श्रृंखला और श्रेणीबद्ध है तो श्रेणी की श्रृंखला। जब श्रेणीबद्ध डेटा वापस किया जाता है तो डिब्बे को श्रेणियों के रूप में दर्शाया जाता है।

डिब्बे : फ्लोट्स के ndarray

retbins ट्रू होने पर ही लौटा।

टिप्पणियाँ

सीमा से बाहर परिणामी वस्तुगत वस्तु में NA होगा

उदाहरण

>>> pd.qcut(range(5), 4)
... 
[(-0.001, 1.0], (-0.001, 1.0], (1.0, 2.0], (2.0, 3.0], (3.0, 4.0]]
Categories (4, interval[float64]): [(-0.001, 1.0] < (1.0, 2.0] ...
>>> pd.qcut(range(5), 3, labels=["good", "medium", "bad"])
... 
[good, good, medium, bad, bad]
Categories (3, object): [good < medium < bad]
>>> pd.qcut(range(5), 4, labels=False)
array([0, 0, 1, 2, 3])