pandas 0.23 - DataFrame.plot.kde()

pandas.DataFrame.plot.kde




pandas

pandas.DataFrame.plot.kde

DataFrame.plot.kde(bw_method=None, ind=None, **kwds) [source]

गाऊसी गुठली का उपयोग करके कर्नेल घनत्व का अनुमान लगाएं।

आँकड़ों में, कर्नेल घनत्व अनुमान (KDE) एक यादृच्छिक चर की प्रायिकता घनत्व फ़ंक्शन (पीडीएफ) का अनुमान लगाने के लिए एक गैर-पैरामीट्रिक तरीका है। यह फ़ंक्शन गाऊसी गुठली का उपयोग करता है और इसमें स्वचालित बैंडविथ निर्धारण शामिल है।

पैरामीटर:

bw_method : str, स्केलर या कॉल करने योग्य, वैकल्पिक

अनुमानक बैंडविड्थ की गणना करने के लिए उपयोग की जाने वाली विधि। यह 'स्काउट', 'सिल्वरमैन', अदिश स्थिरांक या कॉल करने योग्य हो सकता है। यदि कोई नहीं (डिफ़ॉल्ट), 'स्कॉट' का उपयोग किया जाता है। अधिक जानकारी के लिए scipy.stats.gaussian_kde देखें।

इंडस्ट्रीज़ : NumPy सरणी या पूर्णांक, वैकल्पिक

अनुमानित पीडीएफ के लिए मूल्यांकन अंक। यदि कोई नहीं (डिफ़ॉल्ट), 1000 समान रूप से स्थान बिंदुओं का उपयोग किया जाता है। अगर ind एक न्यूपी सरणी है, तो केडीई का मूल्यांकन उत्तीर्ण अंकों में किया जाता है। यदि ind एक पूर्णांक है, तो समान रूप से स्थान बिंदुओं की संख्या का उपयोग किया जाता है।

** kwds : वैकल्पिक

अतिरिक्त कीवर्ड तर्क pandas.DataFrame.plot() में pandas.DataFrame.plot() किए गए हैं।

यह दिखाता है:
axes : matplotlib.axes.Axes or numpy.ndarray of them

यह भी देखें

scipy.stats.gaussian_kde
गाऊसी गुठली का उपयोग करके एक कर्नेल-घनत्व अनुमान का प्रतिनिधित्व। यह पीडीएफ का अनुमान लगाने के लिए आंतरिक रूप से उपयोग किया जाने वाला कार्य है।
Series.plot.kde
एक श्रृंखला के लिए एक केडीई भूखंड उत्पन्न करें।

उदाहरण

अनजाने वितरण से बेतरतीब ढंग से नमूने लिए गए अंकों की कई श्रृंखलाओं को देखते हुए, स्वचालित बैंडविड्थ निर्धारण के साथ केडीई का उपयोग करके अपने पीडीएफ का अनुमान लगाएं और परिणामों को प्लॉट करें, उनका मूल्यांकन 1000 समान रूप से अंक (डिफ़ॉल्ट) पर करें:

>>> df = pd.DataFrame({
...     'x': [1, 2, 2.5, 3, 3.5, 4, 5],
...     'y': [4, 4, 4.5, 5, 5.5, 6, 6],
... })
>>> ax = df.plot.kde()
../_images/pandas-DataFrame-plot-kde-1.png

एक स्केलर बैंडविड्थ निर्दिष्ट किया जा सकता है। एक छोटे बैंडविड्थ मूल्य का उपयोग करने से ओवरफिटिंग हो सकती है, जबकि बड़े बैंडविड्थ मूल्य का उपयोग करने से परिणाम कम हो सकते हैं:

>>> ax = df.plot.kde(bw_method=0.3)
../_images/pandas-DataFrame-plot-kde-2.png
>>> ax = df.plot.kde(bw_method=3)
../_images/pandas-DataFrame-plot-kde-3.png

अंत में, अनुमानित पैरामीटर अनुमानित पीडीएफ के कथानक के मूल्यांकन बिंदुओं को निर्धारित करता है:

>>> ax = df.plot.kde(ind=[1, 2, 3, 4, 5, 6])
../_images/pandas-DataFrame-plot-kde-4.png