pandas 0.23 - Series.sample()

pandas.Series.sample




pandas

pandas.Series.sample

Series.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None) [source]

ऑब्जेक्ट के अक्ष से आइटम का एक यादृच्छिक नमूना लौटाएं।

आप reproducibility के लिए random_state उपयोग कर सकते हैं।

पैरामीटर:

n : int, वैकल्पिक

धुरी से लौटने के लिए वस्तुओं की संख्या। frac साथ उपयोग नहीं किया जा सकता है। डिफ़ॉल्ट = 1 यदि frac = कोई नहीं।

frac : फ्लोट, वैकल्पिक

लौटने के लिए अक्ष वस्तुओं का अंश। n साथ उपयोग नहीं किया जा सकता है।

बदलें : बूलियन, वैकल्पिक

प्रतिस्थापन के साथ या बिना नमूना। डिफ़ॉल्ट = गलत।

भार : str या ndarray- जैसा, वैकल्पिक

डिफ़ॉल्ट 'कोई नहीं' समान संभाव्यता भार में परिणाम करता है। यदि एक श्रृंखला पारित की है, तो सूचकांक पर लक्ष्य वस्तु के साथ संरेखित किया जाएगा। सैंपल ऑब्जेक्ट में नहीं पाए गए वेट में इंडेक्स वैल्यू को नजरअंदाज किया जाएगा और वॉट्स में नहीं सैंपल ऑब्जेक्ट में इंडेक्स वैल्यू को जीरो का वेट असाइन किया जाएगा। यदि DataFrame पर कॉल किया जाता है, तो एक कॉलम का नाम स्वीकार करेगा जब अक्ष = 0. जब तक भार एक श्रृंखला नहीं हो, तब वजन एक ही लंबाई होना चाहिए क्योंकि अक्ष को नमूना किया जा रहा है। यदि वेट 1 के बराबर नहीं है, तो उन्हें 1 राशि के लिए सामान्यीकृत किया जाएगा। वज़न कॉलम में गुम मानों को शून्य माना जाएगा। inf और -inf मानों की अनुमति नहीं है।

random_state : int या numpy.random.RandomState, वैकल्पिक

रैंडम संख्या जनरेटर (यदि इंट), या रेंपी रैंडमस्टेट ऑब्जेक्ट के लिए बीज।

अक्ष : इंट या स्ट्रिंग, वैकल्पिक

नमूना लेने के लिए धुरी। अक्ष संख्या या नाम को स्वीकार करता है। डिफ़ॉल्ट दिए गए डेटा प्रकार के लिए स्टेटस एक्सिस है (0 सीरीज और डेटाफ्रेम के लिए, 1 पैनल के लिए)।

यह दिखाता है:
कॉलर के रूप में एक ही प्रकार की एक नई वस्तु।

उदाहरण

एक उदाहरण Series और DataFrame उत्पन्न करें:

>>> s = pd.Series(np.random.randn(50))
>>> s.head()
0   -0.038497
1    1.820773
2   -0.972766
3   -1.598270
4   -1.095526
dtype: float64
>>> df = pd.DataFrame(np.random.randn(50, 4), columns=list('ABCD'))
>>> df.head()
          A         B         C         D
0  0.016443 -2.318952 -0.566372 -1.028078
1 -1.051921  0.438836  0.658280 -0.175797
2 -1.243569 -0.364626 -0.215065  0.057736
3  1.768216  0.404512 -0.385604 -1.457834
4  1.072446 -1.137172  0.314194 -0.046661

अगला इन दोनों वस्तुओं से एक यादृच्छिक नमूना निकालें…

Series से 3 यादृच्छिक तत्व:

>>> s.sample(n=3)
27   -0.994689
55   -1.049016
67   -0.224565
dtype: float64

और प्रतिस्थापन के साथ DataFrame का एक यादृच्छिक 10%:

>>> df.sample(frac=0.1, replace=True)
           A         B         C         D
35  1.981780  0.142106  1.817165 -0.290805
49 -1.336199 -0.448634 -0.789640  0.217116
40  0.823173 -0.078816  1.009536  1.015108
15  1.421154 -0.055301 -1.922594 -0.019696
6  -0.148339  0.832938  1.787600 -1.383767

आप प्रतिलिपि प्रस्तुत करने random state लिए random state उपयोग कर सकते हैं:

>>> df.sample(random_state=1)
A         B         C         D
37 -2.027662  0.103611  0.237496 -0.165867
43 -0.259323 -0.583426  1.516140 -0.479118
12 -1.686325 -0.579510  0.985195 -0.460286
8   1.167946  0.429082  1.215742 -1.636041
9   1.197475 -0.864188  1.554031 -1.505264