pandas 0.23 - Resampler.bfill()
pandas.core.resample.Resampler.bfill

pandas.core.resample.Resampler.bfill
-
Resampler.bfill(limit=None)
[source] -
पुनर्विकसित डेटा में पिछड़े नए लापता मान भरें।
आंकड़ों में, प्रतिरूपण गुम हुए डेटा को प्रतिस्थापित मानों [R31] से बदलने की प्रक्रिया है। डेटा को फिर से जमा करते समय, लापता मान दिखाई दे सकते हैं (उदाहरण के लिए, जब resampling आवृत्ति मूल आवृत्ति से अधिक है)। बैकवर्ड भरण NaN मानों को प्रतिस्थापित करेगा जो मूल अनुक्रम में अगले मान के साथ resampled डेटा में दिखाई दिए। मूल डेटा में मौजूद गुम मानों को संशोधित नहीं किया जाएगा।
पैरामीटर: सीमा : पूर्णांक, वैकल्पिक
कितने मान भरने की सीमा।
यह दिखाता है: सीरीज़, डेटाफ़्रेम
पिछड़े भरे NaN मूल्यों के साथ एक अपकमिंग श्रृंखला या डेटाफ़्रेम।
यह भी देखें
-
bfill
- बैकफिल का उपनाम।
-
fillna
- निर्दिष्ट विधि का उपयोग करके NaN मान भरें, जो 'बैकफिल' हो सकता है।
-
nearest
- केंद्र से शुरू होने वाले निकटतम पड़ोसी के साथ NaN मान भरें।
-
pad
- आगे NaN मान भरें।
-
pandas.Series.fillna
- निर्दिष्ट पद्धति का उपयोग करके श्रृंखला में NaN मान भरें, जो 'बैकफिल' हो सकता है।
-
pandas.DataFrame.fillna
- निर्दिष्ट विधि का उपयोग करके DataFrame में NaN मान भरें, जो 'बैकफिल' हो सकता है।
संदर्भ
[R31] ( 1 , 2 ) https://en.wikipedia.org/wiki/Imputation_(statistics ) उदाहरण
एक श्रृंखला को फिर से खोलना:
>>> s = pd.Series([1, 2, 3], ... index=pd.date_range('20180101', periods=3, freq='h')) >>> s 2018-01-01 00:00:00 1 2018-01-01 01:00:00 2 2018-01-01 02:00:00 3 Freq: H, dtype: int64
>>> s.resample('30min').backfill() 2018-01-01 00:00:00 1 2018-01-01 00:30:00 2 2018-01-01 01:00:00 2 2018-01-01 01:30:00 3 2018-01-01 02:00:00 3 Freq: 30T, dtype: int64
>>> s.resample('15min').backfill(limit=2) 2018-01-01 00:00:00 1.0 2018-01-01 00:15:00 NaN 2018-01-01 00:30:00 2.0 2018-01-01 00:45:00 2.0 2018-01-01 01:00:00 2.0 2018-01-01 01:15:00 NaN 2018-01-01 01:30:00 3.0 2018-01-01 01:45:00 3.0 2018-01-01 02:00:00 3.0 Freq: 15T, dtype: float64
एक DataFrame को फिर से खोलना जिसमें लापता मान हैं:
>>> df = pd.DataFrame({'a': [2, np.nan, 6], 'b': [1, 3, 5]}, ... index=pd.date_range('20180101', periods=3, ... freq='h')) >>> df a b 2018-01-01 00:00:00 2.0 1 2018-01-01 01:00:00 NaN 3 2018-01-01 02:00:00 6.0 5
>>> df.resample('30min').backfill() a b 2018-01-01 00:00:00 2.0 1 2018-01-01 00:30:00 NaN 3 2018-01-01 01:00:00 NaN 3 2018-01-01 01:30:00 6.0 5 2018-01-01 02:00:00 6.0 5
>>> df.resample('15min').backfill(limit=2) a b 2018-01-01 00:00:00 2.0 1.0 2018-01-01 00:15:00 NaN NaN 2018-01-01 00:30:00 NaN 3.0 2018-01-01 00:45:00 NaN 3.0 2018-01-01 01:00:00 NaN 3.0 2018-01-01 01:15:00 NaN NaN 2018-01-01 01:30:00 6.0 5.0 2018-01-01 01:45:00 6.0 5.0 2018-01-01 02:00:00 6.0 5.0
-