pandas 0.23 - Resampler.backfill()

pandas.core.resample.Resampler.backfill




pandas

pandas.core.resample.Resampler.backfill

Resampler.backfill(limit=None) [source]

पुनर्विकसित डेटा में पिछड़े नए लापता मान भरें।

आंकड़ों में, प्रतिरूपण गुम हुए डेटा को प्रतिस्थापित मानों [R30] से बदलने की प्रक्रिया है। डेटा को फिर से जमा करते समय, लापता मान दिखाई दे सकते हैं (उदाहरण के लिए, जब resampling आवृत्ति मूल आवृत्ति से अधिक है)। बैकवर्ड भरण NaN मानों को प्रतिस्थापित करेगा जो मूल अनुक्रम में अगले मान के साथ resampled डेटा में दिखाई दिए। मूल डेटा में मौजूद गुम मानों को संशोधित नहीं किया जाएगा।

पैरामीटर:

सीमा : पूर्णांक, वैकल्पिक

कितने मान भरने की सीमा।

यह दिखाता है:

सीरीज़, डेटाफ़्रेम

पिछड़े भरे NaN मूल्यों के साथ एक अपकमिंग श्रृंखला या डेटाफ़्रेम।

यह भी देखें

bfill
बैकफिल का उपनाम।
fillna
निर्दिष्ट विधि का उपयोग करके NaN मान भरें, जो 'बैकफिल' हो सकता है।
nearest
केंद्र से शुरू होने वाले निकटतम पड़ोसी के साथ NaN मान भरें।
pad
आगे NaN मान भरें।
pandas.Series.fillna
निर्दिष्ट पद्धति का उपयोग करके श्रृंखला में NaN मान भरें, जो 'बैकफिल' हो सकता है।
pandas.DataFrame.fillna
निर्दिष्ट विधि का उपयोग करके DataFrame में NaN मान भरें, जो 'बैकफिल' हो सकता है।

संदर्भ

[R30] ( 1 , 2 ) https://en.wikipedia.org/wiki/Imputation_(statistics )

उदाहरण

एक श्रृंखला को फिर से खोलना:

>>> s = pd.Series([1, 2, 3],
...               index=pd.date_range('20180101', periods=3, freq='h'))
>>> s
2018-01-01 00:00:00    1
2018-01-01 01:00:00    2
2018-01-01 02:00:00    3
Freq: H, dtype: int64
>>> s.resample('30min').backfill()
2018-01-01 00:00:00    1
2018-01-01 00:30:00    2
2018-01-01 01:00:00    2
2018-01-01 01:30:00    3
2018-01-01 02:00:00    3
Freq: 30T, dtype: int64
>>> s.resample('15min').backfill(limit=2)
2018-01-01 00:00:00    1.0
2018-01-01 00:15:00    NaN
2018-01-01 00:30:00    2.0
2018-01-01 00:45:00    2.0
2018-01-01 01:00:00    2.0
2018-01-01 01:15:00    NaN
2018-01-01 01:30:00    3.0
2018-01-01 01:45:00    3.0
2018-01-01 02:00:00    3.0
Freq: 15T, dtype: float64

एक DataFrame को फिर से खोलना जिसमें लापता मान हैं:

>>> df = pd.DataFrame({'a': [2, np.nan, 6], 'b': [1, 3, 5]},
...                   index=pd.date_range('20180101', periods=3,
...                                       freq='h'))
>>> df
                       a  b
2018-01-01 00:00:00  2.0  1
2018-01-01 01:00:00  NaN  3
2018-01-01 02:00:00  6.0  5
>>> df.resample('30min').backfill()
                       a  b
2018-01-01 00:00:00  2.0  1
2018-01-01 00:30:00  NaN  3
2018-01-01 01:00:00  NaN  3
2018-01-01 01:30:00  6.0  5
2018-01-01 02:00:00  6.0  5
>>> df.resample('15min').backfill(limit=2)
                       a    b
2018-01-01 00:00:00  2.0  1.0
2018-01-01 00:15:00  NaN  NaN
2018-01-01 00:30:00  NaN  3.0
2018-01-01 00:45:00  NaN  3.0
2018-01-01 01:00:00  NaN  3.0
2018-01-01 01:15:00  NaN  NaN
2018-01-01 01:30:00  6.0  5.0
2018-01-01 01:45:00  6.0  5.0
2018-01-01 02:00:00  6.0  5.0