pandas 0.23 - Series.str.extract()

pandas.Series.str.extract




pandas

pandas.Series.str.extract

Series.str.extract(pat, flags=0, expand=True) [source]

श्रृंखला में प्रत्येक विषय स्ट्रिंग के लिए, नियमित अभिव्यक्ति पैट के पहले मैच से समूह निकालें।

पैरामीटर:

pat : स्ट्रिंग

कैप्चरिंग समूहों के साथ नियमित अभिव्यक्ति पैटर्न

झंडे : int, डिफ़ॉल्ट 0 (कोई झंडे नहीं)

पुनः मॉड्यूल के झंडे, जैसे re.IGNORECASE

विस्तार करें : बूल, डिफ़ॉल्ट सही

  • यदि सही है, तो DataFrame लौटाएं।
  • यदि गलत है, तो श्रृंखला / सूचकांक / डाटाफ्रेम लौटाएं।

संस्करण में नया 0.18.0।

यह दिखाता है:
प्रत्येक विषय स्ट्रिंग के लिए एक पंक्ति के साथ DataFrame, और के लिए एक कॉलम
प्रत्येक समूह। नियमित अभिव्यक्ति पैट में किसी भी कब्जा समूह का नाम होगा
स्तंभ नामों के लिए उपयोग किया जा सकता है; अन्यथा समूह संख्या पर कब्जा होगा
उपयोग किया गया। प्रत्येक परिणाम कॉलम का dtype हमेशा ऑब्जेक्ट होता है, तब भी
कोई मेल नहीं मिला। यदि विस्तार = गलत और पॅट में केवल एक ही कैप्चर समूह है,
फिर एक श्रृंखला (यदि विषय एक श्रृंखला है) या सूचकांक (यदि विषय है) वापस करें
एक सूचकांक है)।

यह भी देखें

extractall
सभी मैच लौटाता है (सिर्फ पहला मैच नहीं)

उदाहरण

दो समूहों के साथ एक पैटर्न दो कॉलम के साथ एक DataFrame लौटाएगा। गैर-मैच NaN होंगे।

>>> s = Series(['a1', 'b2', 'c3'])
>>> s.str.extract(r'([ab])(\d)')
     0    1
0    a    1
1    b    2
2  NaN  NaN

एक पैटर्न में वैकल्पिक समूह हो सकते हैं।

>>> s.str.extract(r'([ab])?(\d)')
     0  1
0    a  1
1    b  2
2  NaN  3

नामांकित समूह परिणाम में कॉलम नाम बन जाएंगे।

>>> s.str.extract(r'(?P<letter>[ab])(?P<digit>\d)')
  letter digit
0      a     1
1      b     2
2    NaN   NaN

एक समूह के साथ एक पैटर्न एक कॉलम के साथ एक DataFrame लौटाएगा यदि विस्तार = सही।

>>> s.str.extract(r'[ab](\d)', expand=True)
     0
0    1
1    2
2  NaN

एक समूह के साथ एक पैटर्न एक श्रृंखला लौटाएगा यदि विस्तार = गलत।

>>> s.str.extract(r'[ab](\d)', expand=False)
0      1
1      2
2    NaN
dtype: object