pandas 0.23 - Series.str.extractall()

pandas.Series.str.extractall




pandas

pandas.Series.str.extractall

Series.str.extractall(pat, flags=0) [source]

श्रृंखला में प्रत्येक विषय स्ट्रिंग के लिए, नियमित अभिव्यक्ति पैट के सभी मैचों से समूह निकालें। जब श्रृंखला के प्रत्येक विषय स्ट्रिंग में बिल्कुल एक मैच होता है, तो एक्सट्रैक्ट (पैट) .xs (0, स्तर = 'मैच') एक्सट्रैक्ट (पैट) के समान होता है।

संस्करण में नया 0.18.0।

पैरामीटर:

pat : स्ट्रिंग

कैप्चरिंग समूहों के साथ नियमित अभिव्यक्ति पैटर्न

झंडे : int, डिफ़ॉल्ट 0 (कोई झंडे नहीं)

पुनः मॉड्यूल के झंडे, जैसे re.IGNORECASE

यह दिखाता है:
प्रत्येक मैच के लिए एक पंक्ति के साथ एक DataFrame, और प्रत्येक के लिए एक कॉलम
समूह। इसकी पंक्तियों में पहले स्तरों के साथ एक मल्टीएंडेक्स है जो आता है
विषय श्रृंखला। अंतिम स्तर का नाम 'मैच' है और इंगित करता है
विषय में आदेश। नियमित रूप से किसी भी कैप्चर ग्रुप के नाम
स्तंभ नाम के लिए अभिव्यक्ति पॅट का उपयोग किया जाएगा; अन्यथा कब्जा
समूह संख्या का उपयोग किया जाएगा।

यह भी देखें

extract
केवल पहला मैच लौटाता है (सभी मैच नहीं)

उदाहरण

एक समूह के साथ एक पैटर्न एक कॉलम के साथ एक DataFrame लौटाएगा। बिना किसी मैच के संकेत परिणाम में दिखाई नहीं देंगे।

>>> s = Series(["a1a2", "b1", "c1"], index=["A", "B", "C"])
>>> s.str.extractall(r"[ab](\d)")
         0
  match
A 0      1
  1      2
B 0      1

कैप्चर समूह के नाम परिणाम के कॉलम नामों के लिए उपयोग किए जाते हैं।

>>> s.str.extractall(r"[ab](?P<digit>\d)")
        digit
  match
A 0         1
  1         2
B 0         1

दो समूहों के साथ एक पैटर्न दो कॉलम के साथ एक DataFrame लौटाएगा।

>>> s.str.extractall(r"(?P<letter>[ab])(?P<digit>\d)")
        letter digit
  match
A 0          a     1
  1          a     2
B 0          b     1

वैकल्पिक समूह जो मेल नहीं खाते हैं वे परिणाम में NaN हैं।

>>> s.str.extractall(r"(?P<letter>[ab])?(?P<digit>\d)")
        letter digit
  match
A 0          a     1
  1          a     2
B 0          b     1
C 0        NaN     1