pandas 0.23 - Series.str.contains()

pandas.Series.str.contains




pandas

pandas.Series.str.contains

Series.str.contains(pat, case=True, flags=0, na=nan, regex=True) [source]

टेस्ट यदि पैटर्न या रेगेक्स एक श्रृंखला या सूचकांक के एक स्ट्रिंग के भीतर निहित है।

बूलियन सीरीज़ या इंडेक्स को इस आधार पर लौटाएं कि किसी दिए गए पैटर्न या रेगेक्स को किसी श्रृंखला या इंडेक्स के स्ट्रिंग में समाहित किया गया है या नहीं।

पैरामीटर:

पैट : str

चरित्र क्रम या नियमित अभिव्यक्ति।

मामला : बूल, डिफ़ॉल्ट सही

यदि सही है, तो मामला संवेदनशील है।

झंडे : int, डिफ़ॉल्ट 0 (कोई झंडे नहीं)

पुन: मॉड्यूल के माध्यम से पारित करने के लिए झंडे, जैसे re.IGNORECASE।

ना : डिफ़ॉल्ट NaN

लापता मूल्यों के लिए मूल्य भरें।

रेगेक्स : बूल, डिफॉल्ट ट्रू

यदि सही है, तो मान लें कि पैट एक नियमित अभिव्यक्ति है।

यदि गलत है, तो पैट को शाब्दिक स्ट्रिंग के रूप में मानता है।

यह दिखाता है:

बूलियन मूल्यों की श्रृंखला या सूचकांक

बूलियन मूल्यों की एक श्रृंखला या सूचकांक यह दर्शाता है कि दिए गए पैटर्न श्रृंखला या सूचकांक के प्रत्येक तत्व के स्ट्रिंग में शामिल हैं या नहीं।

यह भी देखें

match
अनुरूप, लेकिन सख्त, re.search के बजाय re.match पर निर्भर है

उदाहरण

केवल शाब्दिक पैटर्न का उपयोग करके बूलियंस की एक श्रृंखला लौटना।

>>> s1 = pd.Series(['Mouse', 'dog', 'house and parrot', '23', np.NaN])
>>> s1.str.contains('og', regex=False)
0    False
1     True
2    False
3    False
4      NaN
dtype: object

केवल शाब्दिक पैटर्न का उपयोग करके बूलियन का एक सूचकांक लौटना।

>>> ind = pd.Index(['Mouse', 'dog', 'house and parrot', '23.0', np.NaN])
>>> ind.str.contains('23', regex=False)
Index([False, False, False, True, nan], dtype='object')

मामले का उपयोग करके मामले की संवेदनशीलता को निर्दिष्ट करना।

>>> s1.str.contains('oG', case=True, regex=True)
0    False
1    False
2    False
3    False
4      NaN
dtype: object

NaN बजाय False होना na को निर्दिष्ट करना NaN मानों को False साथ बदल देता है। यदि सीरीज या इंडेक्स में NaN वैल्यू नहीं है, तो परिणामी dtype bool होगा, अन्यथा, object dtype।

>>> s1.str.contains('og', na=False, regex=True)
0    False
1     True
2    False
3    False
4    False
dtype: bool

एक ही स्ट्रिंग के भीतर 'घर' और 'तोता' लौटना।

>>> s1.str.contains('house|parrot', regex=True)
0    False
1    False
2     True
3    False
4      NaN
dtype: object

रेगेक्स के साथ flags का उपयोग करके मामले की संवेदनशीलता को अनदेखा करना।

>>> import re
>>> s1.str.contains('PARROT', flags=re.IGNORECASE, regex=True)
0    False
1    False
2     True
3    False
4      NaN
dtype: object

नियमित अभिव्यक्ति का उपयोग करके किसी भी अंक को वापस करना।

>>> s1.str.contains('\d', regex=True)
0    False
1    False
2    False
3     True
4      NaN
dtype: object

यह सुनिश्चित करना कि regex ट्रू में सेट होने पर pat एक शाब्दिक पैटर्न नहीं है। निम्नलिखित उदाहरण में ध्यान दें कि कोई व्यक्ति केवल s2[1] और s2[3] उम्मीद कर सकता है कि वह True । हालाँकि, x .0 ’एक रेगीक्स के रूप में किसी भी वर्ण से मेल खाता है जिसके बाद ० है।

>>> s2 = pd.Series(['40','40.0','41','41.0','35'])
>>> s2.str.contains('.0', regex=True)
0     True
1     True
2    False
3     True
4    False
dtype: bool