pandas 0.23 - 8. Working with Text Data

टेक्स्ट डेटा के साथ काम करना




pandas

टेक्स्ट डेटा के साथ काम करना

श्रृंखला और सूचकांक स्ट्रिंग प्रसंस्करण विधियों के एक सेट से लैस हैं जो सरणी के प्रत्येक तत्व पर काम करना आसान बनाते हैं। शायद सबसे महत्वपूर्ण बात, ये विधियाँ स्वतः ही अनुपलब्ध / NA मानों को छोड़ देती हैं। इन्हें str विशेषता के माध्यम से एक्सेस किया जाता है और आम तौर पर इसमें समतुल्य (स्केलर) बिल्ट-इन स्ट्रिंग विधियों से मेल खाने वाले नाम होते हैं:

In [1]: s = pd.Series(['A', 'B', 'C', 'Aaba', 'Baca', np.nan, 'CABA', 'dog', 'cat'])

In [2]: s.str.lower()
Out[2]: 
0       a
1       b
2       c
3    aaba
4    baca
5     NaN
6    caba
7     dog
8     cat
dtype: object

In [3]: s.str.upper()