NumPy 1.14 - numpy.fromregex()

numpy.fromregex




numpy

numpy.fromregex

numpy.fromregex(file, regexp, dtype, encoding=None) [source]

रेगुलर एक्सप्रेशन पार्सिंग का उपयोग करते हुए, टेक्स्ट फ़ाइल से एक अरेंज करें।

लौटाया गया सरणी हमेशा एक संरचित सरणी है, और फ़ाइल में नियमित अभिव्यक्ति के सभी मैचों से निर्मित होता है। नियमित अभिव्यक्ति में समूह संरचित सरणी के क्षेत्रों में परिवर्तित हो जाते हैं।

पैरामीटर:

फ़ाइल : str या फ़ाइल

फ़ाइल का नाम या फ़ाइल ऑब्जेक्ट पढ़ने के लिए।

regexp : str या regexp

फ़ाइल को पार्स करने के लिए नियमित अभिव्यक्ति का उपयोग किया जाता है। नियमित अभिव्यक्ति के समूह dtype में फ़ील्ड के अनुरूप हैं।

dtype : dtype या dtypes की सूची

संरचित सरणी के लिए Dtype।

एन्कोडिंग : str, वैकल्पिक

एन्कोडिंग का उपयोग इनपुटफाइल को डीकोड करने के लिए किया जाता है। इनपुट धाराओं पर लागू नहीं होता है।

संस्करण 1.14.0 में नया।

यह दिखाता है:

आउटपुट : ndarray

आउटपुट एरे, जिसमें regexp द्वारा मेल की गई file की सामग्री का हिस्सा था। output हमेशा एक संरचित सरणी है।

जन्म देती है:

त्रुटि प्रकार

जब dtype संरचित सरणी के लिए मान्य dtype नहीं है।

यह भी देखें

fromstring , loadtxt

टिप्पणियाँ

संरचित सरणियों के लिए Dtypes को कई रूपों में निर्दिष्ट किया जा सकता है, लेकिन सभी प्रकार कम से कम डेटा प्रकार और फ़ील्ड नाम निर्दिष्ट करते हैं। विवरण के लिए doc.structured_arrays देखें।

उदाहरण

>>> f = open('test.dat', 'w')
>>> f.write("1312 foo\n1534  bar\n444   qux")
>>> f.close()
>>> regexp = r"(\d+)\s+(...)"  # match [digits, whitespace, anything]
>>> output = np.fromregex('test.dat', regexp,
...                       [('num', np.int64), ('key', 'S3')])
>>> output
array([(1312L, 'foo'), (1534L, 'bar'), (444L, 'qux')],
      dtype=[('num', '<i8'), ('key', '|S3')])
>>> output['num']
array([1312, 1534,  444], dtype=int64)