NumPy 1.14 - numpy.genfromtxt()

numpy.genfromtxt




numpy

numpy.genfromtxt

numpy.genfromtxt(fname, dtype=<class 'float'>, comments='#', delimiter=None, skip_header=0, skip_footer=0, converters=None, missing_values=None, filling_values=None, usecols=None, names=None, excludelist=None, deletechars=None, replace_space='_', autostrip=False, case_sensitive=True, defaultfmt='f%i', unpack=None, usemask=False, loose=True, invalid_raise=True, max_rows=None, encoding='bytes') [source]

निर्दिष्ट मान के साथ अनुपलब्ध मानों के साथ एक पाठ फ़ाइल से डेटा लोड करें।

पहली skip_header लाइनों के पिछले प्रत्येक लाइन को delimiter चरित्र में विभाजित किया गया delimiter , और comments चरित्र का अनुसरण comments वर्णों को छोड़ दिया गया है।

पैरामीटर:

fname : फ़ाइल, str, pathlib.Path, str की सूची, जनरेटर

फ़ाइल, फ़ाइल नाम, सूची, या पढ़ने के लिए जनरेटर। यदि फ़ाइल नाम एक्सटेंशन gz या bz2 , तो फ़ाइल पहले विघटित हो जाती है। ध्यान दें कि जनरेटर को पायथन 3k में बाइट स्ट्रिंग्स को वापस करना होगा। एक सूची में तार या एक जनरेटर द्वारा उत्पादित लाइनों के रूप में माना जाता है।

dtype : dtype, वैकल्पिक

परिणामी सरणी का डेटा प्रकार। यदि कोई नहीं, dtypes प्रत्येक स्तंभ की सामग्री द्वारा, व्यक्तिगत रूप से निर्धारित किया जाएगा।

टिप्पणियाँ : str, वैकल्पिक

चरित्र एक टिप्पणी की शुरुआत का संकेत देता था। एक टिप्पणी के बाद एक पंक्ति में होने वाले सभी वर्ण खारिज कर दिए जाते हैं

सीमांकक : str, int, या अनुक्रम, वैकल्पिक

मानों को अलग करने के लिए प्रयुक्त स्ट्रिंग। डिफ़ॉल्ट रूप से, कोई भी लगातार व्हाट्सएप सीमांकक के रूप में कार्य करता है। पूर्णांकों का पूर्णांक या अनुक्रम भी प्रत्येक क्षेत्र की चौड़ाई (ओं) के रूप में प्रदान किया जा सकता है।

स्किपरो : इंट, वैकल्पिक

1.10 में skiprows को छोड़ दिया गया। कृपया इसके बजाय skip_header उपयोग करें।

Skip_header : int, वैकल्पिक

फ़ाइल की शुरुआत में रेखाओं की संख्या।

Skip_footer : int, वैकल्पिक

फ़ाइल के अंत में छोड़ने के लिए लाइनों की संख्या।

कन्वर्टर्स : चर, वैकल्पिक

फ़ंक्शन का सेट जो स्तंभ के डेटा को मान में परिवर्तित करता है। कन्वर्टर्स का उपयोग लापता डेटा के लिए एक डिफ़ॉल्ट मान प्रदान करने के लिए भी किया जा सकता है: converters = {3: lambda s: float(s or 0)}

अनुपलब्ध : चर, वैकल्पिक

1.10 में missing को हटा दिया गया था। कृपया इसके बजाय missing_values उपयोग करें।

अनुपलब्ध_कार्य : चर, वैकल्पिक

लापता डेटा के अनुरूप तार का सेट।

fill_values : चर, वैकल्पिक

डेटा गुम होने पर मूल्यों का सेट डिफ़ॉल्ट के रूप में उपयोग किया जाता है।

usecols : अनुक्रम, वैकल्पिक

कौन सा कॉलम पढ़ना है, जिसमें 0 पहला है। उदाहरण के लिए, usecols = (1, 4, 5) 2, 5 और 6 वां कॉलम usecols = (1, 4, 5)

नाम : {कोई नहीं, सत्य, str, अनुक्रम}, वैकल्पिक

यदि names सत्य है, तो फ़ील्ड नाम पहली skip_header लाइनों के बाद पहली पंक्ति से पढ़े जाते हैं। यह लाइन वैकल्पिक रूप से एक टिप्पणी परिधि द्वारा आगे बढ़ाई जा सकती है। यदि names एक अनुक्रम या अल्पविराम से अलग नामों का एक स्ट्रिंग है, तो नाम का उपयोग संरचित dtype में फ़ील्ड नामों को परिभाषित करने के लिए किया जाएगा। यदि names कोई नहीं है, तो dtype फ़ील्ड्स के नामों का उपयोग किया जाएगा, यदि कोई हो।

बहिष्कृत : अनुक्रम, वैकल्पिक

बाहर करने के लिए नामों की एक सूची। यह सूची डिफ़ॉल्ट सूची ['वापसी', 'फ़ाइल', 'प्रिंट'] से जुड़ी है। अपवर्जित नामों को एक अंडरस्कोर जोड़ा जाता है: उदाहरण के लिए, file file_ बन file_

deleteechars : str, वैकल्पिक

अमान्य वर्णों का एक स्ट्रिंग जो नामों से हटाया जाना चाहिए।

defaultfmt : str, वैकल्पिक

डिफ़ॉल्ट फ़ील्ड नामों को परिभाषित करने के लिए उपयोग किया जाने वाला प्रारूप, जैसे "f% i" या "f_% 02i"।

ऑटोस्ट्रिप : बूल, वैकल्पिक

चाहे तो वेरिएबल्स से व्हाइट स्पेस को ऑटोमैटिकली स्ट्रिप करें।

प्रतिस्थापन_क्षेत्र : चार, वैकल्पिक

चर नामों में श्वेत रिक्त स्थान के प्रतिस्थापन में प्रयुक्त चरित्र (ओं) का। डिफ़ॉल्ट रूप से, '_' का उपयोग करें।

case_sensitive : {ट्रू, गलत, 'अपर', 'लोअर'}, वैकल्पिक

यदि सही है, तो फ़ील्ड नाम संवेदनशील हैं। यदि गलत या 'ऊपरी', फ़ील्ड नाम ऊपरी मामले में परिवर्तित हो जाते हैं। यदि 'निचला', फ़ील्ड नाम निचले मामले में परिवर्तित हो जाते हैं।

अनपैक : बूल, वैकल्पिक

यदि सही है, तो लौटाया गया सरणी ट्रांसपोज़ किया गया है, ताकि x, y, z = loadtxt(...) का उपयोग करके तर्क को अनपैक किया जा सके x, y, z = loadtxt(...)

usemask : बूल, वैकल्पिक

यदि सही है, तो एक नकाबपोश सरणी लौटें। यदि गलत है, तो एक नियमित सरणी लौटें।

ढीला : बूल, वैकल्पिक

यदि सही है, तो अमान्य मानों के लिए त्रुटियाँ न उठाएँ।

अमान्य_ वैकल्पिक: बूल, वैकल्पिक

यदि सही है, तो एक अपवाद उठाया जाता है यदि स्तंभों की संख्या में असंगति का पता लगाया जाता है। यदि गलत है, तो एक चेतावनी उत्सर्जित की जाती है और आपत्तिजनक लाइनें छोड़ दी जाती हैं।

max_rows : int, वैकल्पिक

पढ़ने के लिए पंक्तियों की अधिकतम संख्या। एक ही समय में Skip_footer के साथ उपयोग नहीं किया जाना चाहिए। यदि दिया गया है, तो मान कम से कम 1. होना चाहिए। डिफ़ॉल्ट संपूर्ण फ़ाइल को पढ़ने के लिए है।

संस्करण 1.10.0 में नया।

एन्कोडिंग : str, वैकल्पिक

एन्कोडिंग का उपयोग इनपुटफाइल को डीकोड करने के लिए किया जाता है। fname फ़ाइल ऑब्जेक्ट है जब लागू नहीं होता है। विशेष मूल्य 'बाइट्स' यह सुनिश्चित करता है कि आप जब संभव हो तो बाइट एरेज़ प्राप्त करते हैं और कन्वर्टर्स के लिए लैटिन 1 एन्कोडेड स्ट्रिंग्स को पास करते हैं, जो बैकवर्ड एरेज़ को सक्षम करता है। यूनिकोड सरणियों को प्राप्त करने और कन्वर्टर्स के लिए इनपुट के रूप में तार पास करने के लिए इस मूल्य को ओवरराइड करें। यदि सिस्टम डिफॉल्ट में से किसी में भी प्रयोग किया जाता है। डिफ़ॉल्ट मान 'बाइट्स' है।

संस्करण 1.14.0 में नया।

यह दिखाता है:

बाहर : ndarray

पाठ फ़ाइल से डेटा पढ़ा गया। यदि usemask True है, तो यह एक नकाबपोश सरणी है।

यह भी देखें

numpy.loadtxt
समतुल्य फ़ंक्शन जब कोई डेटा गायब नहीं है।

टिप्पणियाँ

  • जब रिक्त स्थान को सीमांकक के रूप में उपयोग किया जाता है, या जब कोई परिसीमन इनपुट के रूप में नहीं दिया जाता है, तो दो क्षेत्रों के बीच कोई लापता डेटा नहीं होना चाहिए।
  • जब चरों का नामकरण किया जाता है (या तो लचीले dtype द्वारा या names साथ, फ़ाइल में कोई हेडर नहीं होना चाहिए (अन्यथा ValueError अपवाद उठाया गया है)।
  • व्यक्तिगत मान डिफ़ॉल्ट रूप से रिक्त स्थान नहीं छीनते हैं। कस्टम कनवर्टर का उपयोग करते समय, सुनिश्चित करें कि फ़ंक्शन रिक्त स्थान को हटा देता है।

संदर्भ

[R3434] NumPy उपयोगकर्ता गाइड, NumPy के साथ अनुभाग I / O।

उदाहरण

>>> from io import StringIO
>>> import numpy as np

मिश्रित dtype के साथ कॉमा सीमांकित फ़ाइल

>>> s = StringIO("1,1.3,abcde")
>>> data = np.genfromtxt(s, dtype=[('myint','i8'),('myfloat','f8'),
... ('mystring','S5')], delimiter=",")
>>> data
array((1, 1.3, 'abcde'),
      dtype=[('myint', '<i8'), ('myfloat', '<f8'), ('mystring', '|S5')])

Dtype = कोई नहीं का उपयोग करना

>>> s.seek(0) # needed for StringIO example only
>>> data = np.genfromtxt(s, dtype=None,
... names = ['myint','myfloat','mystring'], delimiter=",")
>>> data
array((1, 1.3, 'abcde'),
      dtype=[('myint', '<i8'), ('myfloat', '<f8'), ('mystring', '|S5')])

Dtype और नाम निर्दिष्ट करना

>>> s.seek(0)
>>> data = np.genfromtxt(s, dtype="i8,f8,S5",
... names=['myint','myfloat','mystring'], delimiter=",")
>>> data
array((1, 1.3, 'abcde'),
      dtype=[('myint', '<i8'), ('myfloat', '<f8'), ('mystring', '|S5')])

निश्चित-चौड़ाई वाले स्तंभों के साथ एक उदाहरण

>>> s = StringIO("11.3abcde")
>>> data = np.genfromtxt(s, dtype=None, names=['intvar','fltvar','strvar'],
...     delimiter=[1,3,5])
>>> data
array((1, 1.3, 'abcde'),
      dtype=[('intvar', '<i8'), ('fltvar', '<f8'), ('strvar', '|S5')])