python पायथन के साथ Excel(xls) फ़ाइलों को पढ़ना/पार्स करना




(6)

पाइथन ( CSV फाइलों के साथ) के साथ एक्सेल (एक्सएलएस) फ़ाइलों को पढ़ने का सबसे अच्छा तरीका क्या है।

क्या कोई अंतर्निहित पैकेज है जो इस कार्य को करने के लिए पायथन में डिफ़ॉल्ट रूप से समर्थित है?


पुरानी एक्सेल फ़ाइलों के लिए OleFileIO_PL मॉड्यूल है जो ओएलई संरचित भंडारण प्रारूप को पढ़ सकता है।


पांडा का उपयोग करना:

import pandas as pd

xls = pd.ExcelFile("yourfilename.xls")

sheetX = xls.parse(2) #2 is the sheet number

var1 = sheetX['ColumnName']

print(var1[1]) #1 is the row number...

मैं अत्यधिक .xls फ़ाइलों को पढ़ने के लिए xlrd की सलाह देते हैं।

Voyager COM स्वचालन के उपयोग का उल्लेख किया। कुछ साल पहले इसे स्वयं करने के बाद, चेतावनी दी जानी कि यह एक असली पिटा है। चेतावनी की संख्या बहुत बड़ी है और दस्तावेज़ीकरण की कमी और कष्टप्रद है। मैं कई अजीब कीड़े और गेटचास में भाग गया, जिनमें से कुछ को समझने में कई घंटे लग गए।

अद्यतन: नई .xlsx फ़ाइलों के लिए, पढ़ने और लिखने के लिए अनुशंसित लाइब्रेरी openpyxl प्रतीत होता है।


पाइथन xlrd पुस्तकालय इस समस्या के लिए बेहतर समाधान कर सकते हैं

import xlrd

एक कार्यपुस्तिका खोलने के लिए

workbook = xlrd.open_workbook('your_file_name.xlsx')

नाम से खुली चादरें

worksheet = workbook.sheet_by_name('Name of the Sheet')

सूचकांक द्वारा खुली चादरें

worksheet = workbook.sheet_by_index(0)

सेल मान पढ़ें

worksheet.cell(0, 0).value    


आप xls2csv (गैर-पायथन) प्रोग्राम को चलाने पर भी विचार कर सकते हैं। इसे एक एक्सएलएस फ़ाइल फ़ीड करें, और आपको एक सीएसवी वापस लेना चाहिए।







xls