pandas 0.23 - 27. pandas Ecosystem

पांडा इकोसिस्टम




pandas

पांडा इकोसिस्टम

डेटा तैयारी, विश्लेषण और विज़ुअलाइज़ेशन में विशिष्ट आवश्यकताओं को पूरा करने के लिए बढ़ते हुए पांडा के शीर्ष पर पैकेज बनाए जा रहे हैं। यह उत्साहजनक है क्योंकि इसका मतलब है कि पांडा न केवल उपयोगकर्ताओं को अपने डेटा कार्यों को संभालने में मदद कर रहे हैं बल्कि यह भी है कि यह डेवलपर्स के लिए शक्तिशाली और अधिक केंद्रित डेटा टूल बनाने के लिए एक बेहतर शुरुआती बिंदु प्रदान करता है। पंडों की कार्यक्षमता को पूरक करने वाले पुस्तकालयों का निर्माण भी पंडों के विकास को मूल आवश्यकताओं के आसपास केंद्रित रहने की अनुमति देता है।

यह उन परियोजनाओं की एक विस्तृत सूची है जो पीडा पर अंतरिक्ष में उपकरण प्रदान करने के लिए पंडों का निर्माण करती हैं।

हम उपयोगकर्ताओं को इन प्रोजेक्ट को ढूंढना आसान बनाना चाहते हैं, यदि आपको अन्य महत्वपूर्ण परियोजनाओं के बारे में पता है जो आपको लगता है कि इस सूची में होना चाहिए, तो कृपया हमें बताएं।

सांख्यिकी और मशीन लर्निंग

Statsmodels

Statsmodels प्रमुख पायथन "सांख्यिकी और अर्थमिति पुस्तकालय" है और इसका पांडा के साथ लंबे समय से विशेष संबंध है। Statsmodels शक्तिशाली आंकड़े, अर्थमिति, विश्लेषण और मॉडलिंग कार्यक्षमता प्रदान करता है जो पांडा के दायरे से बाहर है। Statsmodels गणना के लिए अंतर्निहित डेटा कंटेनर के रूप में पांडा वस्तुओं का लाभ उठाता है।

sklearn-पांडा

अपने scikit-learn एमएल पाइपलाइन में पांडा डेटाफ्रैम का उपयोग करें।

Featuretools

करतबबाजों के शीर्ष पर निर्मित स्वचालित सुविधा इंजीनियरिंग के लिए Featuretools एक पायथन लाइब्रेरी है। यह पुन: प्रयोज्य फीचर इंजीनियरिंग "प्राइमेटिव्स" का उपयोग कर मशीन लर्निंग के लिए टेम्परेरी और रिलेशनल डेटासेट को फीचर मैट्रिसेस में बदलने का प्रयास करता है। उपयोगकर्ता पायथन में अपने स्वयं के आदिम योगदान दे सकते हैं और उन्हें बाकी समुदाय के साथ साझा कर सकते हैं।

दृश्य

bokeh

बोकेह बड़े डेटासेट के लिए पायथन इंटरएक्टिव विज़ुअलाइज़ेशन लाइब्रेरी है जो मूल रूप से नवीनतम वेब प्रौद्योगिकियों का उपयोग करता है। इसका लक्ष्य प्रोटॉविस / डी 3 की शैली में उपन्यास ग्राफिक्स के सुरुचिपूर्ण, संक्षिप्त निर्माण प्रदान करना है, जबकि पतले ग्राहकों को बड़े डेटा पर उच्च-प्रदर्शन अन्तरक्रियाशीलता प्रदान करना है।

Seaborn

सीबॉर्न एक पायथन विज़ुअलाइज़ेशन लाइब्रेरी है जो मैटलपोटलिब पर आधारित है। यह आकर्षक सांख्यिकीय ग्राफिक्स बनाने के लिए एक उच्च-स्तरीय, डेटा-उन्मुख इंटरफ़ेस प्रदान करता है। समुद्र में साजिश रचने का कार्य पांडा वस्तुओं को समझते हैं और जटिल दृश्य के संक्षिप्त विनिर्देश का समर्थन करने के लिए आंतरिक रूप से पांडा समूह संचालन का लाभ उठाते हैं। सीबोर्न मेटप्लोटलिब और पांडा से आगे निकलकर सांख्यिकीय अनुमान लगाने, विकल्पों को देखते हुए, टिप्पणियों को एकत्र करने और सांख्यिकीय मॉडल में पैटर्न पर जोर देने के लिए सांख्यिकीय मॉडल के फिट को देखने के विकल्प के साथ जाता है।

yhat / ggplot

हैडली विकम का ggplot2 R भाषा के लिए एक मूलभूत खोजपरक विज़ुअलाइज़ेशन पैकेज है। "द ग्रामर ऑफ़ ग्राफिक्स" पर आधारित यह किसी भी तरह के डेटा के बीस्पोक प्लॉट उत्पन्न करने के लिए एक शक्तिशाली, घोषणात्मक और अत्यंत सामान्य तरीका प्रदान करता है। यह वास्तव में काफी अविश्वसनीय है। अन्य भाषाओं के लिए विभिन्न कार्यान्वयन उपलब्ध हैं, लेकिन पायथन उपयोगकर्ताओं के लिए एक वफादार कार्यान्वयन लंबे समय से गायब है। यद्यपि अभी भी युवा (जनवरी -2014 के अनुसार), yhat/ggplot परियोजना उस दिशा में तेजी से प्रगति कर रही है।

विंसेंट

Vincent परियोजना भूखंड बनाने के लिए Vega (बदले में, d3 लाभ उठाती है) का लाभ उठाती है। यद्यपि कार्यात्मक, समर 2016 के रूप में विन्सेन्ट परियोजना को दो वर्षों में अद्यतन नहीं किया गया है और आगे के अपडेट प्राप्त होने की संभावना नहीं है

आईपीथॉन वेगा

विन्सेंट की तरह, आईपीथॉन वेगा परियोजना भूखंड बनाने के लिए Vega का लाभ उठाती है, लेकिन मुख्य रूप से आईपीथॉन नोटबुक पर्यावरण को लक्षित करती है।

Plotly

Plotly’s पाइथन एपीआई इंटरएक्टिव आंकड़े और वेब शेअरबिलिटी को सक्षम बनाता है। मैप्स, 2 डी, 3 डी, और लाइव-स्ट्रीमिंग ग्राफ़ को d3 और डी 3 d3 साथ प्रस्तुत किया गया है। पुस्तकालय एक पांडा डेटाफ़्रेम और क्लाउड-आधारित सहयोग से सीधे प्लॉटिंग का समर्थन करता है। Matplotlib, Python के लिए ggplot, और Seaborn के उपयोगकर्ता इंटरैक्टिव वेब-आधारित भूखंडों में आंकड़े बदल सकते हैं। IPython नोटबुक में भूखंडों को खींचा जा सकता है, R या MATLAB के साथ संपादित किया जा सकता है, GUI में संशोधित किया जा सकता है, या ऐप्स और डैशबोर्ड में एम्बेड किया जा सकता है। असीमित साझाकरण के लिए प्लॉटली निःशुल्क है, और इसमें निजी उपयोग के लिए cloud , offline या on-premise खाते हैं।

QtPandas

मुख्य पांडा लाइब्रेरी से दूर, qtpandas लाइब्रेरी PyQt4 और PySide अनुप्रयोगों में DataFrame विज़ुअलाइज़ेशन और हेरफेर को सक्षम बनाता है।

आईडीई

IPython

IPython एक इंटरैक्टिव कमांड शेल और वितरित कंप्यूटिंग वातावरण है। IPython नोटबुक IPython नोटबुक बनाने के लिए एक वेब अनुप्रयोग है। IPython नोटबुक एक JSON डॉक्यूमेंट है जिसमें इनपुट / आउटपुट सेल की एक ऑर्डर की गई सूची होती है जिसमें कोड, टेक्स्ट, गणित, प्लॉट और रिच मीडिया हो सकते हैं। IPython पुस्तिकाओं को कई ओपन स्टैंडर्ड आउटपुट फॉर्मेट (HTML, HTML प्रेजेंटेशन स्लाइड्स, LaTeX, PDF, ReStructuredText, Markdown, Python) में वेब इंटरफेस और शेल में ipython nbconvert 'डाउनलोड अस' के जरिए ipython nbconvert है।

पंडों डेटाफ़्रेम _repr_html_ विधियों को लागू करते हैं जो कि IPython नोटबुक द्वारा HTML तालिकाओं को प्रदर्शित करने के लिए उपयोग किए जाते हैं। (नोट: HTML तालिकाओं गैर- HTML IPython आउटपुट स्वरूपों के साथ संगत हो सकती हैं या नहीं भी।)

quantopian / qgrid

qgrid "IPython नोटबुक में DataFrames को सॉर्ट करने और फ़िल्टर करने के लिए एक इंटरेक्टिव ग्रिड है" SlickGrid के साथ बनाया गया है।

स्पाइडर

स्पाइडर एक क्रॉस-प्लेटफॉर्म Qt- आधारित ओपन-सोर्स Python IDE है जिसमें एडिटिंग, टेस्टिंग, डिबगिंग और इंट्रोस्पैक्शन फीचर्स हैं। स्पाइडर अब पंडों डेटाफ्रेम को आत्मसात कर सकता है और प्रदर्शित कर सकता है और "कॉलम वार मिनट / अधिकतम और वैश्विक मिनट / रंग दोनों" दिखा सकता है।

एपीआई

पांडा-DataReader

pandas-datareader डाटारीडर पांडा (PyPI: pandas-datareader डेटारीडर) के लिए एक दूरस्थ डेटा एक्सेस लाइब्रेरी है। यह कार्यक्षमता पर आधारित है जो pandas.io.data और pandas.io.wb में स्थित थी लेकिन pandas.io.wb में विभाजित हो गई थी। पंडों में अधिक देखें- datareader डॉक्स :

निम्नलिखित डेटा फ़ीड उपलब्ध हैं:

  • याहू! वित्त
  • Google वित्त
  • फ्रेड
  • फ़ामा / फ्रेंच
  • विश्व बैंक
  • ओईसीडी
  • यूरोस्टेट
  • EDGAR सूचकांक

quandl / अजगर

पाइथन के लिए क्वैंडल एपीआई पंडों डेटाफ्रैम को समय-अनुक्रमित अनुक्रमित के साथ वापस करने के लिए क्वैंडल रीस्ट एपीआई को लपेटता है।

pydatastream

PyDatastream Thomson Dataworks Enterprise (DWE / Datastream) SOAP API के लिए पायथन इंटरफ़ेस है, जो वित्तीय डेटा के साथ अनुक्रमित पंडों डेटाफ़्रेम या पैनलों को वापस करता है। इस पैकेज के लिए इस API के लिए मान्य क्रेडेंशियल (गैर-मुक्त) की आवश्यकता है।

pandaSDMX

pandaSDMX सांख्यिकीय डेटा और मेटाडाटा को पुनः प्राप्त करने और प्राप्त करने के लिए एक पुस्तकालय है, जिसका प्रसार SDMX 2.1 में किया जाता है, जो एक आईएसओ-मानक है, जिसका उपयोग सांख्यिकी कार्यालयों, केंद्रीय बैंकों और अंतर्राष्ट्रीय संगठनों द्वारा व्यापक रूप से किया जाता है। पांडाएसडीएमएक्स डेटासेट्स, कोड-लिस्ट, और डेटास्ट्रक्चर परिभाषाओं सहित डेटासेट और संबंधित संरचनात्मक मेटाडेटा को पांडा श्रृंखला या बहु-अनुक्रमित डेटाफ्रेम के रूप में उजागर कर सकता है।

fredapi

fredapi फेडरल रिजर्व आर्थिक डेटा (FRED) के लिए फेडरल रिजर्व बैंक ऑफ सेंट लुइस द्वारा प्रदान किया गया एक पायथन इंटरफ़ेस है। यह FRED डेटाबेस और ALFRED डेटाबेस दोनों के साथ काम करता है जिसमें पॉइंट-इन-टाइम डेटा (यानी ऐतिहासिक डेटा संशोधन) होता है। fredapi Python में FRED HTTP API के लिए एक आवरण प्रदान करता है, और ALFRED से पॉइंट-इन-टाइम डेटा पार्स करने और विश्लेषण करने के लिए कई सुविधाजनक तरीके भी प्रदान करता है। fredapi एक श्रृंखला या DataFrame में पांडा और रिटर्न डेटा का उपयोग करता है। इस मॉड्यूल को FRED API कुंजी की आवश्यकता होती है जिसे आप FRED वेबसाइट पर मुफ्त में प्राप्त कर सकते हैं।

डोमेन विशिष्ट

Geopandas

जियोस्पेस, भौगोलिक सूचनाओं को शामिल करने के लिए पांडा डेटा ऑब्जेक्ट का विस्तार करते हैं जो ज्यामितीय संचालन का समर्थन करते हैं। यदि आपका काम नक्शे और भौगोलिक निर्देशांक में प्रवेश करता है, और आप पांडा से प्यार करते हैं, तो आपको जियोपांडास पर एक नज़र रखना चाहिए।

xarray

xarray, पंडों की लेबल डेटा शक्ति को कोर पांडा डेटा संरचनाओं के एन-आयामी वेरिएंट प्रदान करके भौतिक विज्ञानों में लाता है। इसका उद्देश्य टेबुल डेटा के बजाय बहु-आयामी सरणियों पर एनालिटिक्स के लिए पांडा-जैसा और पांडा-संगत टूलकिट प्रदान करना है, जिसके लिए पांडा एक्सेल करते हैं।

बाहर का मूल

Dask

Dask एनालिटिक्स के लिए एक लचीली समानांतर कंप्यूटिंग लाइब्रेरी है। DataFrame आउट-ऑफ-कोर, समानांतर और वितरित कंप्यूटिंग के लिए एक परिचित DataFrame इंटरफ़ेस प्रदान करता है।

Dask-माले

Dask-ML, Scikit-Learn, XGBoost, और TensorFlow जैसी मौजूदा मशीन लर्निंग लाइब्रेरी के साथ Dask का उपयोग करके समानांतर और वितरित मशीन लर्निंग को सक्षम करता है।

ज्वाला

ब्लेज़ विभिन्न इन-मेमोरी और ऑन-डिस्क बैकएंड के साथ कम्प्यूटेशन करने के लिए एक मानक एपीआई प्रदान करता है: न्यूमपी, पंडस, एसक्यूएलकेमी, मोंगोडीबी, पायटेबल्स, पाइस्पार्क।

ओ करना

ओडो विभिन्न स्वरूपों के बीच डेटा स्थानांतरित करने के लिए एक समान एपीआई प्रदान करता है। यह CSV IO के लिए पंडों के अपने read_csv का उपयोग करता है और गैर-पंडों के स्वरूपों के बीच डेटा को स्थानांतरित करने के लिए कई मौजूदा पैकेज जैसे PyTables, h5py और pymongo का लाभ उठाता है। इसके ग्राफ आधारित दृष्टिकोण भी कस्टम प्रारूपों के लिए अंतिम उपयोगकर्ताओं द्वारा एक्स्टेंसिबल हैं जो ओडो के मूल के लिए बहुत विशिष्ट हो सकते हैं।

डेटा मान्य

एन गार्डे

Engarde एक हल्की लाइब्रेरी है जिसका उपयोग स्पष्ट रूप से आपकी मान्यताओं को आपके डेटासेट को निरस्त करने और यह जांचने के लिए किया जाता है कि वे वास्तव में सच हैं।

एक्सटेंशन डेटा प्रकार

पंडों ने NumPy के प्रकार प्रणाली का विस्तार करने के लिए विस्तार प्रकारों को परिभाषित करने के लिए एक इंटरफ़ेस प्रदान किया है। निम्‍न लाइब्रेरियां उस इंटरफ़ेस को कार्यान्वित करती हैं, जो कि उन प्रकारों को प्रदान करने के लिए नहीं है जैसे कि NumPy या पांडा, जो पांडा के डेटा कंटेनरों के साथ अच्छी तरह से काम करते हैं।

cyberpandas

साइबरस्पेस आईपी एड्रेस की सरणियों के भंडारण के लिए एक एक्सटेंशन प्रकार प्रदान करता है। इन सरणियों को पंडों की श्रृंखला और डेटाफ़्रेम के अंदर संग्रहीत किया जा सकता है।

पहुंचकर्ता

विस्तार पहुंच प्रदान करने वाली परियोजनाओं की एक निर्देशिका। यह उपयोगकर्ताओं के लिए नए एक्सेसर्स की खोज करने और लाइब्रेरी लेखकों के लिए नामस्थान पर समन्वय करने के लिए है।

पुस्तकालय एक्सेसर कक्षाएं
cyberpandas ip Series
pdvega vgplot Series , DataFrame