pandas 0.23 - 1. Installation

Installation




pandas

Installation

पांडा स्थापित करने का सबसे आसान तरीका यह है कि इसे Anaconda वितरण, डेटा विश्लेषण और वैज्ञानिक कंप्यूटिंग के लिए एक क्रॉस प्लेटफॉर्म वितरण के हिस्से के रूप में स्थापित किया जाए। यह अधिकांश उपयोगकर्ताओं के लिए अनुशंसित इंस्टॉलेशन विधि है।

स्रोत, PyPI , ActivePython , विभिन्न लिनक्स वितरण या एक विकास संस्करण से स्थापित करने के निर्देश भी प्रदान किए गए हैं।

पायथन 2.7 छोड़ने की योजना

1 जनवरी, 2020 को पायथन कोर टीम ने पायथन 2.7 का समर्थन बंद करने की योजना बनाई है। न्यूमपी की योजनाओं के अनुसार , 31 दिसंबर, 2018 तक सभी पांडा रिलीज़ पायथन 2 का समर्थन करेंगे।

31 दिसंबर, 2018 से पहले अंतिम रिलीज पायथन 2 का समर्थन करने के लिए अंतिम रिलीज होगी। रिलीज़ किया गया पैकेज PyPI और conda के माध्यम से उपलब्ध रहेगा।

1 जनवरी 2019 से , सभी रिलीज़ केवल पायथन 3 होंगे।

अगर 31 दिसंबर, 2018 को पायथन 2.7 के लिए निरंतर समर्थन में रुचि रखने वाले लोग हैं (या तो बगफिक्स या फंडिंग बैकपिंग कर रहे हैं) कृपया मुद्दे पर नजर रखने वालों तक पहुंचें।

अधिक जानकारी के लिए, पायथन 3 स्टेटमेंट और पोर्टिंग टू पायथन 3 गाइड देखें

पायथन संस्करण का समर्थन

आधिकारिक तौर पर पायथन 2.7, 3.5, 3.6 और 3.7।

पंडों को स्थापित करना

एनाकोंडा के साथ स्थापित करना

पांडा और बाकी NumPy और SciPy स्टैक को स्थापित करना अनुभवहीन उपयोगकर्ताओं के लिए थोड़ा मुश्किल हो सकता है।

न केवल पांडा, बल्कि पायथन और सबसे लोकप्रिय पैकेज स्थापित करने का सबसे सरल तरीका, जो SciPy स्टैक ( IPython , NumPy , Matplotlib ,…) Matplotlib , Anaconda , एक क्रॉस-प्लेटफॉर्म (लिनक्स, मैक ओएस एक्स, विंडोज) पायथन वितरण के साथ है। डेटा एनालिटिक्स और वैज्ञानिक कंप्यूटिंग के लिए।

इंस्टॉलर को चलाने के बाद, उपयोगकर्ता के पास पांडा और बाकी के SciPy स्टैक तक कुछ भी स्थापित करने की आवश्यकता के बिना एक्सेस होगा, और किसी भी सॉफ़्टवेयर के संकलन के लिए प्रतीक्षा करने की आवश्यकता के बिना।

Anaconda लिए स्थापना निर्देश यहां Anaconda जा सकते हैं

Anaconda वितरण के हिस्से के रूप में उपलब्ध पैकेजों की एक पूरी सूची यहां पाई जा सकती है

एनाकोंडा को स्थापित करने का एक और फायदा यह है कि इसे स्थापित करने के लिए आपको व्यवस्थापक अधिकारों की आवश्यकता नहीं है। एनाकोंडा उपयोगकर्ता के होम डायरेक्टरी में स्थापित हो सकता है, जो एनाकोंडा को हटाने का तुच्छ बनाता है यदि आप निर्णय लेते हैं (बस उस फ़ोल्डर को हटा दें)।

मिनिकॉन्डा के साथ इंस्टॉल करना

पिछले खंड में उल्लिखित है कि Anaconda वितरण के हिस्से के रूप में पांडा को कैसे स्थापित किया जाए। हालांकि इस दृष्टिकोण का मतलब है कि आप एक सौ से अधिक पैकेजों को अच्छी तरह से स्थापित करेंगे और इसमें इंस्टॉलर डाउनलोड करना शामिल है जो आकार में कुछ सौ मेगाबाइट है।

यदि आप चाहते हैं कि किस पैकेज पर अधिक नियंत्रण हो, या एक सीमित इंटरनेट बैंडविड्थ हो, तो Miniconda साथ पांडा स्थापित करना एक बेहतर समाधान हो सकता है।

Conda पैकेज मैनेजर है जिसे Anaconda वितरण बनाया गया है। यह एक पैकेज मैनेजर है जो क्रॉस-प्लेटफॉर्म और भाषा अज्ञेय दोनों है (यह एक पाइप और वर्चुअन संयोजन के लिए एक समान भूमिका निभा सकता है)।

Miniconda आपको एक न्यूनतम स्व-निहित पायथन इंस्टॉलेशन बनाने की अनुमति देता है, और फिर अतिरिक्त पैकेज स्थापित करने के लिए Conda कमांड का उपयोग करता है।

पहले आपको Conda को स्थापित करने और डाउनलोड करने की आवश्यकता होगी और Miniconda को चलाना आपके लिए यह काम करेगा। इंस्टॉलर Miniconda

अगला कदम एक नया कोंडा वातावरण बनाना है। एक कोंडा पर्यावरण एक वर्चुअनव की तरह है जो आपको पायथन के विशिष्ट संस्करण और पुस्तकालयों के सेट को निर्दिष्ट करने की अनुमति देता है। टर्मिनल विंडो से निम्न कमांड चलाएँ:

conda create -n name_of_my_env python

यह केवल पायथन में स्थापित होने के साथ एक न्यूनतम वातावरण तैयार करेगा। इस वातावरण को चलाने के लिए अपने आप को अंदर रखना:

source activate name_of_my_env

विंडोज पर कमांड है:

activate name_of_my_env

पांडा को स्थापित करने के लिए आवश्यक अंतिम चरण है। यह निम्नलिखित कमांड के साथ किया जा सकता है:

conda install pandas

एक विशिष्ट पांडा संस्करण स्थापित करने के लिए:

conda install pandas=0.20.3

अन्य पैकेजों को स्थापित करने के लिए, उदाहरण के लिए IPython:

conda install ipython

पूर्ण Anaconda वितरण स्थापित करने के लिए:

conda install anaconda

यदि आपको ऐसे पैकेज की आवश्यकता है जो पाइप के लिए उपलब्ध हैं, लेकिन कोंडा नहीं है, तो पाइप स्थापित करें, और फिर उन पैकेजों को स्थापित करने के लिए पाइप का उपयोग करें:

conda install pip
pip install django

PyPI से संस्थापन

पांडा को PyPI से PyPI माध्यम से स्थापित किया जा सकता है।

pip install pandas

ActivePython के साथ इंस्टॉल करना

ActivePython लिए इंस्टॉलेशन निर्देश ActivePython ActivePython जा सकते ActivePython । संस्करण २. और ३.५ में पांडा शामिल हैं।

अपने लिनक्स वितरण के पैकेज मैनेजर का उपयोग करके इंस्टॉल करना।

इस तालिका में आदेश आपके वितरण से पायथन 3 के लिए पांडा स्थापित करेंगे। अजगर 2 के लिए पांडा स्थापित करने के लिए, आपको python-pandas पैकेज का उपयोग करने की आवश्यकता हो सकती है।

वितरण स्थिति डाउनलोड / रिपोजिटरी लिंक विधि स्थापित करें
डेबियन स्थिर आधिकारिक डेबियन रिपॉजिटरी sudo apt-get install python3-pandas
डेबियन और उबंटू अस्थिर (नवीनतम पैकेज) NeuroDebian sudo apt-get install python3-pandas
उबंटू स्थिर आधिकारिक उबंटू भंडार sudo apt-get install python3-pandas
OpenSuse स्थिर OpenSuse रिपोजिटरी zypper in python3-pandas
फेडोरा स्थिर आधिकारिक फेडोरा भंडार dnf install python3-pandas
CentOS / RHEL स्थिर ईपीएल भंडार yum install python3-pandas

हालांकि , लिनक्स पैकेज प्रबंधकों में पैकेज अक्सर कुछ संस्करण पीछे होते हैं, इसलिए पांडा के नवीनतम संस्करण को प्राप्त करने के लिए, ऊपर वर्णित pip या conda विधियों का उपयोग करके इसे स्थापित करने की सिफारिश की जाती है।

स्रोत से स्थापित करना

गिट स्रोत पेड़ से निर्माण पर पूर्ण निर्देशों के लिए योगदान दस्तावेज देखें। इसके अलावा, यदि आप पंडों के विकास का वातावरण बनाना चाहते हैं तो एक विकास वातावरण बनाना देखें।

परीक्षण सूट चल रहा है

पांडा इस लेखन के रूप में कोडबेस के 97% को कवर करते हुए, यूनिट परीक्षणों के एक विस्तृत सेट से सुसज्जित है। अपनी मशीन पर इसे चलाने के लिए यह सत्यापित करने के लिए कि सब कुछ काम कर रहा है (और यह कि आपके पास सभी निर्भरताएं हैं, नरम और कठोर, स्थापित), सुनिश्चित करें कि आपके पास pytest और रन है:

>>> import pandas as pd
>>> pd.test()
running: pytest --skip-slow --skip-network C:\Users\TP\Anaconda3\envs\py36\lib\site-packages\pandas
============================= test session starts =============================
platform win32 -- Python 3.6.2, pytest-3.2.1, py-1.4.34, pluggy-0.4.0
rootdir: C:\Users\TP\Documents\Python\pandasdev\pandas, inifile: setup.cfg
collected 12145 items / 3 skipped

..................................................................S......
........S................................................................
.........................................................................

==================== 12130 passed, 12 skipped in 368.339 seconds =====================

निर्भरता

ध्यान दें

आपको इन पुस्तकालयों को स्थापित करने के लिए अत्यधिक प्रोत्साहित किया जाता है, क्योंकि वे गति में सुधार प्रदान करते हैं, खासकर जब बड़े डेटा सेट के साथ काम करते हैं।

वैकल्पिक निर्भरताएँ

  • साइथन : केवल विकास संस्करण का निर्माण करना आवश्यक है। संस्करण 0.24 या उच्चतर।
  • SciPy : विविध सांख्यिकीय फ़ंक्शंस, संस्करण 0.14.0 या उच्चतर
  • xarray :> 2 dims के लिए हैंडलिंग जैसे पांडा, xarray ऑब्जेक्ट्स के लिए पैनलों को परिवर्तित करने के लिए आवश्यक। संस्करण 0.7.0 या उच्चतर अनुशंसित है।
  • PyTables : HDF5- आधारित भंडारण के लिए आवश्यक है। संस्करण 3.0.0 या उच्चतर आवश्यक, संस्करण 3.2.1 या उच्चतर अनुशंसित।
  • पंख प्रारूप : पंख आधारित भंडारण, संस्करण 0.3.1 या उच्चतर के लिए आवश्यक है।
  • अपाचे लकड़ी की छत के लिए या तो pyarrow (> = 0.4.1) या fastparquet (> = 0.0.6)। brotli और brotli संपीड़न सहायता के लिए उपलब्ध हैं।
  • SQLAlchemy : SQL डेटाबेस समर्थन के लिए। संस्करण 0.8.1 या उच्चतर अनुशंसित। SQLAlchemy के अलावा, आपको एक डेटाबेस विशिष्ट ड्राइवर की भी आवश्यकता होती है। आप SQLAlchemy डॉक्स में प्रत्येक SQL बोली के लिए समर्थित ड्राइवरों का अवलोकन पा सकते हैं। कुछ सामान्य ड्राइवर हैं:

    • psycopg2 : PostgreSQL के लिए
    • pymysql : MySQL के लिए।
    • SQLite : SQLite लिए, यह डिफ़ॉल्ट रूप से पायथन के मानक पुस्तकालय में शामिल है।
  • Matplotlib : प्लॉटिंग के लिए, संस्करण 1.4.3 या उच्चतर।
  • एक्सेल I / O के लिए:

    • xlrd/xlwt : एक्सेल रीडिंग (xlrd) और लेखन (xlwt)
    • openpyxl : लेखन के लिए Openpyxl संस्करण 2.4.0। xxx फाइलें (xlrd> = 0.9.0)
    • XlsxWriter : वैकल्पिक एक्सेल लेखक
  • Jinja2 : सशर्त HTML स्वरूपण के लिए टेम्पलेट इंजन।
  • s3fs : अमेज़न S3 एक्सेस (s3fs> = 0.0.7) के लिए आवश्यक है।
  • blosc : ब्लॉस्क का उपयोग करके blosc सम्पीडन के लिए
  • qtpy एक (PyQt या PySide की आवश्यकता होती है), PyQt5 , PyQt4 , xsel , xsel , या xclip : read_clipboard() का उपयोग करना आवश्यक है। लिनक्स वितरण पर अधिकांश पैकेज प्रबंधकों को स्थापना के लिए तुरंत और / या xsel उपलब्ध होगा।
  • pandas-gbq : Google BigQuery I / O के लिए।
  • Backports.lzma : केवल CSV में xz संपीड़ित डेटाफ़्रेम से लिखने और / या पढ़ने के लिए पायथन 2 के लिए; पायथन 3 समर्थन मानक पुस्तकालय में बनाया गया है।
  • शीर्ष-स्तरीय read_html() फ़ंक्शन का उपयोग करने के लिए पुस्तकालयों के निम्नलिखित संयोजनों में से एक की आवश्यकता है:

    संस्करण में परिवर्तित किया गया 0.23.0।

    ध्यान दें

    अगर BeautifulSoup4 का उपयोग करते हुए 4.2.1 का न्यूनतम संस्करण आवश्यक है

    चेतावनी

    • यदि आप BeautifulSoup4 स्थापित करते हैं तो आपको html5lib या html5lib या दोनों को स्थापित करना होगा। read_html() केवल BeautifulSoup4 स्थापित के साथ काम नहीं करेगा।
    • एचटीएमएल टेबल पार्सिंग गोचा पढ़ने के लिए आपको अत्यधिक प्रोत्साहित किया जाता है। यह उपरोक्त तीन पुस्तकालयों की स्थापना और उपयोग के आसपास के मुद्दों की व्याख्या करता है।

    ध्यान दें

    • अगर आप apt-get साथ एक सिस्टम पर हैं तो आप कर सकते हैं

      sudo apt-get build-dep python-lxml
      

      एलएक्सएमएल की स्थापना के लिए आवश्यक निर्भरता प्राप्त करने के लिए। यह लाइन के आगे सिरदर्द को रोक देगा।

ध्यान दें

वैकल्पिक निर्भरता के बिना, कई उपयोगी सुविधाएँ काम नहीं करेंगी। इसलिए, यह अत्यधिक अनुशंसा की जाती है कि आप इन्हें स्थापित करें। Anaconda , ActivePython (संस्करण 2.7 या 3.5), या उत्साहित चंदवा जैसे एक पैकेट वितरण पर विचार करने लायक हो सकता है।