पायथन, भाषा म्हणून, मोजण्यापलीकडे मौल्यवान आहे, विशेषत: जेव्हा तुम्हाला संरचित डेटासह कार्य करायचे असते. लोक Excel फायलींमध्ये भरपूर डेटा संचयित करत असल्याने, वेळ आणि श्रम वाचवण्यासाठी एकाधिक फाइल्स एकत्र करणे अत्यावश्यक आहे.
पायथन तुम्हाला तेच करू देतो; तुम्हाला कितीही एक्सेल फाइल्स एकत्र करायच्या आहेत हे महत्त्वाचे नाही, तुम्ही ते सापेक्ष सहजतेने करू शकता. त्याची लायब्ररी आणि तृतीय-पक्ष संसाधनांची श्रेणी पाहता, तुम्ही तुमची बिडिंग करण्यासाठी पायथनची मल्टीफंक्शनल टूल्स इंपोर्ट आणि वापरू शकता.
या मार्गदर्शकामध्ये, तुम्हाला Python मध्ये डेटा इंपोर्ट करण्यासाठी Pandas लायब्ररी इन्स्टॉल करणे आणि वापरणे आवश्यक आहे.
पायथनमध्ये पांडा लायब्ररी स्थापित करा
pandas एक तृतीय-पक्ष लायब्ररी आहे जी तुम्ही Python मध्ये स्थापित करू शकता. काही IDE मध्ये आधीच पांडा स्थापित आहेत.
जर तुम्ही IDE आवृत्ती वापरत असाल जी आधीपासून स्थापित केलेल्या पांडांसह येत नसेल, तर खात्री बाळगा, तुम्ही ती थेट पायथनमध्ये स्थापित करू शकता.
जर तुम्ही ज्युपिटर नोटबुक वापरत असाल, तर तुम्ही pip कमांडने थेट Pandas इन्स्टॉल करू शकता. बहुतेक, जेव्हा तुम्ही अॅनाकोंडासह ज्युपिटर स्थापित केले असेल, तेव्हा थेट वापरासाठी पांडा आधीच उपलब्ध असण्याची उच्च शक्यता असते.
जर तुम्ही पांडांना कॉल करू शकत नसाल, तर तुम्ही त्यांना थेट इंस्टॉल करण्यासाठी वरील कमांड वापरू शकता.
पायथनसह एक्सेल फाइल्समध्ये सामील होत आहे
प्रथम, तुम्हाला तुमच्या पसंतीच्या ठिकाणी सर्व एक्सेल फाइल्ससह एक फोल्डर तयार करणे आवश्यक आहे. फोल्डर तयार झाल्यावर, तुम्ही लायब्ररी आयात करण्यासाठी कोड लिहिणे सुरू करू शकता.
एकदा तुम्ही लायब्ररी आयात केल्यावर, इनपुट आणि आउटपुट फाइल पथ संचयित करण्यासाठी दोन व्हेरिएबल्स तयार करा. फाइल फोल्डरमध्ये प्रवेश करण्यासाठी इनपुट फाइल पथ आवश्यक आहे. आउटपुट फाइल पथ आवश्यक आहे कारण एकत्रित फाइल तेथे निर्यात केली जाईल.
पूर्ण पथ करण्यासाठी / शेवटी देखील जोडा.
फोल्डरमधील फायली सूचीमध्ये उपलब्ध आहेत. OS लायब्ररीतील listdir फंक्शन वापरून इनपुट फोल्डरमधील सर्व फाइल संदर्भ संचयित करण्यासाठी एक सूची तयार करा.
लायब्ररीमध्ये उपलब्ध फंक्शन्सबद्दल तुम्हाला खात्री नसल्यास, तुम्ही लायब्ररीच्या नावासह dir फंक्शन वापरू शकता. उदाहरणार्थ, listdir फंक्शनची अचूक आवृत्ती तपासण्यासाठी, तुम्ही खालीलप्रमाणे कमांड वापरू शकता.
आउटपुटमध्ये OS लायब्ररीमध्ये उपलब्ध असलेल्या सर्व संबंधित फंक्शन्सचा समावेश असेल. ListDir फंक्शन हे या लायब्ररीमध्ये उपलब्ध असलेल्या अनेक फंक्शन्सपैकी एक आहे.
फोल्डरमध्ये साठवलेल्या फाइल्सची नावे पाहण्यासाठी हे व्हेरिएबल प्रिंट करा. एकदा तुम्ही प्रिंट फंक्शन वापरल्यानंतर फोल्डरमध्ये साठवलेल्या सर्व फाईल्स प्रदर्शित होतात.
पुढे, प्रत्येक एक्सेल फाइल संचयित करण्यासाठी तुम्हाला नवीन डेटा फ्रेम जोडण्याची आवश्यकता आहे. डेटा संग्रहित करण्यासाठी कंटेनर म्हणून डेटा फ्रेमची कल्पना करा. डेटा फ्रेम तयार करण्याचा क्रम येथे आहे.
या फोल्डरमधून प्रत्येक फाइल उघडण्यासाठी, तुम्हाला लूप चालवावा लागेल. वर तयार केलेल्या सूचीतील प्रत्येक फाइलसाठी लूप चालेल.
पुढे, फाइल्सचा विस्तार तपासणे आवश्यक आहे कारण कोड केवळ XLSX फायली उघडेल. या फाइल्स तपासण्यासाठी तुम्ही if स्टेटमेंट वापरू शकता.
शेवटी, आता एकत्रित डेटा फ्रेम तयार आहे, तुम्ही ते आउटपुट स्थानावर निर्यात करू शकता. या प्रकरणात, तुम्ही डेटा फ्रेम XLSX फाइलमध्ये निर्यात करत आहात.
एकाधिक एक्सेल वर्कबुक एकत्र करण्यासाठी पायथन वापरणे
Python’s Pandas हे नवशिक्यांसाठी आणि प्रगत वापरकर्त्यांसाठी एक उत्कृष्ट साधन आहे. पायथनवर प्रभुत्व मिळवू इच्छिणाऱ्या विकसकांद्वारे लायब्ररीचा मोठ्या प्रमाणावर वापर केला जातो.
जरी तुम्ही नवशिक्या असाल तरीही, तुम्हाला पांडाचे बारकावे आणि पायथनमधील लायब्ररी कशी वापरायची हे शिकून खूप फायदा होऊ शकतो.