python - Accessing nested JSON data as dataframes in Pandas -
मेरे पास निम्न डेटा है
{"results": [{"company": "एबीसी", "बनाया गया": "2014-03-27 टी 23: 21: 48.758 जेड", "ईमेल": "abc@gmail.com", "प्रथमनाम": "एबीसी", "अंतिम नाम": "एक्सवाईज़", " "", "स्थान": "", "प्रोफ़ाइल चित्र": {"__प्रकार": "फ़ाइल", "नाम": "ab0e-profilePicture", "url": "url.url.com"}, " पंजीकरण गेट: "सामान्य", "टेलीफोन": "", "शीर्षक": "एए", "अपडेटअट": "2014-03-27 टी 23: 24: 20.220 जेड", "उपयोगकर्ता नाम": "abc@gmail.com" , "ज़िपकोड": "00000"}]} मैं निम्नलिखित कोड का उपयोग करके जेएसएन डेटा आयात करता हूं
आयात करें json आयात पंडों को pandas आयात से पीडी के रूप में डेटाफ्रेम json_data = pd.read_json ('data.json') प्रिंट json_data [: 2] यह प्रिंट करता है
परिणाम 0 {u'linkedinAccount ': यू '', यू 'यूजर नाम': यू'बैक ... 1 {यू'लिंक्डिन एकाउंट ': यू'जक्ससीएफसीएनवी', यू 'यूज ... [2 पंक्तियां x 1 कॉलम] <पी > जब मैं प्रिंट डीएफ ['लिंकिनएक्काउंट'] का उपयोग करके एक कॉलम प्रिंट करने का प्रयास करता हूं < / Pre> मुझे निम्न त्रुटि मिलती है
keyError: u'no आइटम linkedinAccount ' मैं dataframes में डेटा का उपयोग कैसे कर सकता हूं कॉलम के नामों पर?
सुनिश्चित करें कि आपके कोड में कितने अवलोकन शामिल हैं json । लेकिन यह स्पष्ट है कि समस्या क्या है, आप "प्रोफ़ाइल चित्र" फ़ील्ड के लिए नेस्टेड संरचना कर रहे हैं। इसलिए प्रत्येक अवलोकन ने नेस्टेड शब्दकोश के रूप में व्यक्त किया है आपको प्रत्येक अवलोकन को डेटाफ्रेम और concat में इस समाधान के रूप में अंतिम dataframe में परिवर्तित करने की आवश्यकता है। < कोड> में [3]: प्रिंट डीएफ परिणाम 0 {u'linkedinAccount ': u' ', u'username': u'abc @ g ... 1 {u'linkedinAccount ': u' ', u'username': U'abc @ g ... [2 पंक्तियों x 1 कॉलम] में [4]: print pd.concat ([pd.DataFrame.from_dict (आइटम, ओरिएंट = 'इंडेक्स')। Df.results में आइटम के लिए टी]) LinkedinAccount उपयोगकर्ता नाम पंजीकरण गेट प्रथम नाम शीर्षक अंतिम नाम \ abc@gmail.com सामान्य एबीए एई xyz 0 abc@gmail.com सामान्य एबीए एई xyz कंपनी टेलीफ़ोन प्रोफाइलचित्र \ 0 XYZ {u'url ': u'url.url.com', ' __ टाइप ': यू'फाइल', यू ... 0 एबीसी (u'url ': u'url.url.com', यू '__ टाइप': यू'फाइल ', यू ... स्थान अपडेट किया गया ईमेल पर निर्मित किया गया था \ 0 2014 -03-27 टी 23: 24: 20.220Z एबीसी@gmail.com 2014-03-27 टी 23: 21: 48.758 जे 0 2014-03-27 टी 23: 24: 20.220 एजे एबीसी @ जीमेल डॉट कॉम 2014-03-27 टी 23: 21: 48.758 जेड ज़िप कोड 0 00000 0 00000 [2 पंक्तियां x 14 कॉलम] तब आप सोच सकते हैं कि कैसे से निपटने के लिए प्रोफ़ाइल Ture स्तंभ लिंक में सुझाए गए @ यू 2 ई एफ 1 का आप क्या कर सकते हैं लेकिन शायद मैं उस कॉलम को तीन कॉलम pfPIC_url , pfPIC_type , pfPIC_name ) में तोड़ दूंगा
Comments
Post a Comment