Der einfache Weg, mit CSV, JSON und XML in Python zu arbeiten

Blog

Der einfache Weg, mit CSV, JSON und XML in Python zu arbeiten

Ursprünglich veröffentlicht von George Seif bei zudatascience.com

Pythons überlegene Flexibilität und Benutzerfreundlichkeit machen es zu einer der beliebtesten Programmiersprachen, insbesondere für Data Scientists. Ein großer Teil davon ist, wie einfach es ist, mit großen Datensätzen zu arbeiten.

Jedes Technologieunternehmen baut heute eine Datenstrategie auf. Sie alle haben erkannt, dass ihnen die richtigen Daten: aufschlussreich, sauber und so viel wie möglich einen entscheidenden Wettbewerbsvorteil verschaffen. Daten können, wenn sie effektiv genutzt werden, tiefe Einblicke unter die Oberfläche bieten, die nirgendwo anders entdeckt werden können.

Im Laufe der Jahre ist die Liste der möglichen Formate, in denen Sie Ihre Daten speichern können, erheblich gewachsen. Es gibt jedoch 3, die in ihrer täglichen Verwendung dominieren: CSV, JSON und XML. In diesem Artikel werde ich Ihnen die einfachsten Möglichkeiten vorstellen, mit diesen 3 beliebten Datenformaten in Python zu arbeiten!

CSV-Daten

Eine CSV-Datei ist die gebräuchlichste Methode zum Speichern Ihrer Daten. Sie werden feststellen, dass die meisten Daten von Kaggle-Wettbewerben auf diese Weise gespeichert werden. Wir können eine CSV-Datei mit der integrierten Python-CSV-Bibliothek sowohl lesen als auch schreiben. Normalerweise lesen wir die Daten in eine Liste von Listen ein.


Visual Studio Code-Theme

Sehen Sie sich den Code unten an. Wenn wir |_+_| . laufen alle unsere CSV-Daten werden zugänglich. Die |_+_| Funktion liest eine einzelne Zeile aus der CSV-Datei; Jedes Mal, wenn Sie es aufrufen, wechselt es in die nächste Zeile. Wir können auch jede Zeile der csv mit einer for-Schleife durchlaufen, wie bei |_+_| . Stellen Sie sicher, dass Sie in jeder Zeile die gleiche Anzahl von Spalten haben, da sonst wahrscheinlich einige Fehler auftreten, wenn Sie mit Ihrer Listenliste arbeiten

csv.reader()

Das Schreiben in CSV in Python ist genauso einfach. Richten Sie Ihre Feldnamen in einer einzigen Liste und Ihre Daten in einer Liste von Listen ein. Dieses Mal erstellen wir ein |_+_| -Objekt und verwenden Sie es, um unsere Daten ähnlich wie beim Lesen in eine Datei zu schreiben.

csvreader.next()

Natürlich erleichtert die Installation der wunderbaren Pandas-Bibliothek die Arbeit mit Ihren Daten, sobald Sie sie in eine Variable eingelesen haben. Das Lesen von CSV ist eine einzelne Zeile, ebenso wie das Zurückschreiben in eine Datei!

for row in csvreader

Wir können Pandas sogar verwenden, um mit einem kurzen Einzeiler von CSV in eine Liste von Wörterbüchern zu konvertieren. Sobald Sie die Daten als Wörterbücher formatiert haben, verwenden wir die |_+_| Bibliothek, um sie in das XML-Format zu konvertieren. Wir speichern es auch als JSON-Datei!

filename = 'my_data.csv' fields = [] rows = [] # Reading csv file with open(filename, 'r') as csvfile: # Creating a csv reader object csvreader = csv.reader(csvfile) # Extracting field names in the first row fields = csvreader.next() # Extracting each data row one by one for row in csvreader: rows.append(row) # Printing out the first 5 rows for row in rows[:5]: print(row)

JSON-Daten

JSON bietet ein sauberes und leicht lesbares Format, da es eine wörterbuchähnliche Struktur beibehält. Genau wie CSV verfügt Python über ein integriertes Modul für JSON, das das Lesen und Schreiben super einfach macht! Wenn wir die CSV-Datei einlesen, wird sie zu einem Wörterbuch. Dann schreiben wir dieses Wörterbuch in eine Datei.

writer()

Und wie wir bereits gesehen haben, können Sie, sobald wir unsere Daten haben, einfach über Pandas in CSV konvertieren oder das integrierte Python-CSV-Modul verwenden. Beim Konvertieren in XML wird das |_+_| Bibliothek ist immer unser Freund.

# Field names fields = ['Name', 'Goals', 'Assists', 'Shots'] # Rows of data in the csv file rows = [ ['Emily', '12', '18', '112'], ['Katie', '8', '24', '96'], ['John', '16', '9', '101'], ['Mike', '3', '14', '82']] filename = 'soccer.csv' # Writing to csv file with open(filename, 'w+') as csvfile: # Creating a csv writer object csvwriter = csv.writer(csvfile) # Writing the fields csvwriter.writerow(fields) # Writing the data rows csvwriter.writerows(rows)

XML-Daten

XML ist ein bisschen anders als CSV und JSON. Im Allgemeinen werden CSV und JSON aufgrund ihrer Einfachheit häufig verwendet. Sie sind sowohl einfach als auch schnell als Mensch zu lesen, zu schreiben und zu interpretieren. Es ist keine zusätzliche Arbeit erforderlich und das Parsen von JSON oder CSV ist sehr einfach.


So überweisen Sie Geld von Coinbase zu Paypal

XML hingegen ist tendenziell etwas schwerer. Sie senden mehr Daten, was bedeutet, dass Sie mehr Bandbreite, mehr Speicherplatz und mehr Laufzeit benötigen. XML bietet jedoch gegenüber JSON und CSV einige zusätzliche Funktionen: Sie können Namespaces verwenden, um Standardstrukturen zu erstellen und zu teilen, eine bessere Darstellung für die Vererbung und eine branchenstandardisierte Art der Darstellung Ihrer Daten mit XML-Schema, DTD usw.

Zum Einlesen der XML-Daten verwenden wir das in Python integrierte XML-Modul mit dem Untermodul ElementTree. Von dort aus können wir das ElementTree-Objekt mithilfe der |_+_|-Bibliothek in ein Wörterbuch konvertieren. Sobald wir ein Wörterbuch haben, können wir es in CSV, JSON oder Pandas Dataframe konvertieren, wie wir oben gesehen haben!

filename = 'my_data.csv' # Read in the data data = pd.read_csv(filename) # Print the first 5 rows print(data.head(5)) # Write the data to file data.to_csv('new_data.csv', sep=',', index=False)

Möchten Sie lernen?

Folge mir auf twittern wo ich alles über die neueste und beste KI, Technologie und Wissenschaft poste! Verbinde dich mit mir auf LinkedIn auch!


Literatur-Empfehlungen

Möchten Sie mehr über das Programmieren in Python erfahren? Die Python-Crashkurs book ist die beste Ressource, um zu lernen, wie man in Python programmiert!

Und nur ein Hinweis, ich unterstütze diesen Blog mit Amazon-Partnerlinks zu großartigen Büchern, denn das Teilen großartiger Bücher hilft jedem! Als Amazon-Partner verdiene ich an qualifizierten Käufen.

Was ist ein Livepeer-Token?

-------------------------------------------------- -------------------------------------------------- ----------------------------------

Danke fürs Lesen :heart: Wenn dir dieser Beitrag gefallen hat, teile ihn mit all deinen Programmierfreunden! Folge mir auf Facebook | Twitter

Erfahren Sie mehr

Maschinelles Lernen mit Python, Jupyter, KSQL und TensorFlow

Python und HDFS für maschinelles Lernen

Angewandtes Deep Learning mit PyTorch - Vollständiger Kurs

Tkinter Python-Tutorial | Python GUI-Programmierung mit Tkinter Tutorial | Python-Schulung

Machine Learning A-Z™: Python & R in Data Science zum Anfassen

Python für Data Science und Machine Learning Bootcamp

Data Science, Deep Learning und Machine Learning mit Python

Deep Learning A-Z™: Künstliche neuronale Netze zum Anfassen

Künstliche Intelligenz A-Z™: Erfahren Sie, wie Sie eine KI erstellen

#python #data-science #json

komplexe SQL-Abfragen schreiben

zudatascience.com

Der einfache Weg, mit CSV, JSON und XML in Python zu arbeiten

Ursprünglich veröffentlicht von George Seif bei zudatascience.com