So führen Sie SQL-Abfragen von einem Jupyter Notebook aus

Blog

So führen Sie SQL-Abfragen von einem Jupyter Notebook aus

Wenn Sie im Bereich Data Science arbeiten, verwenden Sie wahrscheinlich SQL, um die Daten zu extrahieren und vorzuverarbeiten. Ich habe JetBrains verwendet DataGrip als mein Haupt-SQL-Editor für eine Weile. Während DataGrip einen anständigen Job macht, bietet es keine Möglichkeit, die Daten zu visualisieren. Gibt es einen besseren Weg?



Falls Sie meine anderen Beiträge zu diesem Thema verpasst haben:

Goldman Sachs Bitcoin-Vorhersage
- 5 mistakes when writing SQL queries - Are you still using JupyterLab? - JupyterLab 2.0 - 3 Must-have JupyterLab 2.0 extensions

Bild für Beitrag



Gif von Giphy

Was ist zu tun, wenn die Abfrageergebnisse zu groß sind, um in einer einzelnen Abfrage verarbeitet zu werden? Eine Lösung besteht darin, die Abfrage in kleineren Zeitintervallen auszuführen – anstelle eines ganzen Jahres können Sie die Abfrage nach Monaten ausführen.



Das Ausführen einer Abfrage nach Monaten erfordert 12 Abfrageläufe für ein Jahr, was von Hand nicht machbar ist – for-Schleifen sind hier praktisch.

wie kaufe ich hedera hashgraph

Es ist immer gut, mehrere Tools zur Verfügung zu haben

Bei solchen Problemen habe ich verwendet SQLAlchemie um eine Verbindung zur Datenbank herzustellen und die Daten in einen Pandas DataFrame zu extrahieren, wie im folgenden Beispiel:

import sqlalchemy import pandas engine = sqlalchemy.create_engine( sqlalchemy.engine.url.URL( drivername='postgresql', username='username', password='password', host='host', port='port', database='database', ), echo_pool=True, ) print('connecting with engine ' + str(engine)) connection = engine.connect() query = 'select * from table' df = pd.read_sql_query(query, connection)

Wie Sie oben sehen können, wird die SQL-Abfrage in einen String geschrieben. Selbst wenn Sie die Abfragezeichenfolge in eine separate Zelle in einem Jupyter-Notebook einfügen und SQL-Code formatiert installiert haben, wird die Abfrage nicht formatiert, da es sich immer noch um eine Python-Zeichenfolge handelt.

Gibt es einen besseren Weg?

#database #data-science #sql #jupyter-notebook #data-visualization

zudatascience.com

So führen Sie SQL-Abfragen von einem Jupyter Notebook aus

SQL-IDEs sind nicht in der Lage, die Daten zu visualisieren. Wussten Sie, dass Sie mit Jupyter Notebooks die Ergebnisse einer Abfrage ausführen und visualisieren können? Wenn Sie im Bereich Data Science arbeiten, verwenden Sie wahrscheinlich SQL, um die Daten zu extrahieren und vorzuverarbeiten.

bep20-Token kostenlos erstellen