Wenn Sie im Bereich Data Science arbeiten, verwenden Sie wahrscheinlich SQL, um die Daten zu extrahieren und vorzuverarbeiten. Ich habe JetBrains verwendet DataGrip als mein Haupt-SQL-Editor für eine Weile. Während DataGrip einen anständigen Job macht, bietet es keine Möglichkeit, die Daten zu visualisieren. Gibt es einen besseren Weg?
Falls Sie meine anderen Beiträge zu diesem Thema verpasst haben:
Goldman Sachs Bitcoin-Vorhersage
- 5 mistakes when writing SQL queries - Are you still using JupyterLab? - JupyterLab 2.0 - 3 Must-have JupyterLab 2.0 extensions
Gif von Giphy
Was ist zu tun, wenn die Abfrageergebnisse zu groß sind, um in einer einzelnen Abfrage verarbeitet zu werden? Eine Lösung besteht darin, die Abfrage in kleineren Zeitintervallen auszuführen – anstelle eines ganzen Jahres können Sie die Abfrage nach Monaten ausführen.
Das Ausführen einer Abfrage nach Monaten erfordert 12 Abfrageläufe für ein Jahr, was von Hand nicht machbar ist – for-Schleifen sind hier praktisch.
wie kaufe ich hedera hashgraph
Es ist immer gut, mehrere Tools zur Verfügung zu haben
Bei solchen Problemen habe ich verwendet SQLAlchemie um eine Verbindung zur Datenbank herzustellen und die Daten in einen Pandas DataFrame zu extrahieren, wie im folgenden Beispiel:
import sqlalchemy import pandas engine = sqlalchemy.create_engine( sqlalchemy.engine.url.URL( drivername='postgresql', username='username', password='password', host='host', port='port', database='database', ), echo_pool=True, ) print('connecting with engine ' + str(engine)) connection = engine.connect() query = 'select * from table' df = pd.read_sql_query(query, connection)
Wie Sie oben sehen können, wird die SQL-Abfrage in einen String geschrieben. Selbst wenn Sie die Abfragezeichenfolge in eine separate Zelle in einem Jupyter-Notebook einfügen und SQL-Code formatiert installiert haben, wird die Abfrage nicht formatiert, da es sich immer noch um eine Python-Zeichenfolge handelt.
Gibt es einen besseren Weg?
#database #data-science #sql #jupyter-notebook #data-visualization
zudatascience.com
So führen Sie SQL-Abfragen von einem Jupyter Notebook aus
SQL-IDEs sind nicht in der Lage, die Daten zu visualisieren. Wussten Sie, dass Sie mit Jupyter Notebooks die Ergebnisse einer Abfrage ausführen und visualisieren können? Wenn Sie im Bereich Data Science arbeiten, verwenden Sie wahrscheinlich SQL, um die Daten zu extrahieren und vorzuverarbeiten.
bep20-Token kostenlos erstellen