Ein Leitfaden für das härteste Data Science-Turnier der Welt

Blog

Ein Leitfaden für das härteste Data Science-Turnier der Welt

Gib mir einfach den Code:

Stell sicher dass du hast angemeldet An numer.ai da Sie Ihre API-Schlüssel einrichten müssen, um Einreichungen direkt aus Colab zu machen.

Das Numerai-Turnierproblem

Die Sie werden nummerieren Data Science Problem ist wie ein typisches beaufsichtigt Machine-Learning-Problem, bei dem die Daten mehrere Eingaben haben Merkmale und entsprechend Etiketten (oder Ziele ). Und unser Ziel ist es, mit verschiedenen Techniken eine Zuordnung von Eingabe zu Zielen zu lernen. Normalerweise teilen wir Daten in Ausbildung und Validierung Teile. und die meiste Zeit wird für die Bereinigung der Daten verwendet.

Bild für Beitrag

Bild für Beitrag

Links: Beispiel für Trainingsdaten. Rechts: Mustereinreichung

Numerai-Daten sind jedoch anders. Es ist ein Problem, den Aktienmarkt vorherzusagen, aber was es einzigartig macht, ist, dass die Daten ** verschleiert ** sind und es bereits sind gereinigt ! Wir wissen nicht, welche Zeile welcher Aktie entspricht. Darüber hinaus ist jede Zeile gruppiert in Alter die verschiedene Zeitpunkte darstellen, aber solange es eine Struktur hat, können wir sicherlich versuchen, Muster daraus zu lernen und abzubilden.

Numerai gibt diese bereinigten Daten an Datenwissenschaftler und fordert sie auf, bessere Schätzungen für die Daten bereitzustellen. Diese Crowdsourcing Vorhersagen werden verwendet, um ein Metamodell zu erstellen und in reale Aktienmärkte auf der ganzen Welt zu investieren. Die Anreize basieren auf der Qualität Ihrer Vorhersagen und der Höhe Ihrer NMR gesteckt. Sie verdienen einen Prozentsatz Ihres Einsatzes, wenn Ihre Vorhersagen dazu beitragen, einen Gewinn zu erzielen, andernfalls wird Ihr Einsatz verbrannt. Dieses Earn/Burn-System motiviert immer wieder zu besseren und einzigartigen Vorhersagen. Je genauer und/oder eindeutiger die Vorhersagen sind, desto höher sind die Renditen. Das macht es interessant und komplex (härtestes Data-Science-Problem).

Gehen wir dieses Problem an Google Colab . Eine End-to-End-Komplettlösung mit einer einfachen, aber sehr guten Technik – CatBoost . Ich werde die Colab-Snippets hier erklären. Es wäre wirklich hilfreich, wenn Sie das öffnen Notizbuch Link in einem neuen Tab parallel dazu

#Datenwissenschaft #Künstliche-Intelligenz #Kryptowährung #Maschinelles Lernen #Börse

zudatascience.com

Ein Leitfaden für das härteste Data Science-Turnier der Welt

Data Science zum Spaß? für Krypto? Warum nicht beide? Stellen Sie sicher, dass Sie sich auf numer.ai registriert haben, da Sie Ihre API-Schlüssel einrichten müssen, um Einreichungen direkt aus Colab zu machen.