Python Pandas: Doppelte Zeilen in DataFrame finden

Blog

Pandas.DataFrame.duplicated() ist eine eingebaute Funktion, die doppelte Zeilen basierend auf allen Spalten oder einigen bestimmten Spalten findet. Die Funktion pandas.duplicated() gibt eine Boolesche Reihe mit Wahr Wert für jede duplizierte Zeile. Wenn Sie doppelte Zeilen in einem DataFrame basierend auf allen oder ausgewählten Spalten finden möchten, verwenden Sie die Funktion pandas.dataframe.duplicated().



Python Pandas: Doppelte Zeilen in DataFrame finden

In Data Science erhalten Sie manchmal einen unordentlichen Datensatz. Möglicherweise müssen Sie sich beispielsweise mit Duplikaten auseinandersetzen, was Ihre Analyse verzerrt.

Syntax

Die Syntax der Funktion pandas.dataframe.duplicated() ist wie folgt.



DataFrame.duplicated(subset=None, keep='first')

#python #pandas

appdividend.com

Python Pandas: Doppelte Zeilen in DataFrame finden

Python Pandas.DataFrame.duplicated() ist eine integrierte Funktion, die doppelte Zeilen basierend auf allen Spalten oder einigen bestimmten Spalten findet.