Mit ChatGPT Daten analysieren (Data Analysis)

Mit ChatGPT und der richtigen Wahl der Optionen bzw. Sprachmodelle hast du die Möglichkeit, Daten zu analysieren oder Programmcode zu schreiben und prüfen zu lassen.

Was du alles mit ChatGPTs Data Analysis machen kannst, erfährst du in diesem Artikel. Sei gespannt, denn es ist eine Funktion, die ChatGPT deutlich aufwertet und die Nutzung um viele Dinge erweitert.

(Letzte Aktualisierung: 27.02.25)
Foto

Inhaltsverzeichnis

Voreinstellungen | Berechnungen | Datenanalyse | Fotos ändern | Programmieren | Arten von Dateien | Wissenswertes | Fazit | Kommentare



Wie funktioniert die Datenanalyse von ChatGPT?


Wenn du eine Datei in ChatGPT hochlädst und den Inhalt analysieren lassen willst, passiert eine Menge im Hintergrund, damit alles richtig verarbeitet werden kann.

Zuerst wird die Datei hochgeladen und ausgelesen. Das bedeutet, dass ChatGPT den Text erkennt und alles Wichtige in eine Form bringt, die es verarbeiten kann. Dann wird der Text in kleine Teile zerlegt, sogenannte Tokens. Diese helfen der KI, den Inhalt Stück für Stück zu verstehen.

Im nächsten Schritt schaut ChatGPT, wie die Wörter zusammenhängen. Das funktioniert mit speziellen Rechenmodellen, die darauf trainiert sind, Muster und Bedeutungen zu erkennen. So kann ChatGPT den Text nicht nur lesen, sondern auch verstehen.

Jetzt kommt die eigentliche Analyse: ChatGPT nutzt sein Wissen, um den Inhalt zu verarbeiten. Es kann Fragen dazu beantworten, Zusammenfassungen erstellen oder nach bestimmten Informationen suchen. Das alles geschieht schnell und basiert auf dem Wissen, das ChatGPT bereits gelernt hat.

Am Ende erhältst du eine Antwort in verständlicher Sprache. Ob Zusammenfassung, Tabelle oder direkte Erklärung - ChatGPT bereitet die Ergebnisse entsprechend auf.

Zu umständlich formuliert? Macht nichts, ein Bild sagt mehr, als diese Worte 😀.

Schaubild ChatGPT Data Analysis

Schaubild Funktionsweise Data Analysis (vereinfacht)


So nutzt du die Datenanalyse (Data Analysis)


Wie bereits erwähnt, entscheidet ChatGPT anhand Deines Prompts, ob die Datenanalyse verwendet wird. Du kannst sie aber auch direkt unter den GPTs auswählen.

Screenshot GPT Data Analysis

Klicke dazu auf der linken Seite auf Explore oder GPTs erkunden und suche dann auf der rechten Seite nach OpenAI GPTs. Wenn du es gefunden hast, wähle den Punkt Data Analysis. Eventuell musst du ein wenig nach unten scrollen. Das ist alles. Dein ChatGPT-Fenster öffnet sich und du kannst mit der Datenanalyse beginnen.

Wenn du mehr über die GPTs erfahren möchtest, schau dir den Beitrag ➥ OpenAI GPTs: erstellen und personalisieren an.

Seit dem Erscheinen des Sprachmodells GPT-o3 gibt es jedoch einen besseren Weg. Wähle dazu dieses Sprachmodell aus und starte deine Analyse. Mehr über GPT-o3 erfährst du in meinem Artikel: GPT-o3: Einsatzmöglichkeiten für die neue KI. Es gibt einige Vorteile, aber auch den Nachteil, dass die Antwort mit GPT-o3 länger dauert. Außerdem ist die Nutzung dieses Sprachmodells stärker limitiert.


Mit ChatGPT Daten analysieren (Data Analysis)


ChatGPT verwendet für die Datenanalyse die Programmiersprache Python. Du kennst Python nicht? Kein Problem, denn ChatGPT übersetzt deine Befehle in diese Programmiersprache. Neben der Verwendung von Python kommen auch sogenannte Bibliotheken zum Einsatz. Diese ermöglichen zum Beispiel die Ausgabe von Grafiken. Aber schauen wir uns die Möglichkeiten der ChatGPT-Datenanalyse einmal genauer an.

Noch ein Tipp: Lasse dir die Einsatzmöglichkeiten von ChatGPT anzeigen. Gib folgenden Text bei ChatGPT ein: „Was kann ich mit der Data Analysis von ChatGPT machen? Bitte zu jedem Punkt eine kurze Erklärung.

Berechnungen durchführen

Du kannst jetzt mathematische Berechnungen durchführen, die von einfachen Rechenaufgaben bis hin zu komplexen statistischen Berechnungen reichen. Wenn es komplizierter wird, werden wissenschaftlichen Bibliotheken verwendet. Du erinnerst dich? Bisher konnte ChatGPT nur so tun, als könne die „sprachbasierte KI“ rechnen. Jetzt funktionieren auch Berechnungen.

Beispiel einer Berechnung: Nehmen wir an, du möchtest 5.000 Euro mit einem Zinssatz von 2,8% für 5 Jahre anlegen. Was bekommst du nach 5 Jahren ausgezahlt?

Hier meine Frage an ChatGPT: Berechne eine Geldanlage. Anlagebetrag: 5000 Euro. Zinssatz 2,8 Prozent jährlich. Wie hoch ist die Auszahlung nach 5 Jahren?

Antwort ChatGPT

ChatGPT rechnet nicht nur, sondern zeigt uns die Formel zur Berechnung an und den Lösungsweg. Du kannst dir das anschauen, indem du das graue Kästchen „Finished working“ aufklappst.

Data Analysis Berechnung

Zur Sicherheit habe ich das noch einmal in Excel nachgerechnet. Und es stimmt 👍.


Datenanalysen

Links neben der Texteingabe ist ein Klammersymbol. Dort kannst du Dateien hochladen. Für die Datenanalyse nehmen wir eine Exceldatei.

In meinem Beispiel nehme ich eine Microsoft-Vorlage mit Umsatz, Produkten, Kunden und Quartalen. Diese muss zuerst in eine CSV-Datei konvertiert werden. Wenn du magst und sichergehen willst, solltest du vorher prüfen, ob die Formatierungen stimmen. Sind die Spalten richtig formatiert? Also Werte als Zahl usw. Das Trennzeichen sollte ein Komma sein. Und die Exportdatei im UTF-8 Format.

Schritt 1, Analyse der Datei:
Die Analyse ist recht einfach, zumindest für dich. Lade die Datei hoch und schreibe: Analysiere die Datei. ChatGPT beginnt zu arbeiten. Das ist wichtig, damit ChatGPT Unklarheiten erkennt und entsprechend umwandelt. In meinem Fall war der Umsatz beispielsweise eine Zeichenkette mit dem Euro-Symbol. ChatGPT hat dieses erkannt und die CSV-Datei intern verändert. Abhängig von den Formaten in der Datei können mehrere automatisierte Durchläufe stattfinden.

Data Analysis

Data Analysis

Schritt 2, Testfrage und Nachrechnen: Diesen Schritt musst du nicht machen, aber ich fühle mich sicherer, dass die Datei richtig analysiert wurde. In diesem Beispiel stelle ich die Frage, wie hoch der Gesamtumsatz eines bestimmten Produktes ist. Das lässt sich in Excel leicht nachrechnen. Wenn das stimmt, kommen wir nun zu den komplexeren Analysen.

Schritt 3, Datenanalyse: In meinem Beispiel möchte ich die Gesamtumsätze aller Produkte nach Quartal geordnet sehen. Hier das Ergebnis.

Data Analysis

Wie du siehst, hat ChatGPT nur die ersten Top 6 angezeigt. Ich musste noch nachbessern, um alle Produkte zu sehen.

Schritt 4, Visualisieren: Du kannst die Daten auch visualisieren und dir ein Diagramm erstellen lassen. Ich habe folgenden Prompt genutzt: Erstelle ein Balkendiagramm. Umsatz pro Kunde und Quartal. Nimm die Top 6 Kunden.

Data Analysis

Data Analysis Balkendiagramm.

Natürlich gehen auch komplexere Diagramme. Der Fantasie sind keine Grenzen gesetzt. Oder fast keine.

Tipp: Falls die Achsen vertauscht sind, kannst du schreiben: Tausche die X-Achse.
Du kannst einzelnen Werte auch Farben zuweisen oder andere Formatierungen wählen. Einfach als normalen Text eingeben und ChatGPT und die Data Analysis setzen es dann um.


Programmiercode generieren und prüfen

Wie bereits in dem Abschnitt zur Datenanalyse erwähnt, kannst du den Python Code anschauen und kopieren. Es funktioniert aber auch mit anderen Programmiersprachen. Ich habe einmal eine PHP-Funktion für eine Website genommen. Folgende Optionen hast du:

Den Code überprüfen: Lade die Code-Datei hoch und schreibe, dass ChatGPT den Code prüfen soll. In meinem Fall habe ich einen Fehler eingebaut, um zu schauen, ob ChatGPT das erkennt. Und in der Tat, der Fehler wurde gefunden und noch einige Dinge darüber hinaus.

ChatGPT Data Analysis Fehlermeldung

Ergebnis Codeprüfung.

Den Code optimieren: Sag ChatGPT, dass du deinen Code optimiert haben willst. Versuch du es mit deinem Code einmal. Du wirst überrascht sein. Was soll ich sagen, ich habe den optimierten Code übernommen, er war einfach besser.

Code-Erweiterung: Du kannst neue Funktionen oder Fähigkeiten dem Code hinzufügen lassen. In meinem Fall hat auch das anstandslos funktioniert.

Dokumentation: ChatGPT kann auch eine Dokumentation für deinen Code schreiben. Und so sieht das Ganze dann aus (gekürzt).

Code Interpreter Dokumentation Source Code

Ich muss sagen, die Ergebnisse haben mich positiv überrascht. Du kannst nicht nur den Code überprüfen, nein, auch verbessern und erweitern. Außerdem brauchst du die lästige Dokumentation nicht allein zu machen. Insgesamt gewinnst du Qualität und sparst eine Menge Zeit. Ob das auch mit komplexem Code funktioniert, kann ich nicht sagen. Für meine Zwecke reicht es und ich bin begeistert. Ab sofort lasse ich meinen Code immer durch ChatGPT prüfen und hole mir Verbesserungsvorschläge ein.


Welche Arten von Dateien kann ich hochladen?


Ich habe keine Dokumentation darüber gefunden, welche Dateiarten du bei der Data Analysis mit ChatGPT hochladen kannst. Aber ich habe einige ausprobiert:

PDF-Dateien: Bei PDF-Dateien kann es zu Schwierigkeiten kommen. Du erhältst beispielsweise die Meldung, dass PDF-Dateien nicht verarbeitet werden können, oder der extrahierte Text ist zerstückelt und die Leerzeichen fehlen. Schreibe ChatGPT, dass die Bibliothek PDFMiner verwendet werden soll. Damit habe ich gute Erfahrungen gemacht und du erhältst deinen Text.

Textdateien: Einfache Textdateien können hochgeladen und von der Data Analysis verarbeitet werden. Weiter oben habe ich die Datenanalyse ja mit CSV-Dateien durchgeführt. Es gibt aber noch andere Möglichkeiten. Du kannst zum Beispiel eine Textanalyse erstellen. Ich habe mir von einem Artikel über Ausflugsziele anzeigen lassen, welche Wörter wie oft im Text vorkommen. Das Ergebnis sieht dann so aus:

Data Analysis Textanalyse

Data Analysis Textanalyse.

Bilddateien verändern: Mit Hilfe der Data Analysis von ChatGPT ist es möglich, Bilder und Fotos zu bearbeiten. Ich habe ein KI-Bild in einen Cartoon-Stil verändern lassen. Die Schritte, die durchlaufen wurden, sind schon erstaunlich und würden mit einem Fotobearbeitungsprogramm etwas schwieriger werden. ChatGPT schreibt zu den Schritten folgendes:

ChatGPT Antwort Cartoon Style

Und hier nun das Ergebnis. Es ist beeindruckend, finde ich.

Data Analysis Bild ändern

Links KI erzeugtes Bild. Rechts, mit Data Analysis geänderte Bild

Python Quellcode: Wenn Data Analysis verwendet wird, kannst du den entsprechenden Abschnitt aufklappen und den Quellcode sehen. Falls du sensible Daten bearbeiten möchtest, solltest du dies nicht innerhalb von ChatGPT tun. Du kannst dir aber den Quellcode erstellen lassen und dann lokal mit deinen echten Daten weiterarbeiten. Dazu benötigst du allerdings eine entsprechende Programmierumgebung.

Datenbankdatei SQLite: Falls du eine Datenbank in dem SQLite Format hast, kannst du diese auch hochladen und Datenanalysen durchführen. Ein anderes Datenbankformat wird meines Wissens nach nicht unterstützt.


Wissenswertes über die Datenanalyse von ChatGPT


Es gibt einige Dinge, die du bei der Nutzung beachten solltest:

Hochgeladene Dateien sind nur einen begrenzten Zeitraum vorhanden. Wenn du nach einiger Zeit mit dem Chat weitermachen möchtest und vorher Dateien hochgeladen hattest, bekommst du häufig folgende Meldung:

Code Interpreter Meldung

Übersetzt heißt das: Dieser Codeinterpreter-Chat hat eine Zeitüberschreitung. Du kannst die Konversation fortsetzen, aber frühere Dateien, Links und Codeblöcke funktionieren möglicherweise nicht wie erwartet.

Und diese Meldung stimmt. Häufig bekommst du eine Fehlermeldung, wenn du weiter arbeiten willst.

Zeitbegrenzung: Code-Ausführungen haben eine maximale Zeitbegrenzung. Wenn eine Code-Ausführung diese Grenze überschreitet, wird sie abgebrochen und ein Timeout-Fehler wird zurückgegeben.

Begrenzte Ressourcen: Es gibt, wie bei vielen Dingen, begrenzte Rechen- und Speicherressourcen. Extrem rechen- oder speicherintensive Aufgaben können zu Fehlern führen.

Python-Bibliotheken: Es stehen viele gängige Python-Bibliotheken zur Verfügung, aber nicht alle. Es kann sein, dass eine spezielle Bibliothek, die du benötigst, nicht zur Verfügung steht. Eine Installation dieser fehlenden Bibliotheken ist nicht möglich.

Sicherheit: Aus Sicherheitsgründen sind einige Funktionen, die als potenziell unsicher gelten, eingeschränkt oder deaktiviert.

Hier findest du die ➥offiziellen Release Notes von OpenAi.


Fazit und Zusammenfassung


Ich finde diese Art der Nutzung sehr interessant und hilfreich. Unter Umständen kannst du damit eine Menge Zeit sparen. Auch wenn du dich mit Excel gut auskennst, gibt es doch komplexere Aufgaben, die man hier schnell erledigen kann.

Nachteil ist allerdings, dass du keine sensiblen Daten verwenden solltest. Wer möchte schon, dass diese dann in den Trainingssätzen von ChatGPT auftauchen. Umgehen kannst du das mit einer lokalen Python-Installation, bei der du dir von ChatGPT den Code generieren lässt. Aber das ist dann doch schon wieder komplizierter und aufwändiger.

Auch die Bildbearbeitung bekommt man mit den entsprechenden Programmen gut oder sogar besser hin. Die Anbieter wie Adobe haben auch bereits KI Funktionen eingebaut. Ich denke dabei an die wirklich eindrucksvolle ➥ generative Füllung bei Photoshop.





Kommentare



Felix

vor 7 Monaten

Können mit der Enterprise Version ggf. auch sensible Daten ausgewertet werden? Diese sollten dann auch nicht als Trainingsdatensätze verwendet werden können, oder?


Burkhard

vor 7 Monaten

Ich habe keine Enterprise-Version. Ich gehe aber davon aus, dass das wie in der normalen Version eingestellt werden kann. Du kannst das in den Einstellungen unter Datenprüfungen ein- oder ausschalten. Wenn du eine Version verwendest, in der es einen Administrator gibt, kann dieser es eventuell für alle im Team ausschalten. Hier noch die offizielle Seite von OpenAI zu diesem Thema: FAQ zu den Datenkontrollen. Danke für deinen Hinweis, da sollte ich den Text in diesem Artikel noch etwas anpassen.