Einleitung
Datenanalyse scheitert selten an fehlenden Tools. Python, R, Excel, Tableau — die Software ist da. Was fehlt, ist meistens die richtige Frage. Ein Analyst sitzt vor einem Datensatz mit 50 Spalten und 100.000 Zeilen, und der erste Instinkt ist: Mittelwerte berechnen, ein paar Diagramme bauen, fertig. Das Ergebnis: eine Zusammenfassung, die niemand überrascht.
ChatGPT-Prompts für die Datenanalyse ersetzen weder Python noch den Analysten. Aber sie helfen bei dem, was die meisten Analysen schwach macht: den richtigen Fragen. Wenn der Prompt nicht "Erstelle ein Dashboard" lautet, sondern "Welche 5 Fragen muss ein CFO zu diesem Datensatz stellen, bevor er eine Investitionsentscheidung trifft?", entsteht eine andere Analyse. Dieser Artikel liefert über 50 Prompts für den gesamten Analyseprozess. Er ist Teil der ChatGPT-Prompts-Sammlung für Investoren, Berater und Analysten.
Was Sie in diesem Guide finden
- 50+ ChatGPT-Prompts für den gesamten Datenanalyse-Workflow: Exploration, Bereinigung, Analyse, Visualisierung, Reporting
- Prompts für Code-Generierung (Python, SQL, Excel) und statistische Analysen
- Business-spezifische Prompts (Kohortenanalyse, Churn, Unit Economics, KPI-Dashboards)
- Strukturierte Bonus-Vorlagen für die komplette Analyse in einem Durchgang
Wann ChatGPT in der Datenanalyse funktioniert und wann nicht
ChatGPT ist kein Analyse-Tool. Es ist ein Strukturierungs-Tool.
Funktioniert:
- Analyse planen: Welche Fragen stellen? Welche Methode passt? Welche Visualisierung für welchen Datentyp?
- Code generieren: Python-Snippets (pandas, matplotlib, seaborn), SQL-Queries, Excel-Formeln
- Ergebnisse interpretieren: Regressions-Outputs, statistische Tests, Korrelationsmatrizen erklären lassen
- Kommunikation: Management Summaries, Storytelling-Strukturen, Präsentationslogik
Funktioniert nicht:
- Daten verarbeiten: ChatGPT hat keinen Zugriff auf Ihre Daten (es sei denn, Sie laden sie in die Code-Interpreter-Funktion)
- Zahlen generieren: Jeder Benchmark, jede "branchentypische" Kennzahl von ChatGPT kann erfunden sein. Halluzinationen entlarven ist Pflicht.
- Komplexe Berechnungen: Statistische Tests, ML-Modelle und Aggregationen gehören in spezialisierte Tools
Tipp: Wie Sie Prompts mit dem nötigen Kontext anreichern, beschreibt der Context Engineering Guide. Für Datenanalyse-Prompts bedeutet das: Datensatz-Beschreibung, Spalten, Datentypen, Analyseziel und Zielgruppe immer mitliefern.
50+ ChatGPT-Prompts für die Datenanalyse
Jeder Prompt ist sofort einsetzbar. Ersetzen Sie die Platzhalter in eckigen Klammern durch Ihre spezifischen Angaben.
Daten-Exploration & Erstanalyse
Prompts für den ersten Blick auf einen neuen Datensatz.
1. "Ich habe einen Datensatz mit [X Zeilen] und folgenden Spalten: [Spalten auflisten]. Das Analyseziel ist [Ziel]. Welche 10 explorativen Analysen sollte ich als Erstes durchführen? Priorisiere nach Erkenntnispotenzial."
2. "Erstelle einen Python-Code (pandas), der für folgenden Datensatz eine vollständige explorative Analyse durchführt: Datentypen, fehlende Werte, Verteilungen, Ausreißer, Korrelationen. Spalten: [auflisten]."
3. "Welche 5 Fragen sollte ein [CFO/CEO/Analyst/Berater] zu einem Datensatz über [Thema] als Erstes stellen? Formuliere die Fragen so, dass sie mit Daten beantwortbar sind."
4. "Erstelle eine Datenqualitäts-Checkliste für einen Datensatz aus [Branche/Quelle]. Prüfpunkte: Vollständigkeit, Konsistenz, Aktualität, Duplikate, Plausibilität. Für jeden Punkt: SQL- oder Python-Query zur Prüfung."
5. "Beschreibe die typische Datenstruktur für [Anwendungsfall: E-Commerce-Transaktionen / SaaS-Subscriptions / Finanz-Reporting / HR-Daten]. Welche Spalten sind Standard? Welche werden oft vergessen?"
6. "Mein Datensatz hat [X%] fehlende Werte in der Spalte [Y]. Welche Imputation-Methode ist für diesen Datentyp [numerisch/kategorial/zeitbasiert] am sinnvollsten? Erstelle Python-Code für die 3 besten Optionen."
Datenbereinigung & Aufbereitung
Prompts für saubere, analysefertige Daten.
7. "Erstelle ein Python-Script zur Datenbereinigung für folgenden Datensatz: [Beschreibung]. Schritte: Duplikate entfernen, fehlende Werte behandeln, Datentypen korrigieren, Ausreißer identifizieren. Kommentiere jeden Schritt."
8. "Welche Ausreißer-Erkennungsmethode eignet sich für [Datentyp/Verteilung]? Vergleiche: IQR-Methode, Z-Score, Isolation Forest. Erstelle Python-Code für jede Methode."
9. "Erstelle eine SQL-Query, die Inkonsistenzen zwischen den Tabellen [A] und [B] identifiziert. Prüfe auf: fehlende Referenzen, widersprüchliche Werte, zeitliche Inkonsistenzen."
10. "Wie standardisiere ich [Datumformate / Währungen / Adressdaten / Kategoriebezeichnungen] in einem Datensatz mit [X] verschiedenen Formaten? Erstelle eine Mapping-Logik und Python-Code."
11. "Erstelle eine ETL-Pipeline (Extract, Transform, Load) für folgenden Use Case: Datenquellen [A, B, C] zusammenführen, bereinigen und in ein analysefertiges Format bringen. Python-Code mit pandas."
12. "Welche Feature-Engineering-Schritte sind für [Anwendungsfall: Churn Prediction / Sales Forecasting / Customer Segmentation] sinnvoll? Erstelle 10 abgeleitete Features mit Begründung und Code."
Deskriptive Analyse & KPIs
Prompts für die Zusammenfassung und Kennzahlen-Berechnung.
13. "Welche KPIs sind für ein [Branche]-Unternehmen mit [Geschäftsmodell: SaaS/E-Commerce/Agentur] am wichtigsten? Erstelle ein KPI-Framework: KPI → Definition → Formel → Benchmark → Datenquelle."
14. "Erstelle eine Kohortenanalyse für [SaaS-Subscriptions / E-Commerce-Käufe / App-Nutzer]. Python-Code (pandas + matplotlib): Kohorte nach [Anmeldemonat], Metrik [Retention / Revenue / Aktivität]."
15. "Berechne die Unit Economics für ein [Geschäftsmodell]-Unternehmen: CAC, LTV, LTV/CAC-Ratio, Payback Period, Contribution Margin. Formel + Python-Code + Interpretation der Ergebnisse."
16. "Erstelle ein [ABC-Analyse / Pareto-Analyse]-Framework für [Kunden / Produkte / Lieferanten]. Python-Code: Sortiere nach [Umsatz/Marge/Volumen], berechne kumulierte Anteile, klassifiziere in A/B/C."
17. "Welche Segmentierung ist für [Kundendatensatz / Produktdatensatz / Transaktionsdatensatz] am sinnvollsten? Vergleiche: RFM-Analyse, K-Means-Clustering, regelbasierte Segmentierung. Erstelle Python-Code für die beste Option."
18. "Erstelle eine Zeitreihen-Zerlegung für [Umsatz / Traffic / Bestellungen] über [Zeitraum]. Python-Code: Trend, Saisonalität, Residuen identifizieren. Welche Muster sind erkennbar?"
Visualisierung & Dashboards
Prompts für aussagekräftige Darstellungen.
19. "Welche Visualisierung eignet sich am besten für [Datentyp × Analyseziel]? Erstelle eine Entscheidungsmatrix: Vergleich → Balkendiagramm, Zeitverlauf → Liniendiagramm, Verteilung → Histogramm, Zusammenhang → Scatter, etc."
20. "Erstelle Python-Code (matplotlib + seaborn) für ein Dashboard mit 4 Diagrammen: (1) Umsatzentwicklung über Zeit, (2) Umsatzverteilung nach [Segment], (3) Top-10 [Kunden/Produkte], (4) Korrelationsmatrix der wichtigsten KPIs."
21. "Welche 5 Visualisierungsfehler machen Analysten am häufigsten? Für jeden Fehler: Beispiel, warum es irreführend ist und wie es besser geht."
22. "Erstelle eine Waterfall-Chart (Python) für [Umsatzentwicklung / Kostenanalyse / Brückenanalyse]: Startwert → positive Beiträge → negative Beiträge → Endwert."
23. "Agiere als Data-Visualization-Experte. Ich muss [Analyseergebnis] einem [C-Level / Board / Fachteam] präsentieren. Welche Visualisierung erzählt die Geschichte am besten? Begründe die Wahl."
24. "Erstelle ein KPI-Dashboard-Konzept für ein [Branche]-Unternehmen. Elemente: 5-7 KPIs, Layout (4-Quadranten), Drill-Down-Logik, Farbkodierung (Rot/Gelb/Grün) und Aktualisierungsfrequenz."
Statistische Analyse & Hypothesentests
Prompts für fundierte statistische Auswertungen.
25. "Ich möchte testen, ob [Variable A] einen signifikanten Einfluss auf [Variable B] hat. Datensatz: [Beschreibung]. Welcher statistische Test ist richtig? (t-Test, Chi-Quadrat, ANOVA, Regression?) Erstelle Python-Code mit Interpretation."
26. "Erstelle eine Korrelationsanalyse für die Variablen [A, B, C, D, E]. Python-Code: Pearson- und Spearman-Korrelation berechnen, Heatmap visualisieren. Welche Korrelationen sind statistisch signifikant?"
27. "Interpretiere folgendes Regressionsergebnis: [Output einfügen]. Was sagen R², p-Werte und Koeffizienten? Welche Variablen sind signifikant? Welche Limitationen hat das Modell?"
28. "Erkläre den Unterschied zwischen Korrelation und Kausalität am Beispiel [Branche/Datensatz]. Welche zusätzlichen Analysen brauche ich, um von Korrelation auf Kausalität schließen zu können?"
29. "Erstelle eine A/B-Test-Analyse für [Experiment-Beschreibung]. Python-Code: Stichprobengröße berechnen, statistische Signifikanz prüfen, Effektstärke berechnen, Ergebnis interpretieren."
30. "Welche statistischen Methoden sind für [kleine Datensätze / nicht-normalverteilte Daten / kategoriale Variablen / Zeitreihendaten] geeignet? Erstelle eine Entscheidungshilfe mit Begründung."




