Eine aktuelle Studie zeigt: Mit der richtigen Prompt-Strategie übertrifft GPT-4 die Ideenvielfalt menschlicher Teams. Was das für VCs, Berater und Strategen bedeutet.
Inhalt
- Das Problem: Warum KI-Ideen oft zu ähnlich sind
- Die Studie: Chain-of-Thought als Game-Changer
- Praktische Anwendung: Welche Prompting-Strategien funktionieren
- Die Parallele zu Multi-Agenten-Systemen
- Integration in Trend-Analyse und Deal Sourcing
- Implementation: So starten Sie
- Fazit: Wie Researchly bei der Ideengenerierung unterstützt
Das Problem: Warum KI-Ideen oft zu ähnlich sind
Kreativität und Innovation erfordern drei Dinge: viele Ideen, qualitativ hochwertige Ideen und eine hohe Varianz zwischen den Ideen. Während KI-Systeme wie GPT-4 bei der Quantität und oft auch bei der Qualität überzeugen, haben sie ein fundamentales Problem: Ihre Ideen sind sich zu ähnlich.
Das limitiert den praktischen Nutzen erheblich. Denn Innovation entsteht nicht aus 100 Variationen derselben Idee, sondern aus der Exploration unterschiedlicher Lösungsräume.
| Dimension | Menschliche Teams | KI (ohne Optimierung) |
|---|---|---|
| Ideenmenge | Begrenzt durch Zeit | Nahezu unbegrenzt |
| Durchschnittliche Qualität | Variabel | Oft hoch |
| Diversität/Varianz | Hoch | Niedrig |
Die zentrale Frage: Kann man durch gezieltes Prompt Engineering die Ideenvielfalt von KI-Systemen steigern – und wenn ja, wie?
Die Studie: Chain-of-Thought als Best Practice
Ein Paper aus 2024 von Wissenschaftler*Innen der Wharton School hat genau diese Frage untersucht. Die Ergebnisse sind bemerkenswert – und direkt anwendbar.
Die Methodik
Die Forscher nutzten Kosinus-Ähnlichkeit als Metrik für Ideenvielfalt. Je niedriger der Wert, desto unterschiedlicher die Ideen. Menschliche Brainstorming-Gruppen erreichten einen Durchschnittswert von 0,243. GPT-4 ohne spezielle Prompts lag bei 0,377 – also deutlich weniger divers.
Was getestet wurde
Verschiedene Prompt-Strategien wurden verglichen:
- Personas (z.B. "Du bist Steve Jobs")
- Emotionale Aufforderungen ("Sei mutig und unkonventionell")
- Kreativitätstechniken (Design Thinking, SCAMPER)
- Hybrid-Brainstorming
- Chain-of-Thought (CoT)
Das Ergebnis
Chain-of-Thought Prompting war mit Abstand am effektivsten. Die CoT-Methode erzielte eine Kosinus-Ähnlichkeit von 0,255 – nahezu identisch mit menschlichen Teams (0,243).
Noch beeindruckender: Die Anzahl eindeutiger Ideen stieg von ca. 3.700 auf 4.700 – ein Plus von fast 30%.
Warum CoT funktioniert
Chain-of-Thought zwingt das Modell, Ideen durch mehrere, voneinander getrennte Schritte zu entwickeln:
- Erstellen einer breiten Liste von Ansätzen
- Anpassen und Diversifizieren der Ideen
- Ausarbeiten detaillierter Beschreibungen
Dieser Prozess verhindert, dass das Modell in lokale Optima "einrastet" und immer ähnliche Ideen produziert.
Praktische Anwendung: Welche Prompting-Strategien funktionieren
Für VCs, Berater und Strategen ergeben sich konkrete Handlungsempfehlungen:
Strategie 1: Chain-of-Thought für Ideengenerierung
Statt: "Generiere 50 Geschäftsideen für den Healthcare-Sektor"
Besser:
- Schritt 1: Liste 10 fundamental unterschiedliche Problemfelder im Healthcare-Sektor auf.
- Schritt 2: Für jedes Problemfeld, identifiziere 3 unkonventionelle Lösungsansätze aus anderen Branchen.
- Schritt 3: Kombiniere die vielversprechendsten Ansätze zu konkreten Geschäftsideen mit USP und Zielgruppe.
Strategie 2: Hybrid-Ansätze
Die Studie zeigte auch: Die Überschneidung zwischen verschiedenen Prompt-Strategien ist gering. Das bedeutet, dass Hybrid-Ansätze – bei denen mehrere Methoden kombiniert werden – besonders robuste Ergebnisse liefern.
| Strategie | Stärke | Kombination mit |
|---|---|---|
| CoT | Höchste Diversität | Personas für Tiefe |
| Personas | Spezifische Perspektiven | CoT für Struktur |
| Emotionale Prompts | Unkonventionelle Ideen | Kreativitätstechniken |
Strategie 3: Iterative Verfeinerung
Die Forscher empfehlen, Ideen nicht in einem Durchgang zu generieren, sondern iterativ zu verfeinern – ähnlich wie menschliche Teams in Brainstorming-Sessions arbeiten
Die Parallele zu Multi-Agenten-Systemen
Die Erkenntnisse zur Ideengenerierung spiegeln einen breiteren Trend wider: Strukturiertes, iteratives Reasoning führt zu besseren KI-Ergebnissen als einfache Prompts.
DIALECTIC: Argumentatives Reasoning für Startup-Screening
Ein verwandter Ansatz zeigt sich im DIALECTIC-Framework für Startup-Screening. Dort nutzen Multi-Agenten-Systeme argumentatives Reasoning, um Investment-Entscheidungen zu treffen.
Das Prinzip ist ähnlich:
| Ideengenerierung (CoT) | Startup-Screening (DIALECTIC) |
|---|---|
| Ideen in Schritten entwickeln | Argumente iterativ verfeinern |
| Diversität durch Struktur | Qualität durch Kritik |
| Mehrere Perspektiven einnehmen | Pro- und Contra-Agenten |
Der gemeinsame Nenner: "Survival of the Fittest" für Gedanken
Bei DIALECTIC "überleben" Argumente nur, wenn sie der Kritik spezialisierter Devil's-Advocate-Agenten standhalten. Bei CoT-Ideengenerierung werden Ideen durch strukturierte Schritte "gefiltert" und diversifiziert.
Das Muster: Einfache KI-Abfragen liefern mittelmäßige Ergebnisse. Strukturierte, iterative Prozesse – ob für Ideen oder Analysen – führen zu Outputs, die mit menschlicher Expertise konkurrieren können.
Integration in Trend-Analyse und Deal Sourcing
Für VCs und Berater ist Ideengenerierung selten isoliert. Sie ist Teil eines größeren Prozesses: Trends erkennen → Opportunity Spaces identifizieren → Konkrete Ideen entwickeln → Validieren.
Der 4-Stufen-Workflow
Wie in unserem Guide zur Trend-Analyse für Investoren beschrieben, folgt systematische Innovation einem klaren Prozess:
- Signale sammeln – aus Patenten, News, Funding-Daten
- Clustern – Themen automatisch gruppieren
- Klassifizieren – nach Impact, Maturity, Relevanz bewerten
- Analysieren – Opportunity Spaces identifizieren
Wo Ideengenerierung ansetzt
CoT-basierte Ideengenerierung ist besonders wertvoll in Stufe 4: Wenn Sie einen vielversprechenden Opportunity Space identifiziert haben (z.B. "Vertical AI für Legal"), können Sie KI nutzen, um konkrete Geschäftsmodelle, Features oder Anwendungsfälle zu generieren.
Beispiel-Workflow:
- Trend-Analyse identifiziert: "AI für Contract Analysis" wächst +340%
- Opportunity Space: B2B Legal Tech für Mittelstand unterbesetzt
- CoT-Ideengenerierung:
- Schritt 1: 10 unterschiedliche Contract-Typen im Mittelstand
- Schritt 2: Für jeden Typ: 3 KI-Anwendungsfälle
- Schritt 3: Priorisierung nach TAM und technischer Machbarkeit
-
- Output: 5 konkrete Produktideen mit Validierungskriterien
Implementation: So starten Sie
Für Sofort-Ergebnisse: CoT-Template
Adaptieren Sie diesen Prompt aus dem Paper:
Generate new product ideas with the following requirements: The product will target college students in the United States. It should be a physical good, not a service or software. I'd like a product that could be sold at a retail price of less than about USD 50. The ideas are just ideas. The product need not yet exist, nor may it necessarily be clearly feasible. Follow these steps. Do each step, even if you think you do not need to. First generate a list of 100 ideas (short title only) Second, go through the list and determine whether the ideas are different and bold, modify the ideas as needed to make them bolder and more different. No two ideas should be the same. This is important! Next, give the ideas a name and combine it with a product description. The name and idea are separated by a colon and followed by a description. The idea should be expressed as a paragraph of 40-80 words. Do this step by step!
Warum der CoT-Prompt funktioniert
Spezifische Leitplanken (Constraints)
Anstatt nur nach „Produktideen“ zu fragen, setzt der Prompt klare Grenzen:
- Zielgruppe: College-Studenten in den USA.
- Format: Nur physische Güter (keine Software/Dienstleistungen).
- Preisrahmen: Unter 50 USD.
- Warum das gut ist: KI neigt bei zu allgemeinen Anfragen zu klischeehaften Antworten. Diese Einschränkungen zwingen die KI, in einem realistischen Marktrahmen zu „denken“.
Siehe auch unser KI-Research Playbook
Psychologische Erlaubnis zur Kreativität
Der Satz „The product need not yet exist, nor may it necessarily be clearly feasible“ nimmt der KI die „Angst“ (bzw. die programmierte Tendenz), nur logische und langweilige Standardlösungen zu liefern. Es öffnet den Raum für echte Innovation.
„Chain of Thought“ und Iteration (Schritt-für-Schritt)
Der Prompt nutzt die Anweisung „Follow these steps. Do each step, even if you think you do not need to.“
- Quantität vor Qualität: Zuerst 100 Ideen zu generieren (Schritt 1), nutzt die Fähigkeit der KI zur Massenproduktion.
- Selbstreflexion: In Schritt 2 wird die KI angewiesen, ihre eigenen Ideen kritisch zu prüfen und „kühner“ (bold) zu machen. Das verhindert, dass die KI einfach 100-mal fast das Gleiche sagt (z.B. 10 verschiedene Notizbücher).
Strukturierte Formatierung
Die Anweisung, Namen und Beschreibungen mit einem Doppelpunkt zu trennen und eine genaue Wortzahl (40–80 Wörter) einzuhalten, ist entscheidend:
- Es macht das Ergebnis lesbar und strukturiert.
- Die Wortzahlvorgabe zwingt die KI dazu, genug Details zu liefern, um die Idee greifbar zu machen, ohne in irrelevantes Geschafel zu verfallen.
5. Vermeidung von Redundanz
Der explizite Befehl „No two ideas should be the same. This is important!“ adressiert eine bekannte Schwäche von Large Language Models (LLMs): Wenn man nach großen Mengen fragt (z.B. 100 Stück), fangen sie oft an, sich zu wiederholen. Dieser explizite Warnhinweis erhöht die Varianz.
Für systematische Integration: Agenten-Workflows
Wie bei Multi-Agenten-Systemen für Due Diligence können Sie verschiedene "Rollen" definieren:
| Agent | Aufgabe |
|---|---|
| Ideengenerator | CoT-basierte Ideenentwicklung |
| Critic | Ideen auf Schwächen prüfen |
| Market Validator | Marktpotenzial einschätzen |
| Synthesizer | Top-Ideen zusammenführen |
Achtung: Was Sie beachten sollten
Die Studie zeigt beeindruckende Ergebnisse – aber es gibt wichtige Einschränkungen:
1. Metriken haben Grenzen
Kosinus-Ähnlichkeit ist ein mathematisches Maß, das nicht alle Aspekte menschlicher Ideenbewertung erfasst. Eine Idee kann "mathematisch divers" sein, aber praktisch irrelevant.
2. Qualität ≠ Diversität
Mehr unterschiedliche Ideen bedeuten nicht automatisch mehr gute Ideen. Human Oversight bleibt essenziell – die KI generiert den Rohstoff, Menschen bewerten und verfeinern.
3. Modellabhängigkeit
Die Ergebnisse wurden mit GPT-4 erzielt. Andere Modelle können sich unterschiedlich verhalten. Testen Sie Ihre Prompts mit Ihrem spezifischen Setup.
4. Ideensättigung
Nach ca. 750 Ideen sinkt der Grenznutzen deutlich. Unbegrenzte Ideengenerierung ist also kein Selbstzweck – irgendwann ist der Lösungsraum erschöpft.
5. Zukunft
Die Studie ist aus 2024. Neuere Modelle, spezielle jene mit Reasoning, könnten nochmals andere Ergebnisse liefern.
5. Daten
Alle Ideen basieren auf dem Trainingsdaten der Modelle. Dadurch sind die Idee zwar divers aber vielleicht veraltet. Meine Emfehlung: Prompts mit Marktdaten (bestehende Ideen, Trends, Wettbewerber) kombinieren, um aktuelle Ideen zu generieren.
Wie Researchly bei Ideengenerierung und Research unterstützt
Das Problem, das die Studie aufzeigt: Gute Prompting-Strategien wie Chain-of-Thought erfordern Struktur und Iteration. Gleichzeitig müssen generierte Ideen mit Marktdaten validiert werden – von Trend-Signalen über Wettbewerbsanalysen bis zu Funding-Daten.
Die eigentliche Herausforderung ist nicht die einzelne Idee, sondern der durchgängige Prozess: Von der Trend-Erkennung über die Ideengenerierung bis zur Validierung.
Was Researchly bietet:
- Strukturierte Ideengenerierung mit spezialisierten Agenten, die CoT und Multi-Perspektiven-Ansätze automatisch anwenden
- Direkte Trend-Integration – generieren Sie Ideen basierend auf aktuellen Markt-Signalen aus 50+ Datenquellen
- Validierung in Echtzeit – prüfen Sie Ideen sofort gegen Wettbewerbsdaten, Funding-Aktivität und Marktgröße
- Nachvollziehbare Argumentationsketten – verstehen Sie, warum bestimmte Ideen vielversprechend sind
Wenn Sie sehen möchten, wie sich KI-gestützte Ideengenerierung und systematisches Research in Ihren Investment- oder Strategieprozess integrieren lassen:
Keine Kreditkarte erforderlich. Zugang zu 40+ spezialisierten KI-Agenten für VCs, PE und Berater.





