DIALECTIC: Wie Multi-Agenten-Systeme das Startup-Screening revolutionieren
Multi-Agenten-Systeme erreichen bei der Startup-Bewertung die gleiche Präzision wie menschliche VC-Investoren. Eine neues Paper zeigt: Das System DIALECTIC prognostiziert den Erfolg von Startups, bei einem Bruchteil der Zeit, mit derselben Genauigkeit wie erfahrene Investoren.
Inhalt
- Das Problem: Warum traditionelles Screening nicht skaliert
- Was ist DIALECTIC? Die Architektur im Detail
- Die drei Phasen: Von Fakten zu Entscheidungen
- Backtesting-Ergebnisse: 259 Startups, 5 VC-Fonds
- Warum "argumentatives Reasoning" der Schlüssel ist
- Praktische Implikationen für VCs und PE
- Wie Sie Multi-Agenten-Systeme heute einsetzen können
- FAQ
Das Problem: Warum traditionelles Screening nicht skaliert
Venture-Capital-Investoren stehen vor einem fundamentalen Dilemma: Gründlichkeit vs. Volumen. Bei hunderten eingehenden Deals pro Monat bleibt für die meisten Startups nur eine oberflächliche Prüfung. Obwohl gerade die frühe Phase entscheidet, welche Deals überhaupt in die Pipeline kommen.
Die typische Realität:
| Phase | Zeitaufwand pro Startup | Qualität der Analyse |
|---|---|---|
| Initial Screening | 5-15 Minuten | Oberflächlich (Pitch Deck scannen) |
| Deep Dive | 4-8 Stunden | Fundiert (Due Diligence) |
| Investment Committee | Mehrere Tage | Iterativ, argumentativ |
Das Problem: Die iterative, argumentative Analyse – bei der Pro- und Contra-Argumente systematisch gegeneinander abgewogen werden – findet erst statt, wenn ein Deal bereits vorqualifiziert ist. Viele vielversprechende Startups fallen vorher durch das Raster.
DIALECTIC löst genau dieses Problem, indem es den argumentativen Prozess des Investment Committees auf die frühe Screening-Phase anwendet – automatisiert und skalierbar.
Was ist DIALECTIC? Die Architektur im Detail
DIALECTIC ist ein LLM-basiertes Multi-Agenten-System, das den iterativen Entscheidungsprozess erfahrener VC-Investoren modelliert. Im Gegensatz zu traditionellen ML-Modellen, die eine "Black Box"-Bewertung liefern, produziert DIALECTIC nachvollziehbare Argumentationsketten. Es geht also nicht um die “Zahl” am Schluss, sondern um den Weg zur Zahl.
Die Kernidee: Survival of the Fittest für Argumente
Das System nutzt eine evolutionäre Logik: Argumente "überleben" nur, wenn sie der Kritik spezialisierter "Devil's Advocate"-Agenten standhalten. Schwache Argumente werden eliminiert, starke verfeinert:
- Input: Startup-Daten + Web-Recherche
- Phase 1: Faktensammlung (hierarchischer Fragenbaum)
- Phase 2: Argumentatives Reasoning (Pro vs. Contra)
- Phase 3: Numerischer Decision Score
- Output: Ranking + interpretierbare Begründung
Die drei Phasen: Von Fakten zu Entscheidungen
Phase 1: Fact Collection – Strukturierte Informationsgewinnung
DIALECTIC sammelt Informationen aus bereitgestellten Daten und Webrecherchen. Diese werden in einem branchenspezifischen hierarchischen Fragenbaum (eine Art Ontologien) organisiert.
Beispiel-Fragenbaum für B2B-SaaS:
- Team
- Relevante Gründererfahrung?
- Technische Tiefe im Kernteam?
- Hiring-Momentum?
- Produkt
- Differenzierung zum Wettbewerb?
- Technologische Moats?
- Product-Market-Fit-Signale?
- Markt
- TAM/SAM/SOM-Validierung?
- Timing (warum jetzt)?
Diese strukturierte Faktensammlung entspricht dem Ansatz, den wir auch im Deal Sourcing mit AI beschreiben. Eine KI kann nicht beantworten, ob das Unternehmen ein gutes Investment ist. Die KI muss die große Frage, in kleinere Sub-Fragen runterbrechen. Ähnliche Konzepte gibt es seit kurzem auch beim neuen Kimi K2.5 Model unter dem Titel “Agent Swarm” oder dem GPT-Researcher. Unsere KI-Agents für VCs & PE funktionieren nach einem ähnlichen Prinzip.
Phase 2: Reasoning – Der argumentative Kern
Diese Phase ist meiner Meinung nach das Herzstück des Paper. DIALECTIC generiert Pro- und Contra-Argumente aus den gesammelten Fakten. Dann treten spezialisierte Agenten als Kritiker auf. Es ist ähnlich zu Andrej Karpathys "LLM Council”.
| Agenten-Rolle | Funktion |
|---|---|
| Pro-Advocate | Generiert Investment-Argumente |
| Contra-Advocate | Generiert Risiko-Argumente |
| Critic (Devil's Advocate) | Attackiert Argumente beider Seiten |
| Refiner | Verbessert überlebende Argumente |
Die Agenten agieren in einem Prozess mit mehrere Iterationen.
Dieses "Red Teaming" entspricht der Best Practice im Prompt Engineering für Finanzen und Strategie, bei der KI-Modelle genutzt werden, um eigene Thesen systematisch zu hinterfragen. Red Teaming ist auch eine der Systeme, die wir nutzen um Halluzinationen zu vermeiden.
Phase 3: Decision-Making – Vom Argument zur Zahl
Die überlebenden Argumente werden mit einem “Argument Quality Score” bewertet. Dieser gibt den natürlichsprachlichen Argumenten, quantitative Wertung.
Wichtig: Der Score ist keine Black Box. Investoren sehen die gesamte Argumentationskette und können nachvollziehen, warum ein Startup hoch oder niedrig bewertet wurde.
Mir gefällt die Idee sehr und wir haben Sie auch bei unserem Trend Radar im Einsatz: jeder Trend wird auf einer Skala von 1-5 bewertet.
Achtung: Hier tritt ein altes NLP-Problem auf: wie mappen wir natürlichsprachlichen Input 1:1 auf Zahlen? Für Sentimentanalyse gibt es bereits vortrainierte, deterministische Modelle, die immer den gleichen Wert liefern. Bei anderen Mapping-Anwendungen nicht. Deswegen setzen wir auf few-shot und zero-shot Classfications.
Backtesting-Ergebnisse: 259 Startups, 5 VC-Fonds
Die Forscher testeten DIALECTIC mit einem Dataset von 259 echten Startups aus fünf VC-Fonds.
Ergebnis
| Metrik | DIALECTIC | Menschliche VCs |
|---|---|---|
| Precision (Series-A-Vorhersage) | Gleichwertig | Baseline |
| Zeitaufwand pro Startup | Sekunden | Stunden |
| Skalierbarkeit | Unbegrenzt | ~50-100 Deep Dives/Jahr |
Optimale Hyperparameter
Die beste Performance wurde erreicht mit:
- Zwei Verfeinerungsiterationen
- Vier Argumente pro Aussage (Pro/Contra)
Mehr Iterationen brachten keine signifikante Verbesserung. Wie Andre Retterath schreibt, ist die KI hier dem Menschen ähnlich; irgendwann dreht sie sich im Kreis ;) .
Evidence-Priorisierung
DIALECTIC priorisiert dieselben Faktoren wie erfahrene Investoren:
- Team: Gründererfahrung, Skill-Fit, Hiring-Signale
- Produkt: Differenzierung, technologische Substanz
- Markt: Timing, Wettbewerbslandschaft
Diese Priorisierung deckt sich mit den Signalen, die wir im Guide Startup Companies bewerten: 10 Signale für Qualität identifiziert haben.
Warum "argumentatives Reasoning" der Schlüssel ist
Die meisten KI-Systeme im VC-Bereich arbeiten mit prädiktiven Modellen: Input rein, Wahrscheinlichkeit raus. Das Problem: Investoren vertrauen keiner Black Box, wenn Millionen auf dem Spiel stehen.
DIALECTIC verfolgt einen fundamental anderen Ansatz:
| Traditionelle ML-Modelle | DIALECTIC |
|---|---|
| "Dieses Startup hat 73% Erfolgswahrscheinlichkeit" | "Das Startup hat starke Argumente für X und Y, aber Risiken bei Z" |
| Nicht auditierbar | Vollständig nachvollziehbar |
| Vertrauen basiert auf historischer Accuracy | Vertrauen basiert auf Argumentqualität |
Der strategische Vorteil: DIALECTIC bringt datengestützte VC-Methoden näher an die tatsächliche Industriepraxis, indem es interpretierbare Reasoning-Traces liefert statt Black-Box-Vorhersagen.
Dies entspricht exakt den Anforderungen, die wir für KI-Agenten im Finanzwesen definiert haben: Auditierbarkeit ist nicht optional, sondern Pflicht. Und wie wir die Guidance in unseren KI-generierten Analysen (Company Benchmarks etc.) aufstellen:
Praktische Implikationen für VCs und PE
Was ändert sich im Dealflow?
| Phase | Ohne DIALECTIC | Mit DIALECTIC |
|---|---|---|
| Inbound-Screening | 15 Min. pro Deck, oberflächlich | Automatisiert, argumentativ |
| Priorisierung | Bauchgefühl + Quick Checks | Datengestütztes Ranking |
| IC-Vorbereitung | Manuelle Memo-Erstellung | Argumentationsgrundlage generiert |
| Due Diligence | Ab Phase 2 | Qualitative Tiefe ab Phase 1 |
Wie Researchly Investoren bei Research und Due Diligence unterstützt
Das Problem, das DIALECTIC aufzeigt: Selbst mit KI-Unterstützung bleibt das iterative Argumentieren – Pro- und Contra-Abwägungen, Quellenvalidierung, Reasoning-Dokumentation – ein zeitintensiver Prozess. Die Studie zeigt zwar, dass Multi-Agenten-Systeme die Präzision menschlicher Investoren erreichen können, aber die praktische Implementierung erfordert spezialisierte Infrastruktur.
Was Researchly bietet:
- Strukturierte Faktensammlung über 50+ Datenquellen in Sekunden statt Stunden
- Nachvollziehbare Argumentationsketten – jede Aussage mit Quellennachweis, keine Black-Box-Scores
- Spezialisierte Agenten für Due Diligence, Wettbewerbsanalyse und Market Mapping
Wenn Sie sehen möchten, wie sich automatisiertes Research und Synthese in Ihren Investment-Prozess integrieren lassen:
Keine Kreditkarte erforderlich. Zugang zu 40+ spezialisierten KI-Agenten für VC und PE.





