Methodik & Wissenschaft
Wissenschaftlich fundiert. Nicht nur technisch möglich.
Kolloqo ist kein KI-Experiment. Hinter jedem Interview stehen validierte psychologische Testverfahren, entwickelt über mehr als 20 Jahre. Die KI ist das Erhebungsformat — die Wissenschaft kommt von IR&C.
Das Prinzip
Die Testinhalte, Dimensionen und Bewertungslogik eines Verfahrens bleiben bei Kolloqo vollständig erhalten. Was sich ändert, ist ausschließlich das Erhebungsformat: Statt Items auf einer Skala anzukreuzen, beschreiben Teilnehmende ihre Erfahrungen in eigenen Worten. Die KI ordnet diese Aussagen den Dimensionen des jeweiligen Verfahrens zu — strukturiert, nachvollziehbar und mit messbarer Konfidenz.
Validierte Inhalte
Die Fragen, Dimensionen und Bewertungskriterien stammen aus wissenschaftlich erprobten Testverfahren — nicht aus KI-generierten Prompts.
Konversation als Medium
Die KI führt das Gespräch entlang der vorgegebenen Struktur. Teilnehmende antworten frei — die Zuordnung zu Skalenwerten erfolgt automatisch.
Vergleichbare Ergebnisse
Die Skalenwerte sind mit klassischen Fragebogen-Erhebungen vergleichbar. Der Pilot zeigt hohe Übereinstimmung (ICC) zwischen beiden Formaten.
Der eigentliche Unterschied
Das KI-Interview liefert zwei Ergebnisebenen: erstens die klassischen Skalenwerte des jeweiligen Testverfahrens — vergleichbar mit einer Fragebogenerhebung.
Und zweitens etwas, das kein Fragebogen leisten kann: kontextreiche Zusatzinformationen, die Teilnehmende freiwillig teilen, weil das Gesprächsformat Raum dafür schafft.
Ebene 1: Standardisierte Messung
Die KI ordnet Antworten den Dimensionen des Verfahrens zu und berechnet Skalenwerte mit messbarer Konfidenz. Das Ergebnis ist direkt vergleichbar mit einer klassischen Fragebogenerhebung — der Pilot zeigt hohe Übereinstimmung zwischen beiden Formaten. Für Organisationen, die Benchmarks brauchen, ändert sich am Output nichts.
Ebene 2: Was der Fragebogen nie erfasst
Im Gespräch teilen Teilnehmende freiwillig Kontext, Beispiele und Beobachtungen, die über die gestellte Frage hinausgehen. Im Pilot hat sich gezeigt: Menschen geben im KI-Interview deutlich mehr preis als im Formular. Konkrete Situationsbeschreibungen, Verbesserungsvorschläge, Hinweise auf Probleme, die in keinem Item vorkommen. Diese Zusatzerkenntnisse machen in vielen Fällen nachgelagerte Workshops und Nacherhebungen überflüssig.
Das bedeutet in der Praxis: Ein einzelnes KI-Interview liefert sowohl die quantitativen Ergebnisse, die Ihr Fachteam für die Auswertung braucht, als auch die qualitativen Einsichten, für die sonst separate Workshops, Nachbefragungen oder Einzelinterviews nötig wären.
Scoring-Pipeline
Wie aus Gesprächen Skalenwerte werden
Kein Black-Box-Modell. Jeder Skalenwert lässt sich auf konkrete Textstellen zurückführen — vollständig auditierbar für Fachpersonal und Compliance.
1. Antwort zerlegen
Die freie Antwort wird in sinnvolle Abschnitte zerlegt. Negationen, Kontraste und Füllwörter werden erkannt und markiert — der Originaltext bleibt für die Auditierung erhalten.

2. Dimensionen zuordnen
Jeder Abschnitt wird den Dimensionen des Testverfahrens zugeordnet — über semantische Ähnlichkeit, Wortlisten und verfahrensspezifische Regeln. Nur relevante Aussagen fließen in die Bewertung ein.

3. Merkmale extrahieren
Pro Abschnitt werden Grundton, Intensität, Häufigkeit, Zeitbezug und Gewissheit erfasst. Hedging-Marker wie ‚vielleicht' oder ‚eigentlich' werden separat erkannt.

4. Skalenwert berechnen
Aus den extrahierten Merkmalen wird ein Rohwert abgeleitet und auf die Originalskala des Verfahrens abgebildet. Bei inversen Items wird die Polung automatisch korrigiert.

5. Konfidenz bewerten
Jeder Score erhält eine objektive Konfidenz: Wie eindeutig war die Aussage? Wie viel Evidenz liegt vor? Bei zu geringer Evidenz wird kein Wert vergeben — stattdessen ‚nicht beurteilbar'.

Qualitätssicherung
Gemessen, nicht behauptet
Kolloqo ersetzt keine wissenschaftliche Validierung — es baut darauf auf. Die Qualität der Ergebnisse wird systematisch überprüft.
Hohe Übereinstimmung
Im Pilotvergleich mit klassischer Fragebogenerhebung zeigt das KI-Interview eine hohe Intraklassen-Korrelation (ICC) — die Skalenwerte sind vergleichbar.
Nutzerakzeptanz 4,31/5
Teilnehmende bewerten das KI-Interview im Pilot mit durchschnittlich 4,31 von 5 Sternen. Das Gesprächsformat wird als angenehmer und verständlicher erlebt als klassische Fragebögen.
Eingebaute Qualitätskontrolle
Der Konfidenz-Score ist keine Selbsteinschätzung der KI, sondern wird aus objektiven Merkmalen berechnet. Bei unzureichender Evidenz wird kein Wert vergeben.
Das Fundament
Kolloqo wurde nicht von einem Technologie-Startup gebaut, sondern von Psycholog:innen, die seit zwei Jahrzehnten Testverfahren für den professionellen Einsatz entwickeln.

Univ. Lektor Dr. Jörg Prieler
Gründer & Geschäftsführer IR&C
IR&C — Investigation, Research & Consulting Center
Unter der Leitung von Univ. Lektor Dr. Jörg Prieler entwickelt IR&C seit über 20 Jahren psychologische Testverfahren für den professionellen Einsatz. Das Portfolio umfasst mehr als 65 Instrumente — von Arbeitsgesundheit (SALSA, HOT, BODI) über Führungsdiagnostik (TUF) bis hin zu sicherheitskritischen Anwendungen (Triple Eye, ITR). Die Verfahren kommen in Nachrichtendiensten, der Luftfahrt, im Gesundheitswesen, in der öffentlichen Verwaltung und in Industrieunternehmen zum Einsatz.
Kolloqo baut auf diesem Fundament auf: Jedes KI-Interview verwendet die validierten Inhalte, Dimensionen und Bewertungslogiken aus dem IR&C-Portfolio. Die wissenschaftliche Verantwortung bleibt bei den Verfahrensentwickler:innen — die Technologie ermöglicht ein Erhebungsformat, das näher am natürlichen Gesprächsverhalten der Teilnehmenden liegt als ein Fragebogen.
Fragen zur Methodik?
Wir erklären gerne im Detail, wie unsere Scoring-Pipeline funktioniert, welche Validierungsergebnisse vorliegen und wie die Qualitätssicherung in Ihrem konkreten Anwendungsfall aussieht.