KI

1SP x CloudFest: In 4 Wochen vom Konzept zum KI-Avatar im Einstein-Look

Für das renommierte Branchenevent CloudFest entwickelten wir einen beeindruckenden KI-Avatar in Form und Stimme von Albert Einstein. Ziel war es, während der Keynote auf der Hauptbühne mit Einstein zu interagieren, sowie im Nachgang bei HPE Produktinformationen in Echtzeit charmant, glaubwürdig und technisch fundiert zu vermitteln.

Ergebnisse

Pünktlich zum Start des CloudFest stand der Einstein-Avatar bereit, auf dessen Basis weitere Avatare für den Einsatz im Vertrieb, Service oder Eventmarketing aufgebaut werden können.

  • Schnelle Umsetzung in nur 4 Wochen bei hoher Komplexität und engem Zeitrahmen
  • Einsatz während der CloudFest Keynote, bei dem der Avatar live präsentiert wurde
  • Interaktive Nutzung am HPE-Messestand, inklusive Beantwortung konkreter Produktfragen
  • Aufbau einer skalierbaren technischen Basis für weitere KI-Avatare
  • Authentische Darstellung durch präzises Voice Cloning und Animationen auf Basis eigener Videoaufnahmen
  • Großes Marktinteresse von anderen Unternehmen an ähnlichen Avatar-Lösungen

Challenge

Enge Timeline, komplexer Technologiestack und höchste Qualitätsansprüche. Innerhalb von nur vier Wochen sollte ein vollfunktionsfähiger Sales Avatar entstehen, der live auf dem Event mit Messebesuchern interagiert. Neben niedriger Latenz und hoher Antwortqualität war insbesondere ein klares Regelwerk notwendig, um sicherzustellen, dass „Einstein“ nur auf definierte Themenbereiche reagiert.

futurebrains hat in kürzester Zeit das geschafft, was andere nicht geschafft haben. Mit Fokus und ohne Umwege haben wir gemeinsam das Ziel erreicht.

Markus

Oeller

1SP
KI

Vorgehen

Ein cross-funktionales Team aus GenAI-Spezialisten, Front- und Backend-Entwicklern sowie einem Unreal-Engineer arbeitete in täglichen Iterationen am Projekt. Innerhalb von 48 Stunden stand ein erster funktionsfähiger MVP, der Ausgangspunkt für den gezielten Ausbau.

Die Entwicklungsphasen umfassten:

  • Anforderungsanalyse & Architekturdefinition
  • Immersive 3D-Welt in Unreal Engine
  • Voice Cloning: maßgeschneiderte Synthese einer authentischen Einstein-Stimme durch Feintuning auf Originalaufnahmen
  • Speech-to-Text- & Text-to-Speech-Integration für Dialoge in Echtzeit
  • Animationserstellung: automatische Mimik- und Gesten­animation auf Basis von Videos, die das Team selbst aufgenommen hat
  • RAG-Ansatz zur Einbindung strukturierter Produktinformationen
  • Google Gemini Flash als zentrales Large Language Model zur dynamischen, kontextsensitiven Antwort­generierung im typischen Einstein-Duktus
  • Präzise Guardrails für Inhaltstreue, Compliance und Themenabgrenzung

In 6 Monaten zur marktreifen digitalen Lösung

In nur 30 Minuten zeigen wir dir, wie du dein digitales Geschäftsmodell schnell, effizient und mit echtem Umsatzpotenzial an den Start bringst.

TERMIN SICHERN & LOSLEGEN