Tenzo
Alle Feldnotizen
Praxis·18. Februar 2026·9 min

KI-Telefonassistent im Handwerk: so funktioniert er wirklich.

Nicht Science-Fiction, nicht Chatbot-Spielerei. Was eine moderne Sprach-KI im Betriebsalltag tatsächlich leistet.

Wenn ich Handwerkern erzähle, was unser System macht, höre ich meistens dieselben drei Reaktionen. "Das ist doch wie Siri, oder?" "Der Kunde merkt doch sofort, dass kein Mensch am Telefon ist." Und: "Das wird bestimmt nicht mit Schweizerdeutsch umgehen können."

Alle drei Punkte verdienen eine ehrliche Antwort.

Was der Assistent in den ersten drei Sekunden tut

Ein Anruf kommt rein. Die KI nimmt ab, begrüsst mit Ihrem Firmennamen, hört zu. Sie erkennt die Sprache des Anrufers — und wechselt automatisch, wenn nötig.

Parallel dazu passieren drei Dinge:

  • Das Gespräch wird transkribiert (fast in Echtzeit)
  • Die Absicht wird klassifiziert (Notfall, Offerte, Terminbuchung, allgemeine Frage)
  • Die relevanten Entitäten werden extrahiert (Name, Adresse, Dringlichkeit)

Das Problem mit Schweizerdeutsch — und warum es nicht mehr existiert

Noch vor zwei Jahren war Schweizerdeutsch eine Hürde. Die Modelle haben es nicht gut erkannt. Heute ist das gelöst: die aktuelle Generation von Sprachmodellen kommt mit Zürichdeutsch, Berndeutsch und Baseldeutsch gleich gut klar. Unser Setup für Schweizer Handwerksbetriebe verwendet explizit ein Schweizerdeutsch-optimiertes Modell.

Was ich selbst getestet habe: Anrufe in Dialekt, teilweise mit starkem regionalen Akzent. Die Transkripte waren in über 95% der Fälle wörtlich korrekt.

Wie "merkt der Kunde, dass es eine KI ist"

Die Frage ist legitim. Und die ehrliche Antwort lautet: ja, mit hoher Wahrscheinlichkeit. Wir versuchen nicht, den Kunden zu täuschen. Die KI sagt beim Abheben:

"Guten Tag, hier ist der digitale Assistent von Elektro Meier. Was darf ich für Sie tun?"

Das ist bewusst transparent. Und interessant: die meisten Kunden haben damit kein Problem — solange das Gespräch reibungslos läuft und sie spüren, dass der Assistent sie versteht. Was frustriert, sind Chatbots, die sich im Kreis drehen. Eine KI, die zielstrebig das Anliegen aufnimmt und bucht, ist oft angenehmer als ein menschlicher Gesprächspartner im gestressten Büro.

Was die KI nicht kann

Wichtig, um Erwartungen nicht zu übersteuern:

  • Sie kann keine technische Beratung durchführen (will sie auch nicht)
  • Sie trifft keine Preisnachlässe (Geschäftsentscheidungen bleiben bei Ihnen)
  • Sie kann kein komplexes Projekt entgegennehmen, das eine Ortsbesichtigung erfordert — aber sie kann diese Besichtigung terminieren
  • Sie kann einen aufgebrachten Kunden nicht beruhigen wie ein erfahrener Mensch das kann

Und: der Assistent macht Fehler. Vielleicht 2–5% der Fälle. Dafür haben wir eine Übergabelogik: wenn die KI merkt, dass sie nicht weiterkommt, ruft sie Sie oder einen hinterlegten Ansprechpartner zurück — nicht den Kunden noch einmal.

Die Integration ins ERP

Das ist der entscheidende Teil. Eine KI, die nur annimmt und transkribiert, ist halb nützlich. Eine KI, die direkt einen strukturierten Eintrag in Bexio, Abacus oder SAP Business One erzeugt, ersetzt einen halben Büroarbeitsplatz.

Bei uns sieht das dann so aus:

  • Anrufbeginn → Kunden-Such-Query im ERP
  • Während des Gesprächs → Felder (Name, Auftrag, Dringlichkeit, Termin) werden extrahiert
  • Gesprächsende → Ticket in Ihrem System angelegt, Termin im Kalender, SMS an den Kunden

Alles ohne manuellen Eingriff. Sie sehen morgens die Nacht-Anrufe als fertige Einträge.

Technische Grundlagen, kurz

Für Interessierte: unser Stack kombiniert ein Sprach-zu-Text-Modell (Whisper oder vergleichbar), ein Sprachverständnis-Modell (aktuelle GPT- oder Claude-Generation) und ein Text-zu-Sprache-Modell mit natürlichen Schweizer Stimmen (ElevenLabs oder ähnliche). Die Orchestrierung läuft über eine eigene Voice-Pipeline, die auf Latenz optimiert ist — unter 800 ms End-to-End, damit das Gespräch natürlich wirkt.

Die Infrastruktur läuft auf EU- oder Schweizer Servern. Aufzeichnungen werden nach konfigurierbarer Frist gelöscht. DSGVO-konform per Default.

Was der Start kostet

Die ehrliche Antwort: weniger, als die meisten denken. Ein typisches Setup mit ERP-Anbindung, drei Anrufszenarien und DE/CH-DE-Sprachunterstützung liegt im Bereich von ein paar tausend Franken einmalig plus einem monatlichen Servicevertrag, der deutlich unter den Personalkosten eines Büroarbeitsplatzes liegt.

Die Frage ist nicht mehr, ob sich das rechnet — sondern nur noch, ob Ihr Betrieb bereit ist, die bestehenden Prozesse zu dokumentieren. Denn eine KI-Lösung ist nur so gut wie das Wissen, das wir ihr beibringen.