Que se passe-t-il quand quelqu'un qui gère des clusters ViciDial depuis 2008 repense une architecture de téléphonie IA depuis la base ? Vous n'obtenez pas un autre produit SaaS. Vous obtenez une Couche de Contrôle d'Appels qui va fondamentalement changer l'avenir du travail dans les centres d'appels.
Nous avons déployé LiveKit et des agents vocaux IA dans des centres d'appels en production début 2024 — des mois avant qu'OpenAI et LiveKit n'annoncent leur partenariat "Advanced Voice" en octobre 2024. Ce qu'OpenAI commercialise aujourd'hui comme révolutionnaire, nous ne l'avons pas seulement déployé plus tôt — nous l'avons fondamentalement amélioré avec notre Couche de Contrôle d'Appels auto-développée : le transfert assisté, l'isolation multi-tenant et le TTS à 7 émotions existaient dans cette combinaison nulle part ailleurs dans le monde — pas même chez OpenAI.
GoFonIA n'est pas une startup qui vient de « découvrir » la téléphonie IA comme une tendance. C'est le résultat de 17 ans d'expérience opérationnelle en centres d'appels – compressée dans une architecture qui sait tout ce dont un centre d'appels a besoin avant même le premier appel.
Installation et exploitation d'installations ViciDial en production. Numérotation prédictive, scripts d'agent, gestion de campagnes – le spectre complet de la technologie classique de centres d'appels sur une base open-source.
Exploitation de configurations multi-opérateurs avec trunking SIP via Telekom, Plusnet, dus.net, voip2gsm. Réglage Asterisk au niveau du noyau. Développement d'outils propriétaires de surveillance et de reporting. La connaissance des limites de la technologie des centres d'appels – et pourquoi.
Premières expérimentations avec des modèles de langage dans des contextes de téléphonie. La prise de conscience : aucun framework existant ne peut faire ce dont un vrai centre d'appels a besoin. Ni les fournisseurs cloud américains ni les alternatives européennes.
Début du développement interne. La question centrale : comment construire un contrôleur de téléphonie qui ne se contente pas de « répondre aux appels et répondre », mais qui cartographie la logique complète d'un centre d'appels – y compris le transfert chaud, les files d'attente, l'isolation des tenants et l'orchestration SIP ?
Achèvement de l'architecture à salle unique avec logique de transfert en 5 phases, TTS à 7 émotions, routage DID multi-tenant et moteur de surveillance. Déploiement en production chez les premiers clients.
Le cœur de GoFonIA n'est pas un modèle d'IA. C'est une couche de contrôle auto-développée qui opère entre le réseau téléphonique et l'IA – orchestrant toute la logique d'appel. Cette couche n'existe nulle part ailleurs dans la région DACH.
Parce que les frameworks de téléphonie standard n'ont pas été construits pour garder quatre participants dans une salle et basculer les flux audio entre eux en temps réel. Parce que la téléphonie IA conventionnelle ne connaît que « appel → réponse » – mais pas « l'agent présente, le collègue écoute, la musique joue, l'appelant attend, tout le monde dans la même salle ». Parce que l'isolation des tenants au niveau du DID, le registre d'outils d'exécution et l'orchestration SIP avec stratégies de repli ne sont fournis par aucun kit SaaS au monde.
La Couche de Contrôle opère simultanément sur cinq niveaux :
Reconnaissance de tenant basée sur le DID lors de la poignée de main SIP. Création dynamique de participants via SIP sortant. Gestion BYE en fin de connexion.
Architecture à salle unique : tous les participants dans la même salle. La matrice d'abonnement contrôle qui entend qui. Basculement audio contrôlé par phases sans perte de connexion.
Machine d'état en 5 phases avec délais et replis. MOH spécifique par tenant (Music-on-Hold, bibliothèque de 8 Go libre de droits). Briefing de l'agent au collègue cible. Retour en cas d'indisponibilité.
Par tenant : propres clés API, prompts, voix, matrice d'émotions, base de connaissances, outils, identifiants SIP. Moteur de session basé sur Redis. Zéro fuite entre tenants.
Surveillance autonome de toutes les salles actives. Détection de délai, suppression de salle via API, nettoyage d'état Redis, livraison de transcription par e-mail. Entièrement automatisé en < 2 secondes.
Chaque appel passe par une chaîne de décision en millisecondes, opérant sur sept niveaux indépendants en parallèle :
Participant SIP dans la salle
LLM + 7 voix émotionnelles
File d'attente WebRTC
SIP sortant dans la salle
GoFonIA n'utilise pas de TTS générique. Chaque tenant reçoit une matrice d'émotions calibrale avec sept profils vocaux dimensionnels – configurable individuellement par tenant, par campagne, par type d'appel. La voix ne réagit pas seulement sémantiquement – elle réagit de manière paraverbale.
Ligne de base. Factuel, dense en informations. Pour les demandes d'état et la communication de faits.
Chaleureux, accessible, ouvert. Pour les salutations, le small talk, les appels de service.
Compréhensif, patient, désamorçant. Pour les réclamations et les sujets sensibles.
Formel, précis, poliment distant. Pour le B2B, la banque, l'assurance, le contexte gouvernemental.
Entraînant, orienté solutions, énergique. Pour les appels de vente et les campagnes orientées conversion.
Calme, profond, créateur de confiance. Pour le support de premier niveau, les files d'attente, les hotlines techniques.
Clair, direct, fixant des limites. Pour le recouvrement, les contrôles de conformité, l'escalade.
La matrice d'émotions opère sur deux axes paraverbaux : le débit de parole (0,6×–2,4×) et le timbre vocal (décalage de fréquence ±18 %). Plus une logique de pause contextuelle : l'agent sait quand le silence est un outil plus puissant que la parole.
Pas d'AWS. Pas de Google Cloud. Pas d'Azure. GoFonIA fonctionne sur des serveurs racine dédiés Hetzner à Francfort-sur-le-Main et Nuremberg – virtualisé via Proxmox, orchestré dans des conteneurs LXC isolés.
Par tenant : conteneur LXC isolé avec son propre stockage Redis, ses propres clés API, ses propres versions de prompts et son propre enregistrement SIP. Pas de mémoire partagée. Pas de flux de données entre tenants. Chaque conteneur est un système de téléphonie autonome qui peut être sauvegardé, migré et mis à l'échelle individuellement.
Pour les secteurs sensibles, nous utilisons exclusivement de l'IA européenne — Mistral AI (Paris) et Infomaniak (Suisse) pour LLM, TTS et STT. Sur demande entièrement on-premise : Notre stack complet — LLM, TTS, STT et Call Control Layer — fonctionne sur votre propre matériel. Conçu pour les banques, les assurances, les administrations publiques, les cabinets d'avocats et le secteur de la santé. L'exploitation est entièrement conforme au RGPD sur des serveurs Hetzner Online GmbH avec un accord de traitement des données selon l'Art. 28 RGPD.
Chaque octet traité par GoFonIA reste sur des serveurs de Hetzner Online GmbH à Francfort-sur-le-Main et Nuremberg. Les modèles d'IA utilisés — Mistral AI (Paris) et Infomaniak (Suisse) — ont leur siège légal dans l'Union Européenne. Sans US par défaut. Pour les secteurs sensibles (banque, assurance, administration, juridique, santé), nous livrons l'ensemble du stack on-premise sur le matériel du client.
Pas de Cloud Act américain. Pas de transfert vers un pays tiers. Pas de fuite de données silencieuse. Conforme au §203 StGB. Audité RGPD. Unique dans la région DACH.
La Couche de Contrôle d'Appels GoFonIA n'est pas conçue pour remplacer les agents humains. Elle est conçue pour redéfinir la division du travail entre humains et machines.
Les appels de routine — prise de rendez-vous, demandes d'état, FAQ simples — sont traités de manière entièrement autonome par l'agent IA. Les cas complexes — réclamations, négociations, conseil — sont transférés à un collègue humain avec un contexte complet et un briefing structuré. Le collègue prend l'appel avec un temps d'adaptation nul, car l'agent a déjà tout clarifié et documenté.
Le résultat : les centres d'appels ne deviennent pas plus petits. Ils deviennent meilleurs. Le travail répétitif disparaît. Le travail exigeant reste — et est soulagé par une préparation parfaite. Ce n'est pas de l'automatisation. C'est de l'augmentation.
Nous ne construisons pas une IA qui remplace les gens. Nous construisons une couche de contrôle qui orchestre 17 ans de connaissances en centres d'appels en temps réel — pour que les personnes dans le centre d'appels puissent enfin faire ce pour quoi elles sont vraiment là : résoudre des problèmes complexes. Pas remplir des formulaires.