Synthèse — mai 2026
Le GTM pyannote tel qu'il a été compris. Le plan tel qu'il aurait été construit.
Deux entretiens, un sujet travaillé en profondeur. Ce document en est la synthèse — pas un exercice de style, pas une relance. Une base de travail.
Signal OSS40M dl/mois
CA hors US~20% — Europe à construire
MomentPLG → enterprise
PrioritéPlaybook outbound à zéro
Lecture executive
Quatre angles pour lire pyannoteAI au moment où elle en est.
L'entreprise
De la recherche CNRS au produit enterprise
pyannote.audio est devenu standard de marché sur la diarisation. pyannoteAI commercialise cette expertise : modèles premium, API, on-prem, SLA. 40M dl/mois côté OSS, ~4M ARR côté commercial, seed 8.1M EUR bouclé en 2025.
Le marché
Concurrence indirecte — levée à préparer
AssemblyAI, Deepgram, Speechmatics sur le STT ; Whisper comme baseline open source. Aucun ne se spécialise sur la couche speaker avec ce niveau de recherche. La prochaine levée se profile fin 2026 / début 2027 — les métriques enterprise qui se construisent maintenant en seront le socle.
Le GTM
Transformer le signal OSS en pipeline enterprise
Le signal existe déjà — utilisateurs en production, inbound structuré, communauté Hugging Face active. Le travail est de le qualifier et de le convertir, pas de le créer. Motion PLG-to-enterprise, pas cold outbound générique.
Le rôle
Founding AE — builder, pas exécutant
Écrire le playbook qui n'existe pas. Coordonner RevOps, product, pre-sales. Convertir les premières opportunités enterprise tout en rendant la machine transmissible. Pas gérer un CRM déjà instrumenté.
La question commerciale n'est pas "qui a besoin de diarisation ?" — c'est "chez qui une erreur speaker devient-elle un problème business, produit, compliance ou sécurité assez important pour payer ?"
Entretien #1 — 27 avril 2026
Pierre-Baptiste Viougeat
Lecture GTM après l'échange. Fit, rôle, culture, inbound/outbound, Applied AI, signaux OSS, organisation.
Ce que l'entretien a cristallisé
Six points qui structurent la lecture du poste.
Signal
40M dl/mois — avantage sous-exploité
Une large partie des "prospects" sont déjà utilisateurs. L'outbound ne convainc pas — il identifie le moment de bascule : SLA, accuracy, souveraineté, support.
Rôle
Builder, pas exécutant
Écrire le playbook qui n'existe pas. Coordonner RevOps, product, pre-sales. Rendre la machine transmissible avant de recruter. Pas gérer un CRM déjà instrumenté.
Canal
Cold call ≠ canal principal
Hugging Face, GitHub, inbound, usage API, job posts, funding. La compétence clé : qualifier ces signaux — pas générer du volume téléphonique.
Profil
Tech-native — pas ingénieur
DER, latence end-to-end, on-prem vs cloud, STT orchestration. Assez pour tenir face à un interlocuteur technique. Pas assez pour remplacer le pre-sales.
Applied AI
Qualifier avant d'impliquer
Les projets custom mobilisent l'équipe tech. Données, labels, droits, GPU, budget, timeline : cadrer strictement avant d'ouvrir la porte. Sinon c'est de la R&D gratuite.
Équipe
Science/tech fort, GTM en construction
RevOps, PMM, pre-sales, Applied AI : recrutés ou à recruter. Le premier commercial arrive dans un environnement technique fort — sans infrastructure GTM stabilisée.
Ce que ça implique pour le profil.
Comprendre sans être ingénieur. Avoir déjà écrit un playbook quand il n'existait pas. Avoir travaillé dans des environnements sensibles — santé, finance, défense, grands comptes — où le cycle est long, le buyer est multiple, et la donnée est contrainte.
Entretien #2 — 29 avril 2026
Vincent Molina, CEO
Vision du moment de marché. Enterprise, open source funnel, temps réel, orchestration, US.
Trois points structurants de la vision CEO
Ce que l'échange a produit comme lecture du GTM.
Géographie
80% US — Europe à structurer
La souveraineté data européenne est un levier commercial réel. Structurer une motion enterprise en Europe est complémentaire de la traction US, pas antagoniste.
Produit
Enterprise, temps réel, intégration
Ne pas remplacer le STT du client — s'intégrer dans ce qu'il a déjà. La valeur est dans la couche speaker, pas dans la substitution de stack.
Open source
Distribution, pas concurrence
L'OSS a fait le travail de conviction. Le job commercial : identifier le moment où un utilisateur OSS a besoin de quality, SLA, support ou on-prem.
Lecture du moment de marché
L'inflexion PLG → enterprise et ce qu'elle implique commercialement.
Inflexion
De PLG à enterprise structuré
pyannoteAI est au moment où l'adoption technique se transforme en machine commerciale. Ce qui se construit maintenant détermine la capacité à signer des deals à six chiffres dans 12 mois.
Positionnement
Couche speaker agnostique du STT
Partner-safe avec les STT providers. Le message commercial gagne à ne pas positionner pyannote comme un remplaçant — mais comme un renfort qui fiabilise l'attribution speaker sans toucher au reste de la stack.
La question commerciale n'est pas "qui a besoin de diarisation ?" — c'est "chez qui une erreur speaker devient-elle un problème business, produit, compliance ou sécurité assez important pour payer ?"
DAY 1 — Plan
Architecture du playbook outbound tel qu'il aurait été construit.
Pas un document de 80 pages. Un système d'apprentissage organisé — avec une architecture modulaire, des plays testables, et des hypothèses à valider ou tuer rapidement.
Trois éléments structurants
Ce qui conditionne toute l'architecture du playbook.
Structurant #1
40M dl/mois à scorer, pas à créer
Le signal existe. RevOps + données usage = premier avantage outbound. Identifier le moment de bascule — SLA, accuracy, souveraineté, on-prem — avant toute séquence.
Structurant #2
Il y a toujours un ingénieur dans la boucle
Un message qui ne peut pas parler DER, latence, on-prem ou fine-tuning se fait éjecter. Ça conditionne le profil, les séquences et la façon d'entrer dans un compte.
Structurant #3
Fenêtre d'inflexion ouverte maintenant
Ce qui se construit aujourd'hui détermine la capacité à signer des deals à six chiffres dans 12 mois. Apprendre vite — pas documenter parfaitement.
4 ICP — 6 premiers mois
Dans l'ordre où chaque module débloque du revenu.
ICP 1 — Prioritaire
Conversation Intelligence / note-takers
Cycle court, douleur speaker aiguë, interlocuteur technique mature. Speaker attribution visible par l'utilisateur final. Terrain d'apprentissage idéal pour les 60 premiers jours.
ICP 2
Customer Service / contact centers
Volume important, ACV élevés, buyers multiples — CCaaS, BPO, analytics interne. Patterns agent/client très reproductibles sur QA et compliance.
ICP 3
Défense / public sensible
Souveraineté, on-prem, route via intégrateurs (Thales, Airbus DS, Atos). Pas d'outbound standard — approche warm, cadrage strict. ACV fort, cycle 3-6 mois.
ICP 4
Medical scribes
Vertical en forte croissance, sensibilité HIPAA/HDS, attribution médecin/patient critique. Route via plateformes verticales — pas directement les hôpitaux.
90 jours — 4 phases
Sem. 1–3Scorer les signaux
RevOps + données OSS/Hugging Face. CRM, inbound, 10 utilisateurs interrogés.
Top 100 comptes scorés et tiérés.
Sem. 3–6Construire le messaging
Messages ICP × persona à partir du Tier 1. 3 séquences testables par ICP.
Séquences prêtes à tester — pas à perfectionner.
Sem. 6–9Lancer 2–3 plays
Reply rate, meeting rate, qualified opp rate. Vraies objections documentées.
Premières métriques honnêtes.
Sem. 9–12Tuer, doubler, documenter
Couper sans attendre. Doubler sur ce qui répond. Draft v1 + roadmap 6 mois.
Ce qu'on tue, ce qu'on scale, les inconnues restantes.
Trois inconnues honnêtes
Ce qu'on ne peut pas savoir avant d'être dedans.
Inconnue #1
Quelle ICP convertit le mieux à froid
Hypothèse : les note-takers — techniquement matures, douleur diarisation aiguë. À invalider vite si la donnée terrain dit autre chose.
Inconnue #2
La vraie killer objection en deal review
Probablement la comparaison de DER sur datasets spécifiques face à Whisper fine-tuné. À valider en POC — pas en slide.
Inconnue #3
Le modèle pricing qui scale
La frontière PLG / sales-assisted / enterprise se dessine après les 20 premiers deals. Toute hypothèse préalable est une approximation.
Ce qui distingue un playbook qui tient d'un PDF qu'on ne relit jamais : le rythme d'itération, pas l'élégance du document.
Comptes identifiés
Une poignée de comptes bien alignés avec pyannoteAI.
Note-takers, conversation intelligence, un dossier défense. Pas une liste exhaustive — un premier signal de ce que l'outbound aurait pu produire.
SegmentConversation Intelligence
SegmentNote-takers
SegmentDéfense / souveraineté
DisponibilitéPour en parler
Critères de sélection
Ce qui rend un compte prioritaire dans la logique pyannoteAI.
Critère 1
Pain speaker documenté
Corrections manuelles, mauvais speaker dans les summaries, confusion agent/client, analytics peu fiables, compliance fragilisée. Le pain doit être visible — pas supposé.
Critère 2
Pipeline audio existante en production
Pas un prospect qui "pourrait utiliser de la diarisation un jour". Un compte qui a déjà du volume, un STT en place, et un besoin de fiabiliser la couche speaker.
Critère 3
Route d'achat identifiable
Buyer technique clair, economic buyer accessible, trigger récent (funding, product launch, job post, compliance). Pas un logo sans chemin d'entrée.
Critère 4
POC mesurable
Dataset représentatif disponible, baseline existante, critères de succès définissables avant le test. Sinon c'est une expérimentation gratuite, pas une opportunité commerciale.
Disponible pour en parler si c'est utile.
Quelques comptes déjà identifiés sur ces critères — note-takers, conversation intelligence, un dossier défense. Pas pour rouvrir un process, mais parce que c'est là où le travail a mené.