Synthèse — mai 2026

Le GTM pyannote tel qu'il a été compris. Le plan tel qu'il aurait été construit.

Deux entretiens, un sujet travaillé en profondeur. Ce document en est la synthèse — pas un exercice de style, pas une relance. Une base de travail.

Signal OSS40M dl/mois

CA hors US~20% — Europe à construire

MomentPLG → enterprise

PrioritéPlaybook outbound à zéro

Lecture executive

Quatre angles pour lire pyannoteAI au moment où elle en est.

L'entreprise

De la recherche CNRS au produit enterprise

pyannote.audio est devenu standard de marché sur la diarisation. pyannoteAI commercialise cette expertise : modèles premium, API, on-prem, SLA. 40M dl/mois côté OSS, ~4M ARR côté commercial, seed 8.1M EUR bouclé en 2025.

Le marché

Concurrence indirecte — levée à préparer

AssemblyAI, Deepgram, Speechmatics sur le STT ; Whisper comme baseline open source. Aucun ne se spécialise sur la couche speaker avec ce niveau de recherche. La prochaine levée se profile fin 2026 / début 2027 — les métriques enterprise qui se construisent maintenant en seront le socle.

Le GTM

Transformer le signal OSS en pipeline enterprise

Le signal existe déjà — utilisateurs en production, inbound structuré, communauté Hugging Face active. Le travail est de le qualifier et de le convertir, pas de le créer. Motion PLG-to-enterprise, pas cold outbound générique.

Le rôle

Founding AE — builder, pas exécutant

Écrire le playbook qui n'existe pas. Coordonner RevOps, product, pre-sales. Convertir les premières opportunités enterprise tout en rendant la machine transmissible. Pas gérer un CRM déjà instrumenté.

La question commerciale n'est pas "qui a besoin de diarisation ?" — c'est "chez qui une erreur speaker devient-elle un problème business, produit, compliance ou sécurité assez important pour payer ?"

Entretien #1 — 27 avril 2026

Pierre-Baptiste Viougeat

Lecture GTM après l'échange. Fit, rôle, culture, inbound/outbound, Applied AI, signaux OSS, organisation.

Ce que l'entretien a cristallisé

Six points qui structurent la lecture du poste.

Signal

40M dl/mois — avantage sous-exploité

Une large partie des "prospects" sont déjà utilisateurs. L'outbound ne convainc pas — il identifie le moment de bascule : SLA, accuracy, souveraineté, support.

Rôle

Builder, pas exécutant

Écrire le playbook qui n'existe pas. Coordonner RevOps, product, pre-sales. Rendre la machine transmissible avant de recruter. Pas gérer un CRM déjà instrumenté.

Canal

Cold call ≠ canal principal

Hugging Face, GitHub, inbound, usage API, job posts, funding. La compétence clé : qualifier ces signaux — pas générer du volume téléphonique.

Profil

Tech-native — pas ingénieur

DER, latence end-to-end, on-prem vs cloud, STT orchestration. Assez pour tenir face à un interlocuteur technique. Pas assez pour remplacer le pre-sales.

Applied AI

Qualifier avant d'impliquer

Les projets custom mobilisent l'équipe tech. Données, labels, droits, GPU, budget, timeline : cadrer strictement avant d'ouvrir la porte. Sinon c'est de la R&D gratuite.

Équipe

Science/tech fort, GTM en construction

RevOps, PMM, pre-sales, Applied AI : recrutés ou à recruter. Le premier commercial arrive dans un environnement technique fort — sans infrastructure GTM stabilisée.

Ce que ça implique pour le profil. Comprendre sans être ingénieur. Avoir déjà écrit un playbook quand il n'existait pas. Avoir travaillé dans des environnements sensibles — santé, finance, défense, grands comptes — où le cycle est long, le buyer est multiple, et la donnée est contrainte.

Entretien #2 — 29 avril 2026

Vincent Molina, CEO

Vision du moment de marché. Enterprise, open source funnel, temps réel, orchestration, US.

Trois points structurants de la vision CEO

Ce que l'échange a produit comme lecture du GTM.

Géographie 80% US — Europe à structurer

La souveraineté data européenne est un levier commercial réel. Structurer une motion enterprise en Europe est complémentaire de la traction US, pas antagoniste.

Produit Enterprise, temps réel, intégration

Ne pas remplacer le STT du client — s'intégrer dans ce qu'il a déjà. La valeur est dans la couche speaker, pas dans la substitution de stack.

Open source Distribution, pas concurrence

L'OSS a fait le travail de conviction. Le job commercial : identifier le moment où un utilisateur OSS a besoin de quality, SLA, support ou on-prem.

Lecture du moment de marché

L'inflexion PLG → enterprise et ce qu'elle implique commercialement.

Inflexion

De PLG à enterprise structuré

pyannoteAI est au moment où l'adoption technique se transforme en machine commerciale. Ce qui se construit maintenant détermine la capacité à signer des deals à six chiffres dans 12 mois.

Positionnement

Couche speaker agnostique du STT

Partner-safe avec les STT providers. Le message commercial gagne à ne pas positionner pyannote comme un remplaçant — mais comme un renfort qui fiabilise l'attribution speaker sans toucher au reste de la stack.

DAY 1 — Plan

Architecture du playbook outbound tel qu'il aurait été construit.

Pas un document de 80 pages. Un système d'apprentissage organisé — avec une architecture modulaire, des plays testables, et des hypothèses à valider ou tuer rapidement.

Trois éléments structurants

Ce qui conditionne toute l'architecture du playbook.

Structurant #1

40M dl/mois à scorer, pas à créer

Le signal existe. RevOps + données usage = premier avantage outbound. Identifier le moment de bascule — SLA, accuracy, souveraineté, on-prem — avant toute séquence.

Structurant #2

Il y a toujours un ingénieur dans la boucle

Un message qui ne peut pas parler DER, latence, on-prem ou fine-tuning se fait éjecter. Ça conditionne le profil, les séquences et la façon d'entrer dans un compte.

Structurant #3

Fenêtre d'inflexion ouverte maintenant

Ce qui se construit aujourd'hui détermine la capacité à signer des deals à six chiffres dans 12 mois. Apprendre vite — pas documenter parfaitement.

4 ICP — 6 premiers mois

Dans l'ordre où chaque module débloque du revenu.

ICP 1 — Prioritaire

Conversation Intelligence / note-takers

Cycle court, douleur speaker aiguë, interlocuteur technique mature. Speaker attribution visible par l'utilisateur final. Terrain d'apprentissage idéal pour les 60 premiers jours.

ICP 2

Customer Service / contact centers

Volume important, ACV élevés, buyers multiples — CCaaS, BPO, analytics interne. Patterns agent/client très reproductibles sur QA et compliance.

ICP 3

Défense / public sensible

Souveraineté, on-prem, route via intégrateurs (Thales, Airbus DS, Atos). Pas d'outbound standard — approche warm, cadrage strict. ACV fort, cycle 3-6 mois.

ICP 4

Medical scribes

Vertical en forte croissance, sensibilité HIPAA/HDS, attribution médecin/patient critique. Route via plateformes verticales — pas directement les hôpitaux.

90 jours — 4 phases

Sem. 1–3Scorer les signaux

RevOps + données OSS/Hugging Face. CRM, inbound, 10 utilisateurs interrogés.

Top 100 comptes scorés et tiérés.

Sem. 3–6Construire le messaging

Messages ICP × persona à partir du Tier 1. 3 séquences testables par ICP.

Séquences prêtes à tester — pas à perfectionner.

Sem. 6–9Lancer 2–3 plays

Reply rate, meeting rate, qualified opp rate. Vraies objections documentées.

Premières métriques honnêtes.

Sem. 9–12Tuer, doubler, documenter

Couper sans attendre. Doubler sur ce qui répond. Draft v1 + roadmap 6 mois.

Ce qu'on tue, ce qu'on scale, les inconnues restantes.

Trois inconnues honnêtes

Ce qu'on ne peut pas savoir avant d'être dedans.

Inconnue #1

Quelle ICP convertit le mieux à froid

Hypothèse : les note-takers — techniquement matures, douleur diarisation aiguë. À invalider vite si la donnée terrain dit autre chose.

Inconnue #2

La vraie killer objection en deal review

Probablement la comparaison de DER sur datasets spécifiques face à Whisper fine-tuné. À valider en POC — pas en slide.

Inconnue #3

Le modèle pricing qui scale

La frontière PLG / sales-assisted / enterprise se dessine après les 20 premiers deals. Toute hypothèse préalable est une approximation.

Ce qui distingue un playbook qui tient d'un PDF qu'on ne relit jamais : le rythme d'itération, pas l'élégance du document.

Comptes identifiés

Une poignée de comptes bien alignés avec pyannoteAI.

Note-takers, conversation intelligence, un dossier défense. Pas une liste exhaustive — un premier signal de ce que l'outbound aurait pu produire.

SegmentConversation Intelligence

SegmentNote-takers

SegmentDéfense / souveraineté

DisponibilitéPour en parler

Critères de sélection

Ce qui rend un compte prioritaire dans la logique pyannoteAI.

Critère 1

Pain speaker documenté

Corrections manuelles, mauvais speaker dans les summaries, confusion agent/client, analytics peu fiables, compliance fragilisée. Le pain doit être visible — pas supposé.

Critère 2

Pipeline audio existante en production

Pas un prospect qui "pourrait utiliser de la diarisation un jour". Un compte qui a déjà du volume, un STT en place, et un besoin de fiabiliser la couche speaker.

Critère 3

Route d'achat identifiable

Buyer technique clair, economic buyer accessible, trigger récent (funding, product launch, job post, compliance). Pas un logo sans chemin d'entrée.

Critère 4

POC mesurable

Dataset représentatif disponible, baseline existante, critères de succès définissables avant le test. Sinon c'est une expérimentation gratuite, pas une opportunité commerciale.

Disponible pour en parler si c'est utile. Quelques comptes déjà identifiés sur ces critères — note-takers, conversation intelligence, un dossier défense. Pas pour rouvrir un process, mais parce que c'est là où le travail a mené.