Origin Intelligence
research · playbook

AI-Native Services Playbook

Notas curadas del playbook de Charlie Warren (Visiting Partner en Y Combinator) sobre las empresas que sustituirán a SaaS en la próxima década: servicios reconstruidos desde cero con IA, donde el producto es la operación.

🏢 Playbook: AI-Native Services Company

Charlie Warren — Visiting Partner, Y Combinator · Startup School · 3 jun 2026
YouTube (11:21) · Fuentes: StartupHub.ai, Teahose.com, BigGo Finance, Apple Podcasts, artículo companion de Warren en X/Substack

1. La Tesis Central

"Some of the biggest companies of the next decade won't be software businesses at all. They'll be services companies like insurance carriers and law firms rebuilt from scratch with AI doing most of the work."

Estas NO son empresas SaaS que venden herramientas. Son empresas de servicios que entregan resultados — declaraciones de impuestos completadas, reclamaciones de seguros liquidadas, aprobaciones de la FDA, veredictos legales.

El presupuesto del cliente ya existe (están reemplazando un proveedor externalizado), por lo que no se requiere cambio de comportamiento.

"The product is an operation."

Warren lo describe como una categoría de negocio nueva que no existía hace dos años. El TAM es toda la industria de servicios, no solo el slice de software.

"These companies provide the outcome to the customer versus build a copilot that the customer uses internally."

2. Capítulos del Video

01:01 Picking the Right Market
02:55 Markets YC Likes Right Now
03:43 The Sam Altman Test
04:35 The Right Founding Team
05:28 Building the Product
06:19 Variance Is the Existential Problem
07:08 The Early Demand Trap
07:53 How to Price AI Services
08:41 The P&L Walkthrough
09:33 AI Operating Leverage
10:27 Don't Buy Your Way In

3. Selección de Mercado

Los 4 Rasgos del Mercado Ideal

Rasgo Pregunta Diagnóstica Ejemplos
Low trust (confianza baja en proceso) ¿El trabajo ya se externaliza? ¿Al cliente le importa el resultado, no el proceso? Preparación fiscal, reclamaciones de seguros, hipotecas
Low judgment at task level ¿La mayoría de pasos se pueden automatizar, concentrando el juicio en pocos nodos human-in-the-loop? Consultoría regulatoria FDA (humanos manejan excepciones; el bulk es patrón)
High intelligence threshold ¿Es lo suficientemente difícil para requerir modelos + humanos? Trabajo legal (General Legal), filings regulatorios (Panacea)
Regulación como moat ¿Las expectativas de compliance elevan la barrera de entrada? FDA, licencias de seguros, estándares de auditoría

El Test de Sam Altman

"You should ask yourself: as the models get better, does your service get stronger or does the model itself commoditize you? You want to be in the first camp."
  • Si mejores modelos fortalecen tu servicio → negocio sostenible ✅
  • Si mejores modelos commoditizan tu servicio → vulnerable ❌
  • Aplicar este test en la fase de fundación, no después de escalar

Regulación es Feature, No Bug (Visión Contraria)

"Regulation could actually be good; regulated industries have higher expectations and legal accountability."

La regulación eleva la barrera para fundadores, creando moats competitivos y eliminando competidores débiles.

Mercados que YC Recomienda

✅ Buenos mercados

  • Tax / Impuestos
  • Auditoría
  • Seguros
  • Hipotecas
  • Partes de healthcare
  • Partes de logística

"There are plenty more markets nobody has touched yet."

❌ Mercados a evitar

  • Mercados con equipo físico y trabajo on-site
  • Cualquier cosa donde el trabajo no ocurre en pantallas

"Those are for robotics founders."

4. El Equipo Fundador — 3 Atributos

"For AI services specifically, there's three attributes that all the best founders share."
1
Domain Fluency
Experiencia directa es ideal, pero "aprendida" funciona si el fundador respira credibilidad y es obsesivo con aprender el dominio.
2
Model Fluency
Saber lo que los modelos frontier pueden hacer hoy y diseñar el producto para cabalgar su curva de mejora. Non-negotiable.
3
Operational Rigor — El atributo más infravalorado
"Topics like variance, throughput, cycle times, SOPs… You are fundamentally running an operation. You have to learn that skill set and you have to enjoy it or at least you have to respect it."

Sobre Construir Equipo

"You should build companies with people you already know and you've worked with."

Las relaciones establecidas reducen riesgo y mejoran la dinámica del equipo.

5. Construyendo el Producto

"The human is the interface of the customer, not the product. The product helps the human scale their work nonlinearly."

El setup invierte el software tradicional: el humano es la interfaz, no el producto. El producto (la IA + el sistema operativo) ayuda al humano a escalar de forma no-lineal.

3 Reglas Concretas

  1. Track variance como uptime — La uniformidad del output es la señal de calidad primaria
  2. Los humanos deben escalar non-linearly — Si revenue escala linealmente con headcount, el negocio tiene un problema estructural fatal
  3. Automatizar el proceso ES el producto — OK hacer cosas que no escalan al inicio, pero la trayectoria debe aumentar automation sin parar
"Be honest here so you're not papering over product shortcomings with actual humans."

6. Varianza: El Problema Existencial

"Variance is the existential problem."

"Customers will fire you for variance faster than they will fire you for being a bit slower or a bit more expensive than the incumbents. They need to trust the output. Inconsistency destroys trust, which causes churn."

Métricas Operativas = El Producto

📊
Throughput
(volumen/tiempo)
⏱️
Cycle Time
(velocidad de entrega)
📈
Gross Margin
(debe tender a 50%+)
👤
Revenue/Human
(debe escalar non-linear)
🎯
Output Variance
(consistencia existencial)

Trackear throughput y cycle time como trackearías DAUs en una empresa de software.

Humanos en el Loop = Asset de Escalado (Si se Hace Bien)

  • Humanos deben ser deliberadamente arquitecturados donde se requiere juicio genuino — no para tapar gaps del producto
  • Key test: Revenue debe escalar non-linearly relativo a adiciones de headcount

7. La Trampa de la Demanda Temprana

⚠️ El MAYOR desafío para AI-native service companies

La Espiral de Muerte

  1. Fundador anuncia AI service en mercado desatendido → pilotos se agolpan
  2. Cada piloto trae trabajo manual (onboarding, edge cases, excepciones)
  3. Equipo consumido cumpliendo contratos con labor humana en vez de construir producto
  4. No pueden invertir en automatización porque están demasiado ocupados entregando manualmente
  5. La empresa nunca se vuelve realmente AI-native
"It's easy to sign up a lot of pilot customers when you're just starting out and have nothing. But it can quickly overwhelm your ability to serve them and you won't be able to build the product to scale. You'll be stuck using humans. It is a literal trap."

El Consejo

"Cap your first pilot customers to a small handful. Resist the temptation to sign too many too quickly."

"The pilot is the product." No estandarices demasiado temprano. Usa los pilotos para descubrir dónde la IA da leverage único.

8. Estrategia de Pricing

El competidor es el costo del trabajo humano (interno o externalizado), NO otra suscripción SaaS.

"You have to sell outcomes, not seats or tokens."
ModeloVeredictoNotas
Per-unit pricing
(por return, claim, loan)
✅ Recomendado Limpio, fácil de explicar
Outcome-based pricing ✅ Recomendado "Aligns incentives beautifully but can be harder for you to forecast"
Cost-plus pricing ❌ Evitar "Caps your upside permanently. Don't do it."
Straight-line undercutting ❌ Evitar "Makes your work seem cheap and potentially low quality. Price on value."

⚠️ Cuidado con Pilotos de Margen Cero/Negativo

"Be deeply suspicious of zero margin or negative margin pilots. They're fine to learn from, but it's really dangerous to get hooked on those."

Los pilotos tempranos sientan precedente de pricing y pueden hacer estructuralmente imposible alcanzar los gross margins requeridos. La transición a unit economics positivos debe planearse desde el día uno.

9. El P&L y AI Operating Leverage

COGS para AI Services incluye:

  • Model costs (API calls a LLMs frontier)
  • Hosting/infraestructura
  • El elemento humano (labor human-in-the-loop)

La Apuesta del Margen: AI Operating Leverage

"The core bet here is, the more the product is built, the lower the COGS, the better the gross margin. I call this AI operating leverage."
Tipo de NegocioGross MarginTAM
Traditional services firms ~30% techo (revenue escala con headcount) Trillones (todo el gasto laboral)
Pure SaaS/software ~80% márgenes Menor (solo presupuestos IT)
AI-native services Target 50%+ márgenes Mercados 2-3x más grandes que software TAM
Más producto construido │ ▼ COGS baja (como % de revenue) │ ▼ Gross margin se expande │ ▼ → Hacia 50%+ margins → En mercados 2-3x más grandes que software TAMs ═══════════════════════════════════════════ La dinámica clave: Traditional: Revenue ───── escala linealmente ────── Headcount (30% margin ceiling) AI-Native: Revenue ───── escala NON-linearly ──── Headcount (50%+ margin target) El test: ¿Revenue/Human está creciendo over time? Si es flat → el AI no está dando leverage real

10. Build, Don't Buy

"You just can't acquire a product market fit. Legacy service businesses are, you know, legacy. They have different expectations on metrics, hiring, and performance. Adding AI on top of that doesn't immediately change any of those realities. Building is almost always better than buying."

Por qué adquirir un negocio legacy casi nunca funciona:

  • Legacy companies tienen cultura, métricas y expectativas arraigadas
  • No puedes comprar product-market fit
  • AI atornillada encima de operaciones legacy no hace la empresa AI-native
  • Las liabilities del legacy arrastran la transformación

Advertencias históricas: Compass (real estate), ScaleFactor (accounting), WeWork, Katerra — todos "tech-enabled services" que fallaron. "The lesson is not simply that margins matter. It's that services businesses fail when they cannot reliably produce quality at scale."

11. Casos Reales

💊 Panacea — FDA Regulatory AI

YC Spring 2026
Qué hacen:Consultoría regulatoria FDA AI-native para biotechs y medtechs
Equipo:2 fundadores
~90%
Trabajo automatizado por AI
12x
Entrega más rápida
50%
Objetivo: reducir timelines FDA
6-7 figs
Precio por engagement

Contexto: Desarrollo de fármacos normalmente toma 10-15 años, $1-2B por droga. El costo se duplica cada 9 años (Eroom's Law — inverso de Moore's Law).

Pricing innovation: Pricing fijo, basado en milestones (no facturación por hora). Pagas solo cuando se entregan los milestones.

"We're not selling the AI tools. We're owning the whole stack and selling the outcome. Faster, better and at lower cost."

Fundadores

  • Haris Javed-Akhtar (CEO) — MD, Imperial College; ex-Anterior (backed by Sequoia, NEA)
  • Yaman Ziadeh (CTO) — MS in AI, UIC; ex-AI Platform Engineer at Anterior

Pathways FDA soportados: IND, NDA, BLA, ODD, Pre-Subs, 510(k), De Novo, PMA, IDE, BDD

⚖️ General Legal — AI-Native Law Firm

YC Winter 2026
Qué hacen:Firma legal AI-native para contratos comerciales de growth-stage companies
Equipo:15 personas
320+
Companies representadas
95%
CSAT score
≤3h
Median first turn (vs días/semanas)
10x
Eficiencia vs abogados tradicionales

Pricing

ServicioPrecioDetalle
Simple Contract Review$250/contrato≤3 páginas
Standard Contract Review$500/contrato3-25 páginas (más común)
Full Negotiation$1,000/contratoTurns ilimitados
Drafting$2,000/documentoRedacción completa

Comparado con $500-$2,000/hora en firmas tradicionales.

Innovación Operativa: Shift Work

Usan trabajo por turnos como arma competitiva — simultáneamente reduce cycle times Y atrae top legal talent que quiere horarios no-tradicionales. Una elección operativa que se compone en ventaja de throughput.

Fundadores

  • Ryan Walker (CEO) — PhD en Matemáticas, CTO de CaseText (YC13, adquirida por Thomson Reuters 2023)
  • J.P. Mohler — iOS/Android dev → Harvard Law → Cooley & WilmerHale
  • Javed Qadruddin — Harvard Law → Fenwick & West → Engineering → Meta → AI lead en CaseText

12. Artículo Companion (X/Substack, 3 jun 2026)

"AI Native Service Companies: Variance as the Enemy of Trust" — Publicado el mismo día que el video, añade profundidad significativa.

Framework de Deming: Special vs Common Cause Variation

  • Common cause = ruido esperado → mejora sistémica de proceso
  • Special cause = breakdowns específicos que destruyen confianza → fixes urgentes y dirigidos

Concepto Original: "Process Evals"

"Model evals judge technology outputs alone. AI native service companies need 'process evals' for the entire system, including humans."

Métricas de Process Evals

  • Reviewer disagreement rates
  • Exception rates
  • Rework rates
  • Detalles de escalación
  • Errores reportados por clientes
  • Si ciertos humanos o handoffs crean modos de fallo repetibles
"Creating these internal process evals will become the core IP of these businesses."
"The winners will measure the humans, not just the models."

Little's Law y Kingman's Formula

Warren recomienda a los fundadores aprender estas — contraintuitivamente, la holgura en el sistema amortigua contra tiempos de espera que crecen exponencialmente. Maximizar la utilización de humans-in-the-loop para impresionar a VCs es una trampa.

Oportunidad de Startup Identificada

"Third-party benchmarking of AI native services. Silicon Valley, meet the staid world of Six Sigma."

13. Todas las Citas Directas Extraídas

  1. "Some of the biggest companies of the next decade won't be software businesses at all. They'll be services companies like insurance carriers and law firms rebuilt from scratch with AI doing most of the work."
  2. "The product is an operation."
  3. "The core bet here is, the more the product is built, the lower the COGS, the better the gross margin. I call this AI operating leverage."
  4. "Customers will fire you for variance faster than they will fire you for being a bit slower or a bit more expensive than the incumbents."
  5. "As the models get better, does your service get stronger or does the model itself commoditize you?"
  6. "For AI services specifically, there's three attributes that all the best founders share."
  7. "Topics like variance, throughput, cycle times, SOPs… You are fundamentally running an operation."
  8. "The human is the interface of the customer, not the product."
  9. "It's easy to sign up a lot of pilot customers when you're just starting out. But it can quickly overwhelm your ability to serve them... It is a literal trap."
  10. "Cap your first pilot customers to a small handful."
  11. "Cost plus pricing caps your upside permanently. Don't do it."
  12. "Be deeply suspicious of zero margin or negative margin pilots."
  13. "You just can't acquire a product market fit."
  14. "Be honest here so you're not papering over product shortcomings with actual humans."
  15. "Regulation could actually be good."
  16. "You should build companies with people you already know and you've worked with."
  17. "We're still early here. Like most things in AI, the market is moving fast."
  18. "These companies provide the outcome to the customer versus build a copilot that the customer uses internally."
  19. "There's also outcome-based pricing; this aligns incentives beautifully."
  20. "Straight line undercutting makes your work seem cheap and potentially low quality. Price on value."

Framework Visual Completo

╔══════════════════════════════════════════════════════════════╗ ║ AI-NATIVE SERVICES COMPANY PLAYBOOK ║ ║ Charlie Warren · YC · 2026 ║ ╠══════════════════════════════════════════════════════════════╣ ║ ║ ║ 1. MERCADO 2. EQUIPO 3. PRODUCTO ║ ║ ┌─────────────┐ ┌─────────────┐ ┌──────────────┐ ║ ║ │ Low trust │ │ Domain │ │ El proceso │ ║ ║ │ Low judgment │ │ fluency │ │ ES el │ ║ ║ │ High intel │ │ │ │ producto │ ║ ║ │ Regulation │ │ Model │ │ │ ║ ║ │ = moat │ │ fluency │ │ Humanos = │ ║ ║ │ │ │ (non-neg) │ │ interfaz │ ║ ║ │ + SAM ALTMAN │ │ │ │ no producto │ ║ ║ │ TEST │ │ Operational │ │ │ ║ ║ │ │ │ rigor │ │ Track como │ ║ ║ │ "¿Mejores │ │ (underval.) │ │ DAUs: │ ║ ║ │ modelos te │ └─────────────┘ │ throughput │ ║ ║ │ fortalecen │ │ cycle time │ ║ ║ │ o te │ │ variance │ ║ ║ │ commoditi- │ └──────────────┘ ║ ║ │ zan?" │ ║ ║ └─────────────┘ ║ ║ ║ ║ 4. DEMANDA 5. PRICING 6. P&L ║ ║ ┌─────────────┐ ┌─────────────┐ ┌──────────────┐ ║ ║ │ ⚠ TRAMPA: │ │ ✅ Per-unit │ │ COGS = │ ║ ║ │ No firmes │ │ ✅ Outcome │ │ models + │ ║ ║ │ demasiados │ │ ❌ Cost-plus│ │ hosting + │ ║ ║ │ pilotos │ │ ❌ Undercut │ │ humanos │ ║ ║ │ │ │ │ │ │ ║ ║ │ "Cap a un │ │ Vender │ │ AI Operating │ ║ ║ │ puñado" │ │ OUTCOMES │ │ Leverage: │ ║ ║ │ │ │ no seats │ │ + producto → │ ║ ║ │ Pilot = │ │ ni tokens │ │ - COGS → │ ║ ║ │ producto │ │ │ │ + margin │ ║ ║ │ │ │ ⚠ Zero/neg │ │ │ ║ ║ │ No estand. │ │ margin = │ │ Target: │ ║ ║ │ demasiado │ │ peligro │ │ 50%+ margin │ ║ ║ │ temprano │ └─────────────┘ │ 2-3x TAM │ ║ ║ └─────────────┘ └──────────────┘ ║ ║ ║ ║ 7. BUILD > BUY BONUS: PROCESS EVALS ║ ║ ┌──────────────┐ ┌────────────────────────────┐ ║ ║ │ No adquieras │ │ "Los ganadores medirán │ ║ ║ │ legacy │ │ a los HUMANOS, no solo │ ║ ║ │ │ │ a los modelos." │ ║ ║ │ "No puedes │ │ │ ║ ║ │ comprar │ │ Process Evals → core IP │ ║ ║ │ PMF" │ │ Little's Law → slack good │ ║ ║ └──────────────┘ │ Six Sigma meets Silicon V. │ ║ ║ └────────────────────────────┘ ║ ╚══════════════════════════════════════════════════════════════╝

Video y Autor

Empresas Mencionadas

Fuentes de Contenido

Conceptos Referenciados

  • Eroom's Law (inverso Moore's Law para pharma)
  • Little's Law (queuing theory)
  • Kingman's Formula (wait time vs utilization)
  • Deming's Special vs Common Cause Variation
  • Six Sigma (quality management)

Compilado 8 junio 2026. Fuentes: StartupHub.ai, Teahose.com, BigGo Finance, UseTranscribe.io, Apple Podcasts, artículo companion de Warren.
Transcripción directa del video no disponible (YouTube bloquea cloud IPs). Contenido reconstruido de 6+ fuentes detalladas.