Proveedores de IA

🏆 Tier S — Proveedores de LLMs con API (Principales)

OpenAI API

Líder del mercado. GPT-5, o3, o4-mini, GPT-4.1, Codex, realtime audio, image generation. API muy madura y amplia documentación.

Modelos clave: gpt-5, gpt-5.1, gpt-5.2, gpt-5.3-codex, o3, o4-mini, gpt-4.1, gpt-4o, gpt-4o-mini, gpt-image-1, gpt-oss-20b/120b (open weights)

API: variable según modelo y tier (Standard/Provisioned/Batch)

→ platform.openai.com

Anthropic (Claude) API AGENTE

Referente en reasoning, coding y seguridad. Claude Code es uno de los agentes de programación más potentes del mercado.

Modelos clave: claude-opus-4-6, claude-sonnet-4-6, claude-haiku-4-5

Opus 4.6: $5/$25 por MTok | Sonnet 4.6: $3/$15 | Haiku 4.5: $1/$5

→ claude.com

Google (Gemini) API FREE TIER

API muy generosa con free tier. Modelos multimodales avanzados, agentes de research, computer use, generación nativa de imagen/video.

Modelos clave: gemini-3.1-pro, gemini-3.1-flash, gemini-3-flash, gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-flash-lite, imagen-4, veo-3.1

2.5 Flash: $0.30/$2.50 por MTok | 2.5 Pro: $1.25/$10 | Free tier muy generoso

→ ai.google.dev

xAI (Grok) API

API de Elon Musk. Grok con acceso a X/Twitter en tiempo real. Creciendo rápido en capacidades de reasoning y generación.

Modelos clave: Grok (varias versiones), Grok Heavy

Consultar console.x.ai para pricing actual

→ console.x.ai

🥇 Tier A — Proveedores de LLMs con API (Alternativas sólidas)

Mistral AI API OPEN WEIGHTS

Europeo. Excelentes modelos open-weight y plataforma empresarial (Mistral Studio). Especialistas en code agents con Devstral y Codestral.

Modelos clave: mistral-large-3, mistral-medium-3.1, mistral-small-4, ministral-3, magistral, codestral, devstral-2, pixtral

Variable según modelo y tier

→ mistral.ai

Cohere API

Enfoque enterprise. Modelos multilingües (Aya), embeddings, rerank y herramientas de RAG. Muy fuerte en retrieval.

Modelos clave: command-a, command-r+, command-r7b, aya-expanse, aya-vision, embed-4, rerank-4

Command: ~$1/$2 por MTok | Aya: ~$0.50/$1.50

→ cohere.com

DeepSeek API OPEN WEIGHTS

Chino. Modelos de reasoning muy competitivos y baratos. DeepSeek-R1 rivaliza con o1 a una fracción del costo.

Modelos clave: deepseek-r1, deepseek-v3, deepseek-v3.1, deepseek-v3.2, deepseek-coder

Muy económico. Verificar en platform.deepseek.com

→ platform.deepseek.com

Perplexity API

API especializada en búsqueda web con citas. Ideal para RAG y agentes que necesitan información actualizada.

Modelos: Sonar (varios tamaños), acceso a modelos third-party

Por consulta + tokens

→ docs.perplexity.ai

🛠️ Agregadores / Inference Providers (Una API, muchos modelos)

OpenRouter API

API unificada para cientos de modelos. Drop-in replacement de OpenAI. Fallbacks automáticos y selección por precio/velocidad.

→ openrouter.ai

Hugging Face Inference Providers API FREE TIER

Proxy unificado para múltiples proveedores: Together, Fireworks, Groq, Replicate, Cerebras, SambaNova, etc. Un solo token HF.

Generoso free tier. Sin markup sobre proveedores.

→ huggingface.co/docs/inference-providers

Together AI API

Inference de modelos open-source. Fine-tuning, training y GPU clusters (H100, B200).

→ together.ai

Fireworks AI API

Inference rápido de modelos open-source. Precios competitivos por tamaño de modelo.

<4B: $0.10/MTok | 4B-16B: $0.20 | >16B: $0.90 | DeepSeek V3: $0.56/$1.68

→ fireworks.ai

Groq API

Velocidad extrema en inference de modelos open-source. Compound systems con tool use integrado.

Llama 3.1 8B: $0.05/$0.08 | GPT-OSS 20B: $0.075/$0.30 | Llama 3.3 70B: $0.59/$0.79

→ groq.com

Replicate API

Marketplace de modelos open-source. Pagas por tiempo de ejecución en GPU. Ideal para experimentar.

CPU: $0.36/hr | T4: $0.81/hr | A100: $5.04/hr | H100: $5.49/hr

→ replicate.com

👨‍💻 Agentes de Programación (Coding Agents)

Claude Code AGENTE

Agente de Anthropic para terminal, IDE y web. Explora código, edita archivos, ejecuta tests, crea PRs. Probablemente el más capaz actualmente para tareas complejas.

Incluido en Pro ($20/mes) y Max. También disponible via API pago por uso.

→ claude.com/code

Cursor AGENTE

IDE basado en VS Code con agentes de IA integrados. Autocomplete mágico, chat con contexto de codebase, agent mode para tareas autónomas.

Pro: $20/mes | Business: $40/usuario/mes

→ cursor.com

Windsurf AGENTE

IDE de Codeium con "Cascade". Memoria de codebase, ejecución de comandos de terminal, preview de servidores, MCP integrado.

Planes por suscripción. Revisar windsurf.com/pricing

→ windsurf.com

GitHub Copilot AGENTE

El más adoptado mundialmente. Inline completions, chat, agent mode, code review, PR assistance. Integrado nativamente en GitHub.

Free: 2,000 completions + 50 chat/mes | Pro: $10/mes | Pro+: $39/mes

→ github.com/features/copilot

Aider AGENTE OPEN SOURCE

Agente de programación en terminal. Conecta con casi cualquier LLM (local o API). Edita múltiples archivos, usa git, integra con tests/lint.

Gratis (open source)

→ aider.chat

v0 by Vercel AGENTE

Genera aplicaciones web full-stack desde prompts. Deploy instantáneo a Vercel. Ideal para prototipos rápidos y componentes UI.

→ v0.dev

Bolt.new AGENTE

Builder de apps y websites por chat. Integra agents de OpenAI, Anthropic, etc. Backend cloud incluido.

→ bolt.new

Lovable.dev AGENTE

Plataforma no-code para construir apps y websites conversando con IA. Orientado a founders y no-tecnicos.

→ lovable.dev

🔧 Frameworks de Agentes (Para construir tus propios agentes)

LangChain / LangGraph OPEN SOURCE

El ecosistema más grande. LangChain para abstracciones, LangGraph para orquestación de agentes multi-step. LangSmith para observabilidad.

→ langchain.com

CrewAI OPEN SOURCE

Framework multi-agent muy popular. AMP (Agent Management Platform) para empresas. Visual editor + APIs.

→ crewai.com

Agno (antes Phidata) OPEN SOURCE

Framework + runtime (AgentOS). Muy rápido, privado por diseño, corre en tu cloud. Memoria, conocimiento, tools, guardrails.

Open source + AgentOS enterprise

→ agno.com

smolagents (Hugging Face) OPEN SOURCE

Framework minimalista (~1000 líneas). Enfocado en "code agents" — los agentes escriben y ejecutan Python en lugar de JSON.

→ smolagents.org

Microsoft AutoGen OPEN SOURCE

Framework de Microsoft para orquestar múltiples agentes conversacionales. Muy potente para workflows complejos.

→ microsoft.github.io/autogen

LlamaIndex OPEN SOURCE

Especialistas en RAG y document processing. LlamaParse es el OCR agentic más avanzado del mercado.

→ llamaindex.ai

n8n OPEN SOURCE

Automatización de workflows visual + AI. Self-hostable. MCP support. Human-in-the-loop.

→ n8n.io

🎬 Herramientas Generativas Multimedia con API

ElevenLabs API

Líder en TTS (Text-to-Speech), voice cloning, music generation, sound effects, y voice agents conversacionales.

Modelos: Eleven v3, Eleven Flash, Eleven Multilingual v2, Eleven Music, Scribe v2

→ elevenlabs.io

Runway API

Generación de video state-of-the-art. Gen-4.5, GWM-1 (General World Model), y API de personajes conversacionales en video.

→ runwayml.com

Synthesia API

Plataforma de video AI para empresas. Avatares, voiceovers en 160+ idiomas. Muy usado en training y marketing.

→ synthesia.io

Descript API

Edición de video/audio como si fuera texto. Transcripción, regeneración de voz, eye contact, green screen.

→ descript.com

🏠 Local / Self-Hosted

Ollama OPEN SOURCE

Ejecuta modelos localmente de forma sencilla. Biblioteca enorme: Llama, DeepSeek, Qwen, Gemma, Mistral, etc.

→ ollama.com/library

vLLM / TGI OPEN SOURCE

Engines de inference de alta performance para servir modelos open-source en producción.

📊 Tabla comparativa rápida — Modelos de programación

Modelo	Proveedor	Precio input	Precio output	Contexto	Notas
Claude Opus 4.6	Anthropic	$5.00/MTok	$25.00/MTok	1M	Mejor para coding complejo
Claude Sonnet 4.6	Anthropic	$3.00/MTok	$15.00/MTok	1M	Mejor relación calidad/precio
Gemini 2.5 Pro	Google	$1.25/MTok	$10.00/MTok	1M	Free tier generoso
Gemini 2.5 Flash	Google	$0.30/MTok	$2.50/MTok	1M	Rápido y barato
GPT-4.1	OpenAI	Variable	Variable	1M	General purpose avanzado
GPT-4o mini	OpenAI	Variable	Variable	128K	Económico, bueno para tareas simples
DeepSeek-R1	DeepSeek	Muy bajo	Muy bajo	128K+	Reasoning barato
Mistral Large 3	Mistral	Variable	Variable	128K	Open weights, multimodal
Codestral / Devstral 2	Mistral	Variable	Variable	128K+	Especialistas en código

🎯 Recomendaciones según tu caso de uso

Caso de uso	Recomendación
Agente de programación avanzado	Claude Code o Cursor + Claude Opus 4.6 / Sonnet 4.6
Prototipado rápido web/app	v0.dev, Bolt.new o Lovable.dev
API unificada para múltiples modelos	OpenRouter o Hugging Face Inference Providers
Costo mínimo en producción	Gemini 2.5 Flash (free tier), DeepSeek V3/R1, Groq
RAG / Document processing	LlamaIndex + LlamaParse o Cohere (embeddings + rerank)
Multi-agent enterprise	CrewAI AMP, LangGraph + LangSmith, o Agno AgentOS
Voice / TTS / STT	ElevenLabs (líder indiscutible)
Video generativo	Runway Gen-4.5, Google Veo 3.1, OpenAI Sora
Local / privacidad total	Ollama + Llama 3.3 70B / Qwen3 / DeepSeek-R1
Framework minimalista para experimentar	smolagents (HF) o Agno

Generado para ai-labs.testing.vulpik.com • Mantenlo actualizado consultando los links oficiales.

🧠 Mapa de Proveedores de IA para Desarrolladores