🧠 Mapa de Proveedores de IA para Desarrolladores

Recopilación de proveedores con API, agentes de programación, frameworks y herramientas generativas.

📅 Actualizado: Abril 2026

Nota importante: El mercado de IA evoluciona extremadamente rápido. Los precios y modelos cambian constantemente. Este documento es una foto fija de abril 2026. Siempre verifica la documentación oficial antes de integrar algo en producción.

🏆 Tier S — Proveedores de LLMs con API (Principales)

OpenAI API

Líder del mercado. GPT-5, o3, o4-mini, GPT-4.1, Codex, realtime audio, image generation. API muy madura y amplia documentación.

Modelos clave: gpt-5, gpt-5.1, gpt-5.2, gpt-5.3-codex, o3, o4-mini, gpt-4.1, gpt-4o, gpt-4o-mini, gpt-image-1, gpt-oss-20b/120b (open weights)
API: variable según modelo y tier (Standard/Provisioned/Batch)
→ platform.openai.com
Chat Completions Assistants API Realtime API Embeddings Fine-tuning Image Gen Video (Sora)

Anthropic (Claude) API AGENTE

Referente en reasoning, coding y seguridad. Claude Code es uno de los agentes de programación más potentes del mercado.

Modelos clave: claude-opus-4-6, claude-sonnet-4-6, claude-haiku-4-5
Opus 4.6: $5/$25 por MTok | Sonnet 4.6: $3/$15 | Haiku 4.5: $1/$5
→ claude.com
1M context window Claude Code Computer Use Web Search MCP Vision

Google (Gemini) API FREE TIER

API muy generosa con free tier. Modelos multimodales avanzados, agentes de research, computer use, generación nativa de imagen/video.

Modelos clave: gemini-3.1-pro, gemini-3.1-flash, gemini-3-flash, gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-flash-lite, imagen-4, veo-3.1
2.5 Flash: $0.30/$2.50 por MTok | 2.5 Pro: $1.25/$10 | Free tier muy generoso
→ ai.google.dev
1M context Grounding (Search/Maps) Code Execution Computer Use Deep Research Image/Video Gen

xAI (Grok) API

API de Elon Musk. Grok con acceso a X/Twitter en tiempo real. Creciendo rápido en capacidades de reasoning y generación.

Modelos clave: Grok (varias versiones), Grok Heavy
Consultar console.x.ai para pricing actual
→ console.x.ai
Real-time search Voice Image Gen Video Gen

🥇 Tier A — Proveedores de LLMs con API (Alternativas sólidas)

Mistral AI API OPEN WEIGHTS

Europeo. Excelentes modelos open-weight y plataforma empresarial (Mistral Studio). Especialistas en code agents con Devstral y Codestral.

Modelos clave: mistral-large-3, mistral-medium-3.1, mistral-small-4, ministral-3, magistral, codestral, devstral-2, pixtral
Variable según modelo y tier
→ mistral.ai
Code Agents Vision OCR TTS Embeddings

Cohere API

Enfoque enterprise. Modelos multilingües (Aya), embeddings, rerank y herramientas de RAG. Muy fuerte en retrieval.

Modelos clave: command-a, command-r+, command-r7b, aya-expanse, aya-vision, embed-4, rerank-4
Command: ~$1/$2 por MTok | Aya: ~$0.50/$1.50
→ cohere.com
RAG Embeddings Rerank 23 idiomas ASR

DeepSeek API OPEN WEIGHTS

Chino. Modelos de reasoning muy competitivos y baratos. DeepSeek-R1 rivaliza con o1 a una fracción del costo.

Modelos clave: deepseek-r1, deepseek-v3, deepseek-v3.1, deepseek-v3.2, deepseek-coder
Muy económico. Verificar en platform.deepseek.com
→ platform.deepseek.com
Reasoning Coding MoE Low cost

Perplexity API

API especializada en búsqueda web con citas. Ideal para RAG y agentes que necesitan información actualizada.

Modelos: Sonar (varios tamaños), acceso a modelos third-party
Por consulta + tokens
→ docs.perplexity.ai
Web Search Citations Real-time data

🛠️ Agregadores / Inference Providers (Una API, muchos modelos)

OpenRouter API

API unificada para cientos de modelos. Drop-in replacement de OpenAI. Fallbacks automáticos y selección por precio/velocidad.

→ openrouter.ai
100+ modelos OpenAI-compatible Auto-fallback

Hugging Face Inference Providers API FREE TIER

Proxy unificado para múltiples proveedores: Together, Fireworks, Groq, Replicate, Cerebras, SambaNova, etc. Un solo token HF.

Generoso free tier. Sin markup sobre proveedores.
→ huggingface.co/docs/inference-providers
OpenAI-compatible Text-to-Image Embeddings Speech

Together AI API

Inference de modelos open-source. Fine-tuning, training y GPU clusters (H100, B200).

→ together.ai
Open-source models Fine-tuning GPU clusters

Fireworks AI API

Inference rápido de modelos open-source. Precios competitivos por tamaño de modelo.

<4B: $0.10/MTok | 4B-16B: $0.20 | >16B: $0.90 | DeepSeek V3: $0.56/$1.68
→ fireworks.ai
Fast inference Image Gen LoRA training

Groq API

Velocidad extrema en inference de modelos open-source. Compound systems con tool use integrado.

Llama 3.1 8B: $0.05/$0.08 | GPT-OSS 20B: $0.075/$0.30 | Llama 3.3 70B: $0.59/$0.79
→ groq.com
Ultra-low latency Tool use Batch API (-50%)

Replicate API

Marketplace de modelos open-source. Pagas por tiempo de ejecución en GPU. Ideal para experimentar.

CPU: $0.36/hr | T4: $0.81/hr | A100: $5.04/hr | H100: $5.49/hr
→ replicate.com
10,000+ modelos Image/Video/Audio Custom deployments

👨‍💻 Agentes de Programación (Coding Agents)

Claude Code AGENTE

Agente de Anthropic para terminal, IDE y web. Explora código, edita archivos, ejecuta tests, crea PRs. Probablemente el más capaz actualmente para tareas complejas.

Incluido en Pro ($20/mes) y Max. También disponible via API pago por uso.
→ claude.com/code
Terminal VS Code JetBrains GitHub integration MCP

Cursor AGENTE

IDE basado en VS Code con agentes de IA integrados. Autocomplete mágico, chat con contexto de codebase, agent mode para tareas autónomas.

Pro: $20/mes | Business: $40/usuario/mes
→ cursor.com
VS Code fork Tab prediction Agent mode Multi-model

Windsurf AGENTE

IDE de Codeium con "Cascade". Memoria de codebase, ejecución de comandos de terminal, preview de servidores, MCP integrado.

Planes por suscripción. Revisar windsurf.com/pricing
→ windsurf.com
Cascade Turbo Mode MCP Store Continue My Work

GitHub Copilot AGENTE

El más adoptado mundialmente. Inline completions, chat, agent mode, code review, PR assistance. Integrado nativamente en GitHub.

Free: 2,000 completions + 50 chat/mes | Pro: $10/mes | Pro+: $39/mes
→ github.com/features/copilot
IDE extensions Copilot Chat Copilot Edits Code Review Claude / Codex

Aider AGENTE OPEN SOURCE

Agente de programación en terminal. Conecta con casi cualquier LLM (local o API). Edita múltiples archivos, usa git, integra con tests/lint.

Gratis (open source)
→ aider.chat
Terminal Multi-file edits Git integration Local models

v0 by Vercel AGENTE

Genera aplicaciones web full-stack desde prompts. Deploy instantáneo a Vercel. Ideal para prototipos rápidos y componentes UI.

→ v0.dev
Full-stack React/Next.js One-click deploy

Bolt.new AGENTE

Builder de apps y websites por chat. Integra agents de OpenAI, Anthropic, etc. Backend cloud incluido.

→ bolt.new
No-code/Low-code Full-stack Cloud backend

Lovable.dev AGENTE

Plataforma no-code para construir apps y websites conversando con IA. Orientado a founders y no-tecnicos.

→ lovable.dev
No-code Vibe coding Rapid prototyping

🔧 Frameworks de Agentes (Para construir tus propios agentes)

LangChain / LangGraph OPEN SOURCE

El ecosistema más grande. LangChain para abstracciones, LangGraph para orquestación de agentes multi-step. LangSmith para observabilidad.

→ langchain.com
Python TypeScript Go Java Tracing Evals

CrewAI OPEN SOURCE

Framework multi-agent muy popular. AMP (Agent Management Platform) para empresas. Visual editor + APIs.

→ crewai.com
Multi-agent Enterprise Visual builder

Agno (antes Phidata) OPEN SOURCE

Framework + runtime (AgentOS). Muy rápido, privado por diseño, corre en tu cloud. Memoria, conocimiento, tools, guardrails.

Open source + AgentOS enterprise
→ agno.com
Fastest instantiation AgentOS Memory Knowledge

smolagents (Hugging Face) OPEN SOURCE

Framework minimalista (~1000 líneas). Enfocado en "code agents" — los agentes escriben y ejecutan Python en lugar de JSON.

→ smolagents.org
Minimalist Code agents Sandboxed execution HF Hub integration

Microsoft AutoGen OPEN SOURCE

Framework de Microsoft para orquestar múltiples agentes conversacionales. Muy potente para workflows complejos.

→ microsoft.github.io/autogen
Multi-agent Conversational Microsoft ecosystem

LlamaIndex OPEN SOURCE

Especialistas en RAG y document processing. LlamaParse es el OCR agentic más avanzado del mercado.

→ llamaindex.ai
RAG OCR Document agents LiteParse (local)

n8n OPEN SOURCE

Automatización de workflows visual + AI. Self-hostable. MCP support. Human-in-the-loop.

→ n8n.io
Visual builder Self-hosted MCP Enterprise

🎬 Herramientas Generativas Multimedia con API

ElevenLabs API

Líder en TTS (Text-to-Speech), voice cloning, music generation, sound effects, y voice agents conversacionales.

Modelos: Eleven v3, Eleven Flash, Eleven Multilingual v2, Eleven Music, Scribe v2
→ elevenlabs.io
TTS Voice Cloning STT Music SFX Voice Agents

Runway API

Generación de video state-of-the-art. Gen-4.5, GWM-1 (General World Model), y API de personajes conversacionales en video.

→ runwayml.com
Video Gen GWM-1 Runway Characters

Synthesia API

Plataforma de video AI para empresas. Avatares, voiceovers en 160+ idiomas. Muy usado en training y marketing.

→ synthesia.io
AI Avatars 160+ idiomas Enterprise

Descript API

Edición de video/audio como si fuera texto. Transcripción, regeneración de voz, eye contact, green screen.

→ descript.com
Video editing Transcription Voice clone Podcasts

🏠 Local / Self-Hosted

Ollama OPEN SOURCE

Ejecuta modelos localmente de forma sencilla. Biblioteca enorme: Llama, DeepSeek, Qwen, Gemma, Mistral, etc.

→ ollama.com/library
Local inference 100+ modelos Easy setup

vLLM / TGI OPEN SOURCE

Engines de inference de alta performance para servir modelos open-source en producción.

Production inference High throughput OpenAI-compatible

📊 Tabla comparativa rápida — Modelos de programación

Modelo Proveedor Precio input Precio output Contexto Notas
Claude Opus 4.6 Anthropic $5.00/MTok $25.00/MTok 1M Mejor para coding complejo
Claude Sonnet 4.6 Anthropic $3.00/MTok $15.00/MTok 1M Mejor relación calidad/precio
Gemini 2.5 Pro Google $1.25/MTok $10.00/MTok 1M Free tier generoso
Gemini 2.5 Flash Google $0.30/MTok $2.50/MTok 1M Rápido y barato
GPT-4.1 OpenAI Variable Variable 1M General purpose avanzado
GPT-4o mini OpenAI Variable Variable 128K Económico, bueno para tareas simples
DeepSeek-R1 DeepSeek Muy bajo Muy bajo 128K+ Reasoning barato
Mistral Large 3 Mistral Variable Variable 128K Open weights, multimodal
Codestral / Devstral 2 Mistral Variable Variable 128K+ Especialistas en código

🎯 Recomendaciones según tu caso de uso

Caso de uso Recomendación
Agente de programación avanzado Claude Code o Cursor + Claude Opus 4.6 / Sonnet 4.6
Prototipado rápido web/app v0.dev, Bolt.new o Lovable.dev
API unificada para múltiples modelos OpenRouter o Hugging Face Inference Providers
Costo mínimo en producción Gemini 2.5 Flash (free tier), DeepSeek V3/R1, Groq
RAG / Document processing LlamaIndex + LlamaParse o Cohere (embeddings + rerank)
Multi-agent enterprise CrewAI AMP, LangGraph + LangSmith, o Agno AgentOS
Voice / TTS / STT ElevenLabs (líder indiscutible)
Video generativo Runway Gen-4.5, Google Veo 3.1, OpenAI Sora
Local / privacidad total Ollama + Llama 3.3 70B / Qwen3 / DeepSeek-R1
Framework minimalista para experimentar smolagents (HF) o Agno

Generado para ai-labs.testing.vulpik.com • Mantenlo actualizado consultando los links oficiales.