Recopilación de proveedores con API, agentes de programación, frameworks y herramientas generativas.
📅 Actualizado: Abril 2026
Nota importante: El mercado de IA evoluciona extremadamente rápido. Los precios y modelos cambian constantemente. Este documento es una foto fija de abril 2026. Siempre verifica la documentación oficial antes de integrar algo en producción.
Líder del mercado. GPT-5, o3, o4-mini, GPT-4.1, Codex, realtime audio, image generation. API muy madura y amplia documentación.
Referente en reasoning, coding y seguridad. Claude Code es uno de los agentes de programación más potentes del mercado.
API muy generosa con free tier. Modelos multimodales avanzados, agentes de research, computer use, generación nativa de imagen/video.
API de Elon Musk. Grok con acceso a X/Twitter en tiempo real. Creciendo rápido en capacidades de reasoning y generación.
Europeo. Excelentes modelos open-weight y plataforma empresarial (Mistral Studio). Especialistas en code agents con Devstral y Codestral.
Enfoque enterprise. Modelos multilingües (Aya), embeddings, rerank y herramientas de RAG. Muy fuerte en retrieval.
Chino. Modelos de reasoning muy competitivos y baratos. DeepSeek-R1 rivaliza con o1 a una fracción del costo.
API especializada en búsqueda web con citas. Ideal para RAG y agentes que necesitan información actualizada.
API unificada para cientos de modelos. Drop-in replacement de OpenAI. Fallbacks automáticos y selección por precio/velocidad.
→ openrouter.aiProxy unificado para múltiples proveedores: Together, Fireworks, Groq, Replicate, Cerebras, SambaNova, etc. Un solo token HF.
Inference de modelos open-source. Fine-tuning, training y GPU clusters (H100, B200).
→ together.aiInference rápido de modelos open-source. Precios competitivos por tamaño de modelo.
Velocidad extrema en inference de modelos open-source. Compound systems con tool use integrado.
Marketplace de modelos open-source. Pagas por tiempo de ejecución en GPU. Ideal para experimentar.
Agente de Anthropic para terminal, IDE y web. Explora código, edita archivos, ejecuta tests, crea PRs. Probablemente el más capaz actualmente para tareas complejas.
IDE basado en VS Code con agentes de IA integrados. Autocomplete mágico, chat con contexto de codebase, agent mode para tareas autónomas.
IDE de Codeium con "Cascade". Memoria de codebase, ejecución de comandos de terminal, preview de servidores, MCP integrado.
El más adoptado mundialmente. Inline completions, chat, agent mode, code review, PR assistance. Integrado nativamente en GitHub.
Agente de programación en terminal. Conecta con casi cualquier LLM (local o API). Edita múltiples archivos, usa git, integra con tests/lint.
Genera aplicaciones web full-stack desde prompts. Deploy instantáneo a Vercel. Ideal para prototipos rápidos y componentes UI.
→ v0.devBuilder de apps y websites por chat. Integra agents de OpenAI, Anthropic, etc. Backend cloud incluido.
→ bolt.newPlataforma no-code para construir apps y websites conversando con IA. Orientado a founders y no-tecnicos.
→ lovable.devEl ecosistema más grande. LangChain para abstracciones, LangGraph para orquestación de agentes multi-step. LangSmith para observabilidad.
→ langchain.comFramework multi-agent muy popular. AMP (Agent Management Platform) para empresas. Visual editor + APIs.
→ crewai.comFramework + runtime (AgentOS). Muy rápido, privado por diseño, corre en tu cloud. Memoria, conocimiento, tools, guardrails.
Framework minimalista (~1000 líneas). Enfocado en "code agents" — los agentes escriben y ejecutan Python en lugar de JSON.
→ smolagents.orgFramework de Microsoft para orquestar múltiples agentes conversacionales. Muy potente para workflows complejos.
→ microsoft.github.io/autogenEspecialistas en RAG y document processing. LlamaParse es el OCR agentic más avanzado del mercado.
→ llamaindex.aiAutomatización de workflows visual + AI. Self-hostable. MCP support. Human-in-the-loop.
→ n8n.ioLíder en TTS (Text-to-Speech), voice cloning, music generation, sound effects, y voice agents conversacionales.
Generación de video state-of-the-art. Gen-4.5, GWM-1 (General World Model), y API de personajes conversacionales en video.
→ runwayml.comPlataforma de video AI para empresas. Avatares, voiceovers en 160+ idiomas. Muy usado en training y marketing.
→ synthesia.ioEdición de video/audio como si fuera texto. Transcripción, regeneración de voz, eye contact, green screen.
→ descript.comEjecuta modelos localmente de forma sencilla. Biblioteca enorme: Llama, DeepSeek, Qwen, Gemma, Mistral, etc.
→ ollama.com/libraryEngines de inference de alta performance para servir modelos open-source en producción.
| Modelo | Proveedor | Precio input | Precio output | Contexto | Notas |
|---|---|---|---|---|---|
| Claude Opus 4.6 | Anthropic | $5.00/MTok | $25.00/MTok | 1M | Mejor para coding complejo |
| Claude Sonnet 4.6 | Anthropic | $3.00/MTok | $15.00/MTok | 1M | Mejor relación calidad/precio |
| Gemini 2.5 Pro | $1.25/MTok | $10.00/MTok | 1M | Free tier generoso | |
| Gemini 2.5 Flash | $0.30/MTok | $2.50/MTok | 1M | Rápido y barato | |
| GPT-4.1 | OpenAI | Variable | Variable | 1M | General purpose avanzado |
| GPT-4o mini | OpenAI | Variable | Variable | 128K | Económico, bueno para tareas simples |
| DeepSeek-R1 | DeepSeek | Muy bajo | Muy bajo | 128K+ | Reasoning barato |
| Mistral Large 3 | Mistral | Variable | Variable | 128K | Open weights, multimodal |
| Codestral / Devstral 2 | Mistral | Variable | Variable | 128K+ | Especialistas en código |
| Caso de uso | Recomendación |
|---|---|
| Agente de programación avanzado | Claude Code o Cursor + Claude Opus 4.6 / Sonnet 4.6 |
| Prototipado rápido web/app | v0.dev, Bolt.new o Lovable.dev |
| API unificada para múltiples modelos | OpenRouter o Hugging Face Inference Providers |
| Costo mínimo en producción | Gemini 2.5 Flash (free tier), DeepSeek V3/R1, Groq |
| RAG / Document processing | LlamaIndex + LlamaParse o Cohere (embeddings + rerank) |
| Multi-agent enterprise | CrewAI AMP, LangGraph + LangSmith, o Agno AgentOS |
| Voice / TTS / STT | ElevenLabs (líder indiscutible) |
| Video generativo | Runway Gen-4.5, Google Veo 3.1, OpenAI Sora |
| Local / privacidad total | Ollama + Llama 3.3 70B / Qwen3 / DeepSeek-R1 |
| Framework minimalista para experimentar | smolagents (HF) o Agno |
Generado para ai-labs.testing.vulpik.com • Mantenlo actualizado consultando los links oficiales.