Nota: El formulario se ha cubierto en idioma: Español

Modelos de IA autoalojables

Resumen

Esta presentación propone un análisis sistemático de los distintos grados de apertura en los modelos de IA generativa, desde los servicios totalmente privativos hasta los modelos totalmente reproducibles y libres, examinando cómo estas categorías afectan al acceso, el control, la autonomía, la confianza y la privacidad. La charla se centra en los modelos descargables y autoalojables, mostrando sus ventajas, limitaciones y requisitos, así como las herramientas y ecosistemas actuales para ejecutarlos en infraestructura propia. El objetivo es ofrecer una visión clara de por qué la apertura y la autoalojabilidad son esenciales para la soberanía tecnológica y para una investigación reproducible en IA.

Detalles de la propuesta:

Descripción completa

La explosión de la IA generativa ha traído consigo un ecosistema heterogéneo de modelos, licencias y niveles de apertura que impactan directamente en la libertad de uso, el control sobre los datos, la reproducibilidad de resultados y la autonomía tecnológica. Esta presentación propone un marco conceptual para entender ese espectro, desde los modelos completamente cerrados integrados en aplicaciones hasta los modelos reproducibles y libres, pasando por modelos de pesos disponibles, modelos “open weight”, modelos de código abierto y modelos éticos.

La base del marco propuesto es un análisis de los elementos que configuran un modelo generativo (arquitectura, pesos, datos, herramientas de entrenamiento e inferencia, documentación y artefactos intermedios) y cómo estos influyen en las cuatro libertades clásicas del software libre: libertad de uso, de estudio, de modificación y de distribución. A partir de esta clasificación, se analizan aspectos clave como el acceso a inferencias, la capacidad de modificar o ajustar modelos, el control sobre los datos, la dependencia respecto al proveedor y el nivel de confianza que puede otorgarse a cada tipo de modelo.

La segunda parte de la presentación se centra en los modelos autoalojables, que constituyen una alternativa fundamental para organizaciones y comunidades que requieren privacidad, independencia y capacidad de adaptación. Se describen los requisitos mínimos para ejecutar modelos en infraestructura propia, las principales ventajas (control total, reproducibilidad, integración flexible y soberanía tecnológica) y sus limitaciones (rendimiento inferior al estado del arte, costes de infraestructura, mantenimiento y necesidad de conocimientos técnicos).

Asimismo, se ofrece un panorama actualizado del ecosistema técnico para el autoalojamiento: motores de inferencia (llama.cpp, vLLM), frameworks (LangChain, LiteLLM), frontends y asistentes locales (Ollama, Oobabooga, Open WebUI, Jan), técnicas de optimización como la cuantización y el finetuning, y modelos representativos en distintas modalidades (texto, imagen, vídeo, voz). También se revisan benchmarks, datasets abiertos y retos pendientes, como la determinación exacta del grado de apertura o la verificación de las características declaradas por los proveedores.

Con todo esto, se pretende proporcionar una visión global y estructurada del estado actual de los modelos generativos abiertos y autoalojables, destacando su importancia para el software libre, la investigación y la soberanía digital en un contexto dominado por grandes proveedores y servicios cerrados.

Ponente:

Info personal:

Comentarios

Debido a obligaciones en mi trabajo, es muy posible que no pueda estar en esLibre durante el viernes por la mañana. Si es posible, por favor, planificad mi presentación a partir de la comida de ese día.

Código de conducta

✅ Aceptado



Volver al índice