La inteligencia artificial de código abierto: una solución adaptativa y segura

Un artículo de Le Monde nos alertó el 13/02: ¡las IA están fallando!

Esas IA, que generaron tanto entusiasmo y excitación al principio, ¿necesitan ahora que tomemos distancia? ¿Existen riesgos para la privacidad de nuestros datos? ¿Podemos dejar que una IA genere contenido en sitios web sin preocupaciones?

Volviendo a noviembre de 2022: los focos se centraron en ChatGPT y su empresa desarrolladora, OpenAI, y jugamos con los prompts, a veces por el simple placer, como cuando “navegábamos” de sitio en sitio al inicio de la Web, sin saber realmente a dónde nos llevaría, solo por la embriaguez del descubrimiento.

En un año, esa embriaguez ha disminuido un poco y ahora nos preguntamos cómo esto podría servirnos profesionalmente, ya que parece evidente que la IA transforma nuestras organizaciones y formas de hacer, especialmente dentro de las agencias de comunicación.

Pero cada nueva aplicación apoyada en la IA trae consigo un montón de cuestionamientos:

Como profesionales, necesitaríamos transmitir a ChatGPT, o más generalmente a los editores de herramientas IA, numerosos datos del sector para permitirles aprender nuestros conceptos, saber hacer, la fraseología de nuestros correos, pero el riesgo de transmisión de datos confidenciales es grande, especialmente fuera de la Unión Europea.

En lugar de una solución única poco extensible o personalizable ofrecida por OpenAI, que no nos permite distinguirnos de nuestros competidores, el futuro parece dirigirse hacia una IA privada, dedicada y optimizada para cada entorno empresarial. Pero desarrollar una experiencia es una inversión considerable en tiempo y equipo para un resultado que sigue siendo incierto, sin mencionar el fuerte impacto ecológico de los GPUs que ejecutan nuestros modelos.

Sustituir el chatbot en un sitio por un bot IA parece bastante natural: ¿no es ChatGPT ya un chatbot? De hecho, lo es, pero no se basa en los mismos principios tecnológicos que sus predecesores: mientras que los “antiguos” chatbots usaban principalmente árboles de decisiones y a veces un toque de análisis del lenguaje natural – lo que permitía garantizar el respeto de una carta de la empresa – los bots basados en IA son cajas negras que pueden “alucinar” generando contenidos no adecuados en el marco de una comunicación oficial.

En nuestra profesión de asesoramiento y expertos IT, hemos resuelto estas restricciones y esto nos ha llevado a tener algunas convicciones:

Las IA comerciales son solo el primer paso; han permitido la apropiación de los prompts y la creación de servicios útiles y “seguros”, siempre y cuando no usemos datos confidenciales y tengamos una mirada crítica sobre sus resultados. Pero tienen dos defectos mayores para nosotros, los profesionales digitales: no tenemos control sobre el alojamiento y no sabemos qué hay dentro de la “caja negra”.

Las IA, y en particular las IA generativas, se convertirán gradualmente en commodities – como pueden serlo bases de datos, servidores web o motores de búsqueda.

Y de la misma manera que no hay solo un motor de base de datos, un servidor web o un motor de búsqueda, no habrá solo una IA.

OpenAI no será el único actor en el mercado, una ola de soluciones OpenSource está emergiendo y su principal fortaleza no será su gratuidad, sino su ilimitada riqueza funcional.

Primero habrá una competencia directa en el segmento de ChatGPT: con Modelos de Lenguaje Grande (LLMs) OpenSource como los de Meta (con Llama2) y Mistral (con Mistral8x7B) que, a diferencia de ChatGPT, permitirán modificaciones de los pesos del modelo neuronal preentrenado, permitiendo mediante “fine-tuning” crear LLMs personalizados.

Estos LLMs personalizados no impondrán restricciones sobre el alojamiento: será posible alojarlos en nuestras infraestructuras existentes, ya sea en la nube o localmente.

Sin embargo, lo más importante es que al adoptar soluciones de código abierto, nosotros, los profesionales digitales, podremos salirnos del marco funcional restrictivo de ChatGPT, que ciertamente se ha expandido con la transición a lo multimodal pero aún presenta limitaciones, para aprovechar la asombrosa diversidad de modelos de código abierto. Solo es necesario echar un vistazo a la variedad de modelos disponibles en HuggingFace, la plataforma indispensable para el intercambio de redes neuronales, para darse cuenta de esto.

Estoy convencido de que el futuro de la IA en la industria radicará en la internalización y combinación de modelos ajustados, principalmente de código abierto, para desarrollar servicios verdaderamente personalizados y seguros.

BLOG