Tech

¿Qué significa 'IA de código abierto' de todos modos?

Perspectiva Global Tuesday, October 29 2024

La lucha entre el software de código abierto y el software propietario es bien conocida. Pero las tensiones que han permeado los círculos de software durante décadas se han trasladado al floreciente espacio de la inteligencia artificial, con la controversia pisándole los talones.

El New York Times publicó recientemente una elogiosa evaluación del CEO de Meta, Mark Zuckerberg, señalando cómo su abrazo a la 'IA de código abierto' lo había vuelto popular una vez más en el Valle del Silicio. El problema, sin embargo, es que los modelos de lenguaje grande de la marca Llama de Meta no son realmente de código abierto.

¿O sí lo son?

Según la mayoría de las estimaciones, no lo son. Pero destaca cómo la noción de 'IA de código abierto' solo va a generar más debate en los años venideros. Esto es algo que la Iniciativa de Código Abierto (OSI) está tratando de abordar, liderada por el director ejecutivo Stefano Maffulli, quien ha estado trabajando en el problema durante más de dos años a través de un esfuerzo global que abarca conferencias, talleres, paneles, webinars, informes y más.

La IA no es código de software

Créditos de la imagen: Westend61 via Getty

La OSI ha sido guardiana de la Definición de Código Abierto (OSD) por más de un cuarto de siglo, estableciendo cómo el término 'código abierto' puede, o debe, aplicarse al software. Una licencia que cumpla con esta definición puede legítimamente considerarse 'código abierto', aunque reconoce un espectro de licencias que van desde extremadamente permisivas hasta no tan permisivas.

Pero transponer convenciones de licencias y nomenclatura heredadas del software a la IA es problemático. Joseph Jacks, evangelista del código abierto y fundador de la firma de capital de riesgo OSS Capital, va tan lejos como para decir que no hay tal cosa como 'IA de código abierto', señalando que 'el código abierto fue inventado explícitamente para el código fuente de software'.

Por el contrario, los 'pesos de la red neuronal' (NNWs) - un término utilizado en el mundo de la inteligencia artificial para describir los parámetros o coeficientes a través de los cuales la red aprende durante el proceso de entrenamiento - no son de ninguna manera comparables al software.

'Los pesos de las redes neuronales no son código fuente de software; no son legibles por humanos, ni son depurables', señala Jacks. 'Además, los derechos fundamentales del código abierto tampoco se traducen a los pesos de las redes neuronales de manera congruente'.

Esto llevó a Jacks y a la colega de OSS Capital, Heather Meeker, a idear su propia definición, en torno al concepto de 'pesos abiertos'.

Entonces, antes de llegar a una definición significativa de 'IA de código abierto', ya podemos ver algunas de las tensiones inherentes en intentar llegar allí. ¿Cómo podemos ponernos de acuerdo en una definición si no podemos estar de acuerdo en que la 'cosa' que estamos definiendo existe?

Maffulli, por lo que vale, está de acuerdo.

'El punto es correcto', le dijo a TechCrunch. 'Uno de los debates iniciales que tuvimos fue si llamarlo IA de código abierto en absoluto, pero todo el mundo ya estaba utilizando el término'.

Esto refleja algunos de los desafíos en el ámbito más amplio de la IA, donde los debates abundan sobre si la 'cosa' que hoy llamamos 'IA' realmente es IA o simplemente sistemas potentes enseñados para detectar patrones entre vastas extensiones de datos. Pero los detractores están mayormente resignados al hecho de que la nomenclatura 'IA' está aquí, y no tiene sentido luchar contra ella.

Análisis de Meta

Créditos de la imagen: Larysa Amosova via Getty

Fundada en 1998, la OSI es una corporación sin fines de lucro de beneficio público que trabaja en una miríada de actividades relacionadas con el código abierto en torno a la defensa, la educación y su razón de ser principal: la Definición de Código Abierto. Hoy, la organización depende de patrocinios para financiarse, con miembros tan distinguidos como Amazon, Google, Microsoft, Cisco, Intel, Salesforce y Meta.

La participación de Meta en la OSI es particularmente notable en este momento en lo que respecta a la noción de 'IA de código abierto'. A pesar de que Meta cuelga su sombrero de IA en la percha de código abierto, la compañía tiene restricciones notables en cuanto a cómo se pueden usar sus modelos Llama: Seguro, se pueden usar de forma gratuita para casos de investigación y uso comercial, pero los desarrolladores de aplicaciones con más de 700 millones de usuarios mensuales deben solicitar una licencia especial a Meta, que otorgará puramente a su propia discreción.

En pocas palabras, los hermanos Big Tech de Meta pueden silbar si quieren participar.

El lenguaje de Meta en torno a sus LLMs es algo maleable. Mientras que la compañía llamó a su modelo Llama 2 de código abierto, con la llegada de Llama 3 en abril, retrocedió un poco en cuanto a la terminología, utilizando frases como 'disponible abiertamente' y 'accesible abiertamente' en su lugar. Pero en algunos lugares, todavía se refiere al modelo como 'código abierto'.

'Todos los demás que están involucrados en la conversación están perfectamente de acuerdo en que Llama en sí misma no puede considerarse código abierto', dijo Maffulli. 'Personas con las que he hablado que trabajan en Meta, saben que es un poco exagerado'.

Además, algunos podrían argumentar que hay un conflicto de intereses aquí: ¿una empresa que ha mostrado un deseo de aprovecharse del branding de código abierto también proporciona financiamiento a los guardianes de 'la definición'?

Esta es una de las razones por las que la OSI está tratando de diversificar su financiamiento, asegurando recientemente una subvención de la Fundación Sloan, que está ayudando a financiar su esfuerzo global multi-stakeholder para alcanzar la Definición de IA de Código Abierto. TechCrunch puede revelar que esta subvención asciende a alrededor de $250,000, y Maffulli tiene la esperanza de que esto pueda alterar la percepción en torno a su dependencia del financiamiento corporativo.

'Eso es algo que la subvención de Sloan hace aún más claro: Podríamos decir adiós al dinero de Meta en cualquier momento', dijo Maffulli. 'Podríamos hacerlo incluso antes de esta subvención de Sloan, porque sé que vamos a recibir donaciones de otros. Y Meta lo sabe muy bien. No están interfiriendo con ninguno de estos procesos, ni Microsoft, ni GitHub, ni Amazon, ni Google; absolutamente saben que no pueden interferir, porque la estructura de la organización no lo permite'.

Definición de trabajo de IA de código abierto

Créditos de la imagen: Aleksei Morozov / Getty Images

El borrador actual de la Definición de IA de Código Abierto se encuentra en la versión 0.0.8, constituyendo tres partes principales: el 'preámbulo', que establece el ámbito del documento; la Definición de IA de Código Abierto en sí misma; y una lista de verificación que revisa los componentes necesarios para un sistema de IA conforme al código abierto.

Según el borrador actual, un sistema de IA de código abierto debería otorgar libertades para usar el sistema para cualquier propósito sin necesidad de permiso; permitir a otros estudiar cómo funciona el sistema e inspeccionar sus componentes; y modificar y compartir el sistema para cualquier propósito.

Pero uno de los mayores desafíos ha sido en torno a los datos - es decir, ¿puede un sistema de IA ser clasificado como 'código abierto' si la empresa no ha puesto a disposición el conjunto de datos de entrenamiento para que otros lo examinen? Según Maffulli, es más importante saber de dónde provienen los datos, y cómo un desarrollador etiquetó, deduplicó y filtró los datos. Y también, tener acceso al código que se utilizó para ensamblar el conjunto de datos a partir de sus diversas fuentes.

'Es mucho mejor conocer esa información que tener el conjunto de datos simple sin el resto de ella', dijo Maffulli.

Aunque tener acceso al conjunto de datos completo sería bueno (la OSI lo considera un componente 'opcional'), Maffulli dice que no es posible o práctico en muchos casos. Esto puede ser porque hay información confidencial o con derechos de autor contenida en el conjunto de datos que el desarrollador no tiene permiso para redistribuir. Además, existen técnicas para entrenar modelos de aprendizaje automático mediante las cuales los datos en sí mismos no se comparten realmente con el sistema, utilizando técnicas como el aprendizaje federado, la privacidad diferencial y el cifrado homomórfico.

Y esto resalta perfectamente las diferencias fundamentales entre 'código abierto de software' y 'IA de código abierto': Las intenciones pueden ser similares, pero no son comparables de forma directa, y esta disparidad es lo que la OSI está tratando de capturar en su definición.

En el software, el código fuente y el código binario son dos vistas del mismo artefacto: Reflejan el mismo programa en formas diferentes. Pero los conjuntos de datos de entrenamiento y los modelos entrenados subsiguientes son cosas distintas: Puedes tomar ese mismo conjunto de datos, y no necesariamente podrás recrear el mismo modelo de manera consistente.

'Hay una variedad de lógica estadística y aleatoria que ocurre durante el entrenamiento que significa que no se puede hacer replicable de la misma manera que el software', agregó Maffulli.

Entonces, un sistema de IA de código abierto debería ser fácil de replicar, con instrucciones claras. Y aquí es donde entra en juego la faceta de la lista de verificación de la Definición de IA de Código Abierto, que se basa en un artículo académico recientemente publicado llamado 'El Marco de Apertura del Modelo: Promoviendo la Compleción y Apertura para la Reproducibilidad, Transparencia y Usabilidad en la Inteligencia Artificial'.

Este artículo propone el Marco de Apertura del Modelo (MOF), un sistema de clasificación que califica los modelos de aprendizaje automático 'basándose en su completitud y apertura'. El MOF exige que se incluyan y se publiquen 'componentes específicos del desarrollo del modelo de IA bajo licencias abiertas apropiadas', incluidas las metodologías de entrenamiento y los detalles sobre los parámetros del modelo.

Estado estable

Stefano Maffulli presentando en la cumbre de miembros de la Alianza de Bienes Públicos Digitales (DPGA) en Addis Abeba.

La OSI está llamando al lanzamiento oficial de la definición la 'versión estable', al igual que una empresa lo hará con una aplicación que ha sido sometida a extensas pruebas y depuración antes del horario estelar. La OSI a propósito no la llama 'lanzamiento final' porque partes de ella probablemente evolucionarán.

'Realmente no podemos esperar que esta definición dure 26 años como la Definición de Código Abierto', dijo Maffulli. 'No espero que la parte superior de la definición, como '¿qué es un sistema de IA?', cambie mucho. Pero las partes a las que nos referimos en la lista de verificación, esas listas de componentes, ¿dependen de la tecnología? Mañana, ¿quién sabe cómo será la tecnología?'.

Se espera que la versión estable de la Definición de IA de Código Abierto sea aprobada por la Junta en la conferencia All Things Open a finales de octubre, con la OSI embarcándose en una gira global en los meses intermedios que abarca cinco continentes, buscando más 'opiniones diversas' sobre cómo se definirá 'IA de código abierto' en el futuro. Pero es probable que cualquier cambio final sea poco más que 'ajustes pequeños' aquí y allá.

'Este es el tramo final', dijo Maffulli. 'Hemos alcanzado una versión completa de la definición; tenemos todos los elementos que necesitamos. Ahora tenemos una lista de verificación, así que estamos revisando que no haya sorpresas allí; no hay sistemas que deban incluirse o excluirse'.

Perspectiva Global 3 weeks ago