Logotipo de Zephyrnet

Construyendo la segunda pila

Fecha:

Estamos en la Gran Aceleración, una singularidad, no en el sentido kurzweiliano con E mayúscula de robots surgiendo, sino en la que describió Foucault: un período de tiempo en el que el cambio es tan generalizado y tan fundamental que no se puede discernir cómo será la otra cara de ese cambio.

Hemos pasado por singularidades antes:

  • El auge de la agricultura (que creó excedentes de recursos y nos dio las clases académicas y mercantiles).
  • La invención de la imprenta (que democratizó el conocimiento y lo hizo menos maleable, dándonos la idea de una fuente de verdad más allá de nuestros propios sentidos).
  • La máquina de vapor (que permitía a las máquinas realizar tareas físicas).
  • Software informático (que nos permite dar instrucciones a las máquinas a seguir).
  • Internet y los teléfonos inteligentes (que nos conectan a todos entre nosotros de forma interactiva).

Esta singularidad es, en su forma más simple, que Hemos inventado un nuevo tipo de software..

El viejo tipo de software

El viejo tipo de software –el que actualmente está en nuestros teléfonos y computadoras– ha cambiado nuestras vidas de maneras que las harían casi irreconocibles para alguien de la década de 1970. La humanidad tuvo 50 años para adaptarse al software porque comenzó lentamente con los académicos, luego con los aficionados, con los módems de acceso telefónico y el correo electrónico corporativo. Pero incluso con medio siglo para adaptarse, nuestra civilización está luchando por hacer frente a sus consecuencias.

El software con el que estás familiarizado hoy en día (el que envía mensajes, suma números, registra algo en un calendario o incluso activa una videollamada) es determinista. Eso significa hace lo que esperas. Cuando el resultado es inesperado, se llama error.

Del software determinista a la IA

Ejemplos anteriores de “máquinas pensantes” incluían la cibernética (bucles de retroalimentación como pilotos automáticos) y los sistemas expertos (árboles de decisión para médicos). Pero éstas seguían siendo predecibles y comprensibles. Simplemente siguieron muchas reglas.

En la década de 1980, intentamos un enfoque diferente. Estructuramos el software para que se comportara como el cerebro, dándole "neuronas". Y luego dejamos que se configure solo basándose en ejemplos. En 1980, un joven investigador llamado Yann LeCun intentó esto en la clasificación de imágenes.

Ahora es el jefe de IA en Meta.

Luego la IA entró en una especie de hibernación. Se estaban logrando avances, pero fueron lentos y ocurrieron en los pasillos del mundo académico. Surgieron el aprendizaje profundo, TensorFlow y otras tecnologías, principalmente para impulsar los motores de búsqueda, las recomendaciones y la publicidad. Pero la IA era algo que sucedía entre bastidores, en los servicios publicitarios, los mapas y el reconocimiento de voz.

En 2017, algunos investigadores publicaron un artículo fundamental titulado "La atención es todo lo que necesitas". En ese momento, los autores trabajaban en Google, pero desde entonces muchos se trasladaron a empresas como OpenAI. El artículo describía una forma mucho más sencilla de permitir que el software se configurara solo prestando atención a las partes del lenguaje que más importaban.

Uno de los primeros usos de esto fue la traducción. Si alimenta a un algoritmo con suficiente texto en inglés y francés, puede descubrir cómo traducir de uno a otro entendiendo las relaciones entre las palabras de cada idioma. Pero el enfoque básico nos permitió entrenar software con texto extraído de Internet.

A partir de ahí, el progreso fue bastante rápido. En 2021, descubrimos cómo crear un “modelo de instrucción” que utilizaba un proceso llamado Ajuste fino supervisado (SFT) para hacer que la IA conversacional siguiera instrucciones. En 2022, hicimos que los humanos calificaran las respuestas a nuestras instrucciones (llamado Ajuste fino supervisado modificado) y, a fines de 2022, agregamos algo llamado Aprendizaje por refuerzo sobre retroalimentación humana, que nos dio GPT-3.5 y ChatGPT. Las IA ahora pueden dar retroalimentación a otras IA.

Cualquiera sea el caso, para 2024, los humanos serán el insumo sobre el cual se entrenan las cosas y proporcionarán retroalimentación sobre la calidad del resultado que se utiliza para mejorarlo.

Cuando lo inesperado es una característica, no un error

El resultado es un nuevo tipo de software. Para que funcione, primero reunimos una gran cantidad de datos y los utilizamos para entrenar un modelo matemático masivo. Luego, ingresamos un mensaje en el modelo y este predice la respuesta que queremos (muchas personas no se dan cuenta de eso). Una vez que se entrena una IA, la misma entrada produce el mismo resultado (el que considera "mejor") cada vez.). Pero queremos creatividad, por eso añadimos una perturbación, llamada temperatura, que le dice a la IA cuánta aleatoriedad debe inyectar en sus respuestas.

No podemos predecir qué hará el modelo de antemano. E introducimos intencionalmente aleatoriedad para obtener respuestas diferentes cada vez. El objetivo de este nuevo software es ser impredecible. Ser no determinista. Hace cosas inesperadas.

En el pasado, ponías algo en la aplicación y seguía un conjunto de instrucciones que los humanos escribían y surgía el resultado esperado. Ahora, pones algo en una IA y sigue un conjunto de instrucciones que it Escribió, y un resultado inesperado surge del otro lado. Y el resultado inesperado no es un error, es una característica.

Adopción increíblemente rápida

Estamos adoptando este segundo tipo de software mucho más rápidamente que el primero, por varias razones.

  • Hace su propio manual de usuario.: Si bien todos estamos entusiasmados con lo buenos que son los resultados, a menudo pasamos por alto lo bien que puede responder a entradas simples. Este es el primer software sin curva de aprendizaje: literalmente le dirá a cualquiera que sepa escribir o hablar cómo usarlo. Es el primer software que crea su propia documentación.
  • Todos pueden probarlo: Gracias a la conectividad ubicua a través de teléfonos móviles y banda ancha, y al modelo SaaS de software alojado, muchas personas tienen acceso. Ya no necesita comprar ni instalar software. Cualquiera que tenga un navegador puede probarlo.
  • El hardware está en todas partes: Las GPU de los juegos, los chips de la serie M de Apple y la computación en la nube hacen que inmensos recursos informáticos sean trivialmente fáciles de implementar.
  • Los costos bajaron. Mucho: Algunos avances algorítmicos han reducido el costo de la IA en varios órdenes de magnitud. El coste de clasificar mil millones de imágenes cayó de 10,000 dólares en 2021 a 0.03 dólares en 2023, una tasa 450 veces más barata por día.
  • Vivimos en línea: Los seres humanos están en línea un promedio de seis horas al día, y gran parte de esa interacción (correo electrónico, salas de chat, mensajes de texto, blogs) se basa en texto. En el mundo en línea, un ser humano es en gran medida indistinguible de un algoritmo, por lo que ha habido muchas formas sencillas de conectar la salida de la IA a los feeds y las pantallas que consumen las personas. El COVID-19 aceleró el trabajo remoto y, con él, la insinuación de textos y algoritmos en nuestras vidas.

¿Qué puede hacer el software no determinista?

El software no determinista puede hacer muchas cosas, algunas de las cuales recién ahora estamos empezando a darnos cuenta.

  • Es generativo. Puede crear cosas nuevas. Lo estamos viendo en imágenes (Stable Diffusion, Dall-e) y música (Google MusicLM) e incluso en finanzas, genómica y detección de recursos. Pero el lugar que está recibiendo la mayor atención son los chatbots como los de OpenAI, Google, Perplexity y otros.
  • Es bueno en creatividad pero inventa cosas. Eso significa que le estamos dando trabajos "divertidos" como el arte, la prosa y la música para los que no existe una "respuesta correcta". También significa una avalancha de desinformación y una crisis epistémica para la humanidad.
  • Todavía necesita mucha aportación humana para filtrar la salida en algo utilizable. De hecho, muchos de los pasos para producir una IA conversacional implican que los humanos le den ejemplos de buenas respuestas o califiquen las respuestas que da.
  • Como a menudo esto está mal, debemos poder culpar a alguien. El humano que decide qué hacer con su producción es responsable de las consecuencias.
  • It puede razonar en formas que no pensamos que debería ser posible. No entendemos por qué es así.

El péndulo y la democratización de las TI

Si bien, por definición, es difícil predecir el otro lado de una singularidad, podemos hacer algunas conjeturas sobre cómo cambiará la tecnología de la información (TI). La industria de TI ha experimentado dos grandes cambios durante el último siglo:

  1. Un péndulo constante, ha estado oscilando desde la centralización de mainframes hasta la naturaleza distribuida de los clientes web.
  2. Es una democratización gradual de los recursos, desde los días en que la informática era escasa, valiosa y protegida por TI hasta una era en la que los desarrolladores, y luego las propias cargas de trabajo, podían implementar los recursos según fuera necesario.

Este diagrama muestra ese cambio:

Construyendo la segunda pila

Hay otra capa que está sucediendo gracias a la IA: la informática controlada por el usuario. Ya estamos viendo herramientas sin código y con poco código, como Unqork, Bubble, Webflow, Zapier y otras, que facilitan a los usuarios la creación de aplicaciones, pero lo que es mucho más interesante es cuando el mensaje de IA de un usuario inicia el código. Vemos esto en el intérprete de código ChatGPT de OpenAI, que escribirá y luego ejecutará aplicaciones para procesar datos.

Es probable que haya otra oscilación pendular hacia el borde en los próximos años a medida que empresas como Apple entren en la contienda (que han incorporado un importante procesamiento de IA en sus conjuntos de chips locales en anticipación a este día). Así es como se ve la siguiente capa de informática:

Construyendo la segunda pila

Construyendo una segunda pila

Otra predicción que podemos hacer sobre TI en la era no determinista es que las empresas tendrán dos pilas.

  • Uno será determinista y ejecutará tareas predecibles.
  • Uno será no determinista y generará resultados inesperados.

Quizás lo más interesante es que la segunda pila (no determinista) podrá escribir código que la primera pila (determinista) podrá ejecutar; pronto, mejor que los humanos.

Construyendo la segunda pila

En la próxima década veremos una prisa por construir segundas pilas en todas las organizaciones. Cada empresa será juzgada por el valor de su corpus, la información patentada y las actualizaciones en tiempo real que utiliza para obtener los mejores resultados de su IA. Cada pila tendrá diferentes requisitos de hardware, arquitecturas, gobernanza, interfaces de usuario y estructuras de costos.

No podemos predecir cómo la IA remodelará a la humanidad. Pero podemos hacer conjeturas fundamentadas sobre cómo cambiará la TI empresarial, y aquellos que se adapten rápidamente estarán en mejor posición para aprovechar lo que vendrá después.

Alistair Croll es autor de varios libros sobre tecnología, negocios y sociedad, incluido el best seller Lean Analytics. Es el fundador y copresidente de FWD50, la conferencia líder mundial sobre innovación del sector público, y se ha desempeñado como ejecutivo visitante en la Escuela de Negocios de Harvard, donde ayudó a crear el plan de estudios de Ciencia de Datos y Pensamiento Crítico. Es el presidente de la conferencia de Universo de datos 2024.

Conozca al autor en Data Universe

Únase al autor, Alistair Croll, en Universo de datos, que tendrá lugar del 10 al 11 de abril de 2024 en Nueva York, donde presidirá el lanzamiento inaugural de una nueva conferencia de datos e inteligencia artificial independiente de la marca diseñada para toda la comunidad global de datos e inteligencia artificial.

Reuniéndolo TODO: Data Universe da la bienvenida a profesionales de datos de todos los niveles y roles, así como a empresarios, ejecutivos y socios de la industria para interactuar con los conocimientos más actuales y relevantes dirigidos por expertos sobre datos, análisis, aprendizaje automático e inteligencia artificial explorados en todas las industrias. , para ayudarle a evolucionar junto con las normas, herramientas, técnicas y expectativas que cambian rápidamente y que transforman el futuro de los negocios y la sociedad. Únase a nosotros en el North Javits Center de Nueva York, este abril, para ser parte del futuro de los datos y la IA.

INFORMS se complace en ser un socio estratégico de Data Universe 2024 y presentará cuatro sesiones durante la conferencia.


Crédito de imagen destacada: Growtika/Unsplash

punto_img

Información más reciente

punto_img