Logotipo de Zephyrnet

Entrevista al director ejecutivo: Patrick T. Bowen de Neurophos - Semiwiki

Fecha:

Patrick T. Bowen Neurofos

Patrick es un emprendedor con experiencia en física y metamateriales. Patrick establece la visión para el futuro de la arquitectura Neurophos y dirige su equipo en investigación y desarrollo, particularmente en diseño de metamateriales. Tiene una maestría en sistemas Micro-Nano de ETH Zurich y un doctorado en Ingeniería Eléctrica de la Universidad de Duke, bajo la dirección del Prof. David Smith. Después de graduarse, Patrick cofundó Metacept con el Prof. Smith; Metacept es el centro de comercialización de metamateriales y la firma de consultoría más importante del mundo.

Cuéntanos sobre Neurophos. ¿Qué problemas estás resolviendo?
Decimos que existimos para llevar el poder computacional del cerebro humano a la inteligencia artificial. En 2009 se descubrió que las GPU son mucho mejores que las CPU para reconocer gatos en Internet, pero las GPU no son la respuesta al futuro de las cargas de trabajo de IA. Así como las GPU eran mejores que las CPU para redes neuronales, podría haber arquitecturas que sean mejores que las GPU en órdenes de magnitud. Neurophos es lo que viene después de las GPU para la IA.

Los modelos de lenguajes grandes de IA en general han sido limitados porque no hemos tenido suficiente potencia informática para aprovechar plenamente su potencial. La gente se ha centrado principalmente en la parte de capacitación, simplemente porque había que entrenar algo útil antes de poder siquiera pensar en implementarlo. Esos esfuerzos han puesto de relieve el increíble poder de los grandes modelos de IA y, con esa prueba, la gente está empezando a centrarse en cómo implementar la IA a escala. El poder de esos modelos de IA significa que tenemos millones de usuarios que los usarán todos los días. ¿Cuánta energía cuesta por usuario? ¿Cuánto cuesta el cálculo por inferencia? Si no es lo suficientemente barato por inferencia, eso puede ser algo muy limitante para las empresas que quieran implementar IA.

La eficiencia energética también es un gran problema a resolver. Si tiene un servidor que quema, digamos, 6 kilovatios y quiere ir 100 veces más rápido pero no hace nada por la eficiencia energética fundamental, entonces ese servidor de 6 kilovatios de repente se convierte en un servidor de 600 kilovatios. En algún momento chocas contra una pared; simplemente estás quemando demasiada energía y no puedes absorber el calor de los chips lo suficientemente rápido. Y, por supuesto, a eso se suman cuestiones relacionadas con el cambio climático. ¿Cuánta energía consume la IA? ¿Cuánta energía adicional estamos desperdiciando simplemente tratando de mantener frescos los centros de datos? Por lo tanto, primero es necesario que alguien resuelva el problema de la eficiencia energética y luego se podrá avanzar lo suficientemente rápido para satisfacer las demandas de las aplicaciones.

La gente ha propuesto utilizar la computación óptica para la IA desde que existe la IA. Hay muchas ideas en las que trabajamos hoy que también son viejas ideas de los años 80. Por ejemplo, las ecuaciones originales de la famosa “capa de invisibilidad de los metamateriales” y otras cosas como el índice de refracción negativo, se remontan a los físicos rusos de los años 60 y 80. Aunque en cierto modo se pensó en ello, en realidad fue reinventado por David Smith y Sir John Pendry.

De manera similar, las matrices sistólicas, que normalmente es lo que la gente quiere decir cuando dicen "procesador tensorial", son una vieja idea de finales de los años 70. La computación cuántica es una vieja idea de los años 80 que hoy resucitamos. El procesamiento óptico también es una vieja idea de los años 80, pero en aquella época no teníamos la tecnología para implementarlo. Entonces, con Neurophos volvimos a reinventar el transistor óptico, creando desde cero el hardware subyacente necesario para implementar las sofisticadas ideas de computación óptica de hace mucho tiempo.

¿Qué hará que los clientes pasen de utilizar una GPU de Nvidia a utilizar su tecnología?
Entonces, creo que lo primero que realmente importa a la mayoría de los clientes es el dinero por métrica de inferencia, porque eso es lo que realmente hace o deshace su modelo de negocio. Estamos abordando esa métrica con una solución que realmente puede aumentar la velocidad de procesamiento 100 veces en comparación con una GPU de última generación, todo dentro del mismo rango de potencia.

La preocupación medioambiental también es algo que preocupa a la gente y estamos proporcionando una solución muy real para mitigar significativamente el consumo de energía directamente en una de sus fuentes más importantes: los centros de datos.

Si te sientas y piensas en cómo escala esto... alguien tiene que ofrecer una solución aquí, ya sea nosotros o alguien más. El ancho de banda en el empaque de chips es aproximadamente proporcional a la raíz cuadrada del área y el consumo de energía en el empaque de chips es generalmente proporcional al área. Esto ha llevado a todo tipo de formas retorcidas en las que intentamos crear y empaquetar sistemas.

El embalaje es una de las cosas que realmente ha sido revolucionaria para la IA en general. Inicialmente se trataba de costos y de poder mezclar chiplets de diferentes nodos tecnológicos y, sobre todo, de velocidad de acceso a la memoria y ancho de banda porque se podía integrar con chips DRAM. ¡Pero ahora estás poniendo cada vez más fichas allí!

El uso del enfoque de computación analógica restablece el consumo de energía para la computación hasta la raíz cuadrada del área en lugar de ser proporcional al área. Entonces, ahora la forma en que su consumo de energía y computación aumenta es la misma; los estás equilibrando.

Creemos que hemos desarrollado el único enfoque hasta la fecha para la computación analógica en memoria que realmente puede escalar a densidades de computación lo suficientemente altas como para poner en juego estas leyes de escala.

¿Cómo pueden los clientes interactuar con Neurophos hoy? 
Estamos creando un programa de socios de desarrollo y proporcionando un modelo de software de nuestro hardware que permite a las personas cargar directamente el código PyTorch y compilarlo. Eso proporciona métricas de rendimiento y latencia y cuántas instancias por segundo, etc., al cliente. También nos proporciona datos sobre cualquier cuello de botella en el rendimiento del sistema, de modo que podamos asegurarnos de que estamos diseñando el sistema general de una manera que realmente importe para las cargas de trabajo de los clientes.

¿En qué nuevas características/tecnología estás trabajando?
Los académicos han soñado durante mucho tiempo sobre lo que podrían hacer si tuvieran una metasuperficie como la que estamos construyendo en Neurophos, y hay muchos artículos teóricos por ahí... pero nadie ha construido una. Somos los primeros en hacerlo. En mi opinión, la mayoría de las aplicaciones interesantes son realmente para superficies dinámicas, no estáticas, y hay otros trabajos en marcha en Metacept, Duke y en compañías hermanas como Lumotive con los que yo, y creo que el mundo, estaremos muy entusiasmados. .

¿Por qué se ha unido a SC Incubator y cuáles son los objetivos de Neurophos al trabajar con su organización durante los próximos 24 meses?

Silicon Catalyst se ha convertido en una prestigiosa aceleradora de nuevas empresas de semiconductores, con un listón de admisión muy alto. Estamos entusiasmados de tenerlos como socios. Las nuevas empresas de hardware tienen una gran desventaja en relación con las nuevas empresas de software debido a su mayor costo de demostración/prototipo y tiempo de ciclo de ingeniería, y esto es aún más cierto en las nuevas empresas de semiconductores donde las herramientas EDA y los costos de máscara y la gran escala de los equipos de ingeniería pueden ser prohibitivos. caro para una empresa de producción de semillas. Silicon Catalyst ha formado un ecosistema bastante increíble de socios que brindan una ayuda significativa para reducir sus costos de desarrollo y acelerar su tiempo de comercialización.

Lea también

Una charla sincera con Sean Redmond sobre ChipStart en el Reino Unido

Entrevista con el director ejecutivo: Jay Dawani de Lemurian Labs

Siete empresas de catalizadores de silicio expondrán en CES, el evento tecnológico más poderoso del mundo

Comparte esta publicación a través de:

punto_img

Información más reciente

punto_img