Logotipo de Zephyrnet

La supercomputadora Dojo de Tesla rompe todos los estándares establecidos de la industria - CleanTechnica Deep Dive, Parte 4

Fecha:

Si se perdió las partes iniciales de esta serie, primero puede leer para obtener más información:

La supercomputadora Dojo de Tesla rompe todos los estándares establecidos de la industria - CleanTechnica Deep Dive, Parte 1

La supercomputadora Dojo de Tesla rompe todos los estándares establecidos de la industria - CleanTechnica Deep Dive, Parte 2

La supercomputadora Dojo de Tesla rompe todos los estándares establecidos de la industria - CleanTechnica Deep Dive, Parte 3

Dámelo, doctor, ¿es bueno o malo?

El hecho de que Dojo no sea la supercomputadora con más poder computacional no es algo malo, ya que Tesla construyó esta supercomputadora para una tarea muy específica, que es entrenar redes neuronales basadas en montones y montones de video 360. Todo el código está escrito específicamente para funcionar de manera ideal en este hardware. Todas las demás supercomputadoras e incluso las computadoras normales del mundo se construyen teniendo en cuenta la flexibilidad para poder acomodar una gran variedad de tareas. Por un lado, significa que otras supercomputadoras, incluso la más poderosa Fugaku, probablemente serán más lentas que Dojo para las tareas que Tesla tiene en mente. Por otro lado, este también podría ser el talón de Aquiles de Dojo, ya que cualquier otro tipo de simulaciones para las que los científicos quieran usar una supercomputadora no será fácil y probablemente no funcionará tan rápido como en cualquiera de las otras supercomputadoras. 

Como se dijo en las preguntas y respuestas, Tesla construyó Dojo ante todo para sí mismo y sus necesidades. Tesla no terminará de mejorar el FSD hasta que sea un 1000% más seguro que un ser humano. Durante muchos años ya estaremos durmiendo en un automóvil que no tiene volante, mientras que Tesla seguirá trabajando en los próximos 9 en la cifra de seguridad del 99.9999999%. Entonces, ahora que han anunciado el robot Tesla llamado Optimus Sub-Prime (ya que aún no ha llegado su horario de máxima audiencia), Tesla, y en consecuencia Dojo, tiene un nuevo reino de desafíos para explorar. Además, incluso si Dojo no podrá ayudar a los científicos a encontrar la materia oscura u otros misterios del cosmos, hay toneladas de otras aplicaciones de inteligencia artificial del mundo real como cocinas robóticas, automatización de fábricas, robots de construcción espacial y muchas otras para las que Dojo será absolutamente perfecto. 

Dojo aún podría convertirse en la supercomputadora más poderosa del mundo

Dojo se compone de solo 10 gabinetes y, por lo tanto, también es la supercomputadora más pequeña del mundo en lo que respecta a tamaño. Fugaku, por otro lado, se compone de Gabinetes 256. Si Tesla añadiera 54 gabinetes a Dojo V1 para un total de 64 gabinetes, Dojo superaría a Fugaku. Entonces, finalmente, si Dojo 2.0 es en realidad 10 veces más poderoso que Dojo en este momento, entonces, incluso con solo 10 gabinetes, Dojo V2 sería la supercomputadora más poderosa del mundo por un margen saludable.

Cómo Tesla mejorará Dojo 2.0

Entonces, desde el momento en que vi todas las innovaciones revolucionarias en la arquitectura de Tesla, saber cómo trabaja Elon con su Proceso de diseño de 5 pasos, se hizo evidente cómo surgieron algunas de estas ideas y que sucedieron a la mitad del proceso de diseño. 

Esos pasos (que aprendimos recientemente gracias al YouTuber y al experto en SpaceX Tim Dodd, el "Astronauta de todos los días", en su entrevista de 3 partes con Elon Musk) son:

  1. Haga que sus requisitos sean menos tontos
  2. Esfuércese mucho por eliminar la pieza o el proceso 
  3. 3 simplifica u optimiza
  4. Acelerar el tiempo de ciclo
  5. Automatizar.

Aquí hay una versión simplificada de lo que probablemente sucedió a la mitad del proceso de diseño:

Elón: "Está bien, guíeme a través de los pasos de fabricación de nuevo".

El equipo de hardware responde: “Entonces, paso 1, todos los componentes se agregan a la oblea de silicio. Paso 2, corta todos los SoC de la oblea ".

Elon interrumpe: "¿Y si no lo hacemos?"

El equipo de hardware responde: "¿Y si no lo hacemos?"

Elon aclara: “¿Qué pasa si no los cortamos de la oblea, simplemente los dejamos ahí? ¿No podemos hacer que se hablen directamente en la oblea? "

Y el resto es historia.

Para la mejora de 10 ×, lo primero que podrán hacer es en lugar de dejar un montón de SoC en una oblea, podrían crear una Sistema Obien Wafer en lugar de 25 SSistemas Obien Ccadera (s) en una oblea. Ser modular es útil, pero convertir toda la oblea en un sistema podría aumentar significativamente el rendimiento. Dado que esto también sería algo sin precedentes, es difícil predecir cuánto aumentará el rendimiento, pero mi intuición dice que esto sería muy poderoso. Además, es el siguiente paso lógico que se incluiría en “1. Haga que sus requisitos sean menos tontos ".

Luego, la segunda optimización no proviene de Tesla sino de Samsung (o TSMC). Como se dijo anteriormente, el hecho de que el chip D1 esté fabricado en una escala de 7 nm muestra que fue Samsung o TSMC quienes fabricaron el chip / oblea. Para 2022, ambas compañías esperan tener su proceso de 3 nm en funcionamiento, y esto mejorará el rendimiento al menos 2.3 veces y reducirá el consumo de energía. De hecho, el aumento de rendimiento podría ser aún mayor, ya que Tesla tiene una solución de enfriamiento mucho mejor, lo que hace que el aumento de calor producido por el troquel se encoja menos y no comprometa las velocidades del reloj.

Con los SoC en una oblea, parecía que Tesla no anticipó que los chips de conmutación de red serían tan lentos y que sería mejor que fabricaran los suyos propios. Con más tiempo, podrían mejorar eso aún más. Finalmente, en este momento Tesla está utilizando PCI-e gen 4, pero en unos años, PCI-e gen 5 volverá a duplicar la velocidad a la que Tesla puede conectar obleas entre sí.

En general, es difícil decir qué mejoras, incluidas las que no puedo pensar en este momento, llevarán a la mejora del rendimiento de 10 veces. No obstante, esa es la cifra que dio Tesla y todos sabemos mejor que apostar contra Elon.


El mosaico de entrenamiento de Tesla es la octoválvula de silicio

Ahora que está íntimamente familiarizado con Dojo, hay un paralelo realmente bueno que puedo trazar para usted. Es posible que algunos de ustedes hayan visto a Sandy Munro en YouTube. Ha desmontado el Tesla Model Y y el Ford Mustang Mach-E (entre otros vehículos). Espero que hayas visto esos videos, pero si no, échale un vistazo esta y esta.

El Mach-E es un automóvil fantástico, lo conduje recientemente (la revisión completa llegará muy pronto), pero por la forma en que manejaron el intercambio de calor, Sandy Munro literalmente finge desmayarse al verlo, mientras que Tesla tiene algo llamado Octovalve, que no lo hace. No tengo más de 30 mangueras conectando cosas. Octovalve es un paquete todo en uno muy ajustado de una manera que nunca antes se había hecho. Entonces, en lugar de 18 metros de mangueras, Tesla tiene 6 metros. En lugar de 35 partes, Tesla tiene 10. En lugar de contener 22.4 kg de líquido que es más difícil de calentar / enfriar, Tesla tiene solo 9 kg de líquido.

Para Dojo, esta loseta de entrenamiento, es sin duda la Octoválvula de silicio. Aunque, en mi opinión, aún más impresionante. Cuando miro mi hermosa computadora de escritorio a mi derecha y el mosaico de entrenamiento de Tesla en la pantalla a mi izquierda, realmente se siente exactamente como mi poderosa computadora con todos los tubos y cables se ha convertido en esa Mach-E. Todos deberíamos desmayarnos. En todo caso, también muestra cuánto ha estado aflojando la industria de las computadoras con el pensamiento estándar y con nuestros cómodos puertos y estándares compatibles con versiones anteriores. Este es realmente un momento de Nokia contra iPhone.

La única parte triste es que la arquitectura SoC de Tesla está tan mal equipada para propósitos además de entrenar redes neuronales alimentadas con video. No obstante, si los procesadores estándar, las tarjetas gráficas y los chips SoC fueran diseñados para este mismo tipo de elegancia, compresión y modularidad, podríamos hacer que todas las computadoras del mundo fueran mucho más potentes. De hecho, aunque las preguntas y respuestas no fueron muy claras, parece que Tesla también podría querer hacer una "pila híbrida" con diferentes SoC para que Dojo pueda procesar más tipos de tareas.

Chip HW4 a partir de Cybertruck

Durante la sesión de preguntas y respuestas, Elon reveló que HW4 llegará en aproximadamente un año y se lanzará junto con Cybertruck. Al mismo tiempo, Cybertruck también tendrá al menos una cámara mejorada o tal vez incluso un sistema de cámara completamente nuevo. Sin embargo, Elon explicó que todavía no han maximizado las cámaras que utilizan actualmente y que el nuevo sistema de cámaras no será necesario para que el automóvil logre una autonomía total a un nivel de seguridad entre un 200% y un 300% más seguro que un conductor humano.

En contradicción con lo que dijo Elon durante el Día de la Autonomía, HW4 será 4 veces más capaz que HW3. Anteriormente en la sesión de preguntas y respuestas, Tesla declaró que no pueden hacer que las redes neuronales sean demasiado complejas o que la latencia en HW3 sería demasiado lenta. Si bien esto no se dijo expresamente durante el día de la IA, el aumento de potencia 4x que viene con HW4 significa que más y más redes neuronales más grandes / más complejas se volverían viables y habrían tardado demasiado en encontrar una respuesta en HW3. Curiosamente, Tesla también dijo que las redes neuronales más grandes solo funcionan mejor si tienes los datos para alimentarlas. Por lo tanto, Dojo que puede procesar tanto video es exactamente lo que Tesla necesita para hacer redes neuronales más complejas.

Ofreciendo software de entrenamiento Dojo y AI Neural Net a otros

Ya publiqué un artículo completo y un video sobre esto justo antes del Día de la IA, y todo sigue siendo cierto después del Día de la IA, especialmente el análisis. ¡Eso es genial! Dependiendo de la interpretación de las preguntas y respuestas, incluso podría haber tenido razón en mis predicciones, aunque Tesla no lo confirmó expresamente.

De hecho, Tesla ha automatizado significativamente el proceso de capacitación y etiquetado de IA hasta el punto de que los expertos en aprendizaje automático pueden concentrarse en las tareas más difíciles, mientras que los etiquetadores pueden hacer más del trabajo preliminar necesario para entrenar el piloto automático. Elon ahora ha dicho en Twitter que Tesla ofrecerá Dojo como servicio. Sin embargo, a partir de la presentación y las preguntas y respuestas, quedó claro que esto no es muy útil a menos que: A) esté creando una IA del mundo real que esté entrenada con una gran cantidad de secuencias de video y simulaciones, y B) esté haciendo uso de los altamente herramientas automatizadas para etiquetado y entrenamiento de IA. Tesla afirmó que trabajarán en una extensión de PyTorch para hacer que Dojo funcione bien con las herramientas a las que están acostumbrados los científicos de ML, pero la audiencia parecía escéptica sobre qué tan bien funcionaría esto en el hardware muy específico de Dojo.

Si bien esto no se confirmó expresamente, lo más probable es que Tesla ofrecerá sus herramientas de capacitación y etiquetado junto con acceso a Dojo, una pila de desarrollo de software completa, y la imagen de arriba parece respaldar esa hipótesis. Elon también confirmó una vez más que Tesla está dispuesto a otorgar licencias de FSD a otros fabricantes de automóviles, y es de esperar que Tesla AI Day los haya hecho pensar al menos dos veces sobre eso.

En el Fin

Ver el Día de la IA fue absolutamente impactante para mí. Ha destrozado mi percepción de lo que es posible cuando se trata de tecnología informática. Esta es al menos la tercera vez que Tesla me ha hecho esto, en ocasiones anteriores, incluidas Día de la batería y Día de la autonomía. Tesla es una empresa como ninguna otra, y realmente no te deja olvidarlo. Dojo, la Octovalve, el nuevo motor eléctrico envuelto por presión, la celda 4680, la Terafactory, y la lista continúa.

Sabes que también estoy muy aliviado de que después de muchos años finalmente haya obtenido una respuesta a una pregunta que tenía para Elon. Esa pregunta era: Elon, tienes la máquina que construye la máquina, entonces, ¿dónde está el robot que construye el robot? He cubierto brevemente lo que puede significar el futuro de un robot en mi artículo / video anterior, pero ahora que Tesla ha anunciado Optimus Sub-Prime, también haré un análisis por separado de eso en la primera oportunidad.

Dojo es alucinante, y espero que este análisis le haya ayudado a comprender completamente el alcance de los avances tecnológicos que Tesla ha logrado.

 

¿Aprecia la originalidad de CleanTechnica? Considera convertirte en un Miembro, colaborador, técnico o embajador de CleanTechnica - o un mecenas en Patreon.

 

 


Anuncio


 


¿Tiene un consejo para CleanTechnica, quiere publicitar o quiere sugerir un invitado para nuestro podcast CleanTech Talk? Contáctenos aquí.

PlatoAi. Web3 reinventado. Inteligencia de datos ampliada.
Haga clic aquí para acceder.

Fuente: https://cleantechnica.com/2021/08/22/teslas-dojo-supercomputer-breaks-all-established-industry-standards-cleantechnica-deep-dive-part-4/

punto_img

Información más reciente

punto_img