Logotipo de Zephyrnet

Modelo Magika AI de identificación de archivos de código abierto de Google

Fecha:

Google ha abierto Magika, un identificador de archivos interno impulsado por aprendizaje automático, como parte de su Iniciativa de Defensa Cibernética de IA, cuyo objetivo es brindar a los defensores de las redes de TI y a otros mejores herramientas automatizadas.

Determinar el verdadero contenido de un archivo enviado por un usuario quizás sea más difícil de lo que parece. No es seguro asumir el tipo de archivo a partir de, por ejemplo, su extensión y confiar en heurísticas y reglas creadas por humanos, como las del ampliamente utilizado libmagic – identificar la naturaleza real de un documento a partir de sus datos es, en opinión de Google, "consumo de tiempo y propenso a errores".

Básicamente, si alguien sube un archivo .JPG a su servicio en línea, debe asegurarse de que sea una imagen JPEG y no un script disfrazado de tal, que luego podría morderle el trasero. Ingrese Magika, que utiliza un modelo entrenado para identificar rápidamente tipos de archivos a partir de datos de archivos, y es un enfoque que la Gran G cree que funciona lo suficientemente bien como para usarlo en producción. Se nos dice que Magika es utilizada por Gmail, Google Drive, Navegación segura de Chrome y VirusTotal para identificar y enrutar adecuadamente los datos para su posterior procesamiento.

Su experiencia puede ser diferente. Libmagic, por ejemplo, podría funcionar bastante bien para usted. En cualquier caso, Magika es un ejemplo de cómo Google utiliza internamente inteligencia artificial para reforzar su seguridad y espera que otros también puedan beneficiarse de esa tecnología. Otro ejemplo sería RETVec, que es un modelo de procesamiento de textos en varios idiomas que se utiliza para detectar spam. Esto llega en un momento en el que a todos se nos advierte que los malhechores aparentemente están haciendo un mayor uso del software de aprendizaje automático para automatizar las intrusiones y la investigación de vulnerabilidades.

Los formuladores de políticas, los profesionales de la seguridad y la sociedad civil tienen la oportunidad de inclinar finalmente la balanza de la ciberseguridad de los atacantes a los ciberdefensores.

"La IA se encuentra en una encrucijada definitiva, una en la que los formuladores de políticas, los profesionales de la seguridad y la sociedad civil tienen la oportunidad de inclinar finalmente el equilibrio de la ciberseguridad de los atacantes a los ciberdefensores", Phil Venables, director de seguridad de la información de Google Cloud, y Royal Hansen, vicepresidente de ingeniería para la privacidad, la seguridad y la protección, dijo el viernes. 

"En un momento en el que actores maliciosos están experimentando con la IA, necesitamos medidas audaces y oportunas para dar forma a la dirección de esta tecnología".

la pareja cree Mágica Los defensores de la red pueden utilizarlo para identificar, de forma rápida y a escala, el verdadero contenido de los archivos, lo cual es un primer paso en el análisis de malware y la detección de intrusiones. Para ser honesto, este modelo de aprendizaje profundo podría ser útil para cualquiera que necesite escanear documentos proporcionados por el usuario: los videos que en realidad son ejecutables, por ejemplo, deberían hacer saltar alguna alarma y requerir una inspección más cercana. Los archivos adjuntos de correo electrónico que no son lo que dicen deben ser puestos en cuarentena. Entiendes la idea.

En términos más generales, en el contexto de la ciberseguridad, los modelos de IA no sólo pueden inspeccionar archivos en busca de contenido sospechoso y código fuente en busca de vulnerabilidades, sino que también pueden generar parches para corregir errores, afirmaron los empleados de Google. Los ingenieros de la megacorporación han estado experimentando con Gemini para mejorar también la fuzzing automatizada de proyectos de código abierto.

Google afirma que Magika es un 50 por ciento más preciso a la hora de identificar tipos de archivos que el anterior sistema de reglas artesanales del negocio, tarda milisegundos en identificar un tipo de archivo y se dice que tiene al menos un 99 por ciento de precisión en las pruebas. Sin embargo, no es perfecto y no logra clasificar los tipos de archivos aproximadamente el tres por ciento de las veces. Tiene licencia Apache 2.0, el código es esta página, y su modelo pesa 1 MB.

Alejándose de Magika, Chocolate Factory también, como parte de esta nueva Iniciativa de Defensa Cibernética de IA, se asociará con 17 nuevas empresas en el Reino Unido, EE. UU. y Europa, y las capacitará para utilizar este tipo de herramientas automatizadas para mejorar su seguridad. 

También ampliará su programa de seminarios de ciberseguridad, valorado en 15 millones de dólares, para ayudar a las universidades a formar a más estudiantes europeos en seguridad. Más cerca de casa, prometió 2 millones de dólares en subvenciones para financiar investigaciones sobre delitos cibernéticos, así como grandes modelos lingüísticos para apoyar a académicos de la Universidad de Chicago, Carnegie Mellon y Stanford.

“La revolución de la IA ya está en marcha. Si bien la gente aplaude con razón la promesa de nuevos medicamentos y avances científicos, también estamos entusiasmados con el potencial de la IA para resolver desafíos de seguridad generacionales y al mismo tiempo acercarnos al mundo digital seguro y confiable que merecemos”, concluyeron Venables y Hansen. ®

punto_img

Información más reciente

punto_img