Un desarrollador identificado como @0x0SojalSec afirma haber conseguido usar el Neural Engine del Apple M4 para tareas de entrenamiento de IA, algo que Apple no expone oficialmente a los desarrolladores. La demostración se habría compartido mediante un repositorio de GitHub, y el punto clave está en comunicarse con el acelerador sin Core ML, Metal ni GPU.
La información debe tratarse con cautela, porque hablamos de ingeniería inversa y de un proyecto no oficial. Apple orienta el Neural Engine a inferencia, es decir, a ejecutar modelos ya entrenados, mientras que esta prueba intenta llevarlo más lejos. No sería una función soportada por Apple, sino una exploración técnica fuera del flujo oficial de Apple Silicon.
El Neural Engine se usa oficialmente para inferencia
En los chips Apple Silicon, el Neural Engine está pensado para acelerar modelos ya entrenados con baja latencia y buena eficiencia energética. Esa orientación encaja con tareas de IA local como reconocimiento, clasificación, edición de imagen o funciones del sistema, pero Apple no ofrece una vía pública directa para entrenar modelos nuevos en este acelerador.
El entrenamiento es mucho más exigente que la inferencia. No basta con ejecutar un modelo, porque también hay que calcular gradientes, actualizar pesos y repetir iteraciones con una gestión de memoria muy precisa. Por eso, usar el Neural Engine del M4 para entrenamiento implica forzar un uso que Apple no documenta ni garantiza.
@0x0SojalSec habría usado un MIL propio desde cero
Según la información compartida en X, @0x0SojalSec habría publicado código en GitHub para mostrar cómo logró acceder a parte del potencial del M4. El punto llamativo es que la prueba no recurre a Core ML, Metal ni a la GPU, ya que el acceso se habría construido mediante un MIL personalizado desarrollado desde cero.
Ese MIL, o Model Intermediate Language, actuaría como una capa intermedia para organizar el modelo y comunicarse con el hardware de una forma no prevista por Apple. La diferencia es importante, porque no hablamos de optimizar una ruta oficial, sino de crear una vía alternativa para saltar limitaciones de software.
La demostración también incluye un mecanismo para continuar el entrenamiento cuando el proceso se bloquea. El proyecto recurre al comando exec() para reiniciar el estado y seguir ejecutando la tarea, lo que en la práctica serviría para mantener vivo el entrenamiento cuando la ejecución necesita refrescarse para no caer.
Mantener todo en RAM sería la clave de la velocidad
Otro detalle importante es que el proceso evita escribir en la memoria NAND del dispositivo. Según el autor, todo se mantiene en RAM, lo que reduce latencias y evita un cuello de botella mucho más lento. En este tipo de carga, mantener datos y estados en memoria puede ser decisivo para que el entrenamiento no se vuelva impracticable.
La afirmación más llamativa es que el Apple M4 podría alcanzar hasta 15,8 TFLOPS en procesamiento de IA dentro de este escenario. Esa cifra sugiere margen para entrenar modelos ligeros sin recurrir a una estación de trabajo cara, aunque la potencia teórica no debe confundirse con rendimiento estable en modelos grandes o cargas profesionales.
El propio enfoque tendría sentido en equipos como un iPad o un Mac con M4, donde la memoria unificada puede ayudar a reducir copias entre componentes. Aun así, el resultado dependerá del tamaño del modelo, la RAM disponible, el control térmico y la estabilidad de una ruta no oficial.
El avance no sustituye a una GPU NVIDIA de gama profesional
La comparación con una GPU NVIDIA resulta inevitable, pero conviene ponerla en contexto. Una cosa es demostrar entrenamiento local ligero en un M4, y otra competir con plataformas maduras para IA, CUDA, grandes cantidades de VRAM y bibliotecas profesionales. El valor de esta prueba estaría en democratizar experimentos pequeños, no en reemplazar hardware especializado.
Para desarrolladores independientes, estudiantes o investigadores, una vía así podría ser interesante si llega a reproducirse con estabilidad. Permitiría probar modelos pequeños o ajustes ligeros directamente en hardware Apple, y eso convertiría el Neural Engine en algo más útil que un acelerador cerrado para inferencia.
El problema está en la dependencia de rutas no documentadas. Una actualización de macOS, iPadOS, firmware o del propio silicio podría romper el método. Por eso, esta demostración puede ser técnicamente brillante y, al mismo tiempo, demasiado frágil para usarla como base de producción.
Apple hid 15.8 TFLOPS of raw AI power in every M4 Mac & iPhone.
They only let you use the Neural Engine for inference.
Reverse-engineered their private APIs and ran full backpropagation & transformer training directly on the
ANE, No CoreML, No Metal, No GPU,– Training… pic.twitter.com/j5WSWX5dfH
— Md Ismail Šojal 🕷️ (@0x0SojalSec) June 15, 2026
El M5 abre una pregunta, pero no una garantía
La noticia también plantea una duda lógica: si esto se ha conseguido con M4, ¿qué podría pasar con M5? Sobre el papel, una generación más avanzada debería ofrecer más margen, pero no hay confirmación de que el mismo MIL personalizado funcione igual en el nuevo Apple Silicon.
Tampoco está claro que el uso de exec() para reiniciar y continuar el entrenamiento se comporte del mismo modo en una plataforma más reciente. Apple podría haber cambiado rutas internas, permisos o comportamiento del sistema. El salto a M5 no debe darse por hecho hasta que el código vuelva a demostrarse en hardware real.
La lectura final es que este proyecto muestra una tensión interesante dentro de Apple Silicon. El hardware tiene aceleradores muy potentes, pero el acceso oficial sigue siendo limitado. Si más desarrolladores reproducen este tipo de pruebas, aumentará la presión para que Apple abra mejor el Neural Engine a cargas avanzadas de IA.
Una prueba experimental con mucho potencial técnico
El mérito de esta demostración está en explorar una capacidad que Apple no ofrece públicamente. @0x0SojalSec no habría usado las herramientas habituales de la compañía, sino un entorno propio para empujar el M4 más allá de sus límites de software. Eso convierte la prueba en una señal técnica relevante, aunque todavía lejos de una solución comercial estable.
Si el repositorio de GitHub permite que otros desarrolladores validen resultados, el proyecto podría abrir una vía real para entrenamiento local ligero en Apple Silicon. Hasta entonces, la noticia debe verse como una demostración prometedora, experimental y con muchas incógnitas de compatibilidad futura.
Vía: Wccftech










