TRELLIS.2 Image-to-3D Portado para Ejecutarse de Forma Nativa en Apple Silicon

Qué es esto
Una adaptación del modelo de imagen a 3D TRELLIS.2 de Microsoft que se ejecuta de forma nativa en Apple Silicon a través de PyTorch MPS, reemplazando las dependencias exclusivas de CUDA con alternativas puras de PyTorch.
Detalles clave
El TRELLIS.2 original requiere CUDA con flash_attn, nvdiffrast y núcleos de convolución dispersa personalizados que no funcionan en Mac. Esta adaptación los reemplaza con:
- Una implementación de convolución 3D dispersa de recopilación-dispersión (backends/conv_none.py)
- Atención SDPA para transformadores dispersos usando scaled_dot_product_attention de PyTorch
- Extracción de mallas basada en Python reemplazando operaciones de mapa hash de CUDA (backends/mesh_extract.py)
Los cambios totales son unos cientos de líneas en 9 archivos. Todas las llamadas .cuda() codificadas se parchearon para usar el dispositivo activo en su lugar.
Rendimiento y requisitos
En M4 Pro (24GB), genera mallas de ~400K vértices a partir de fotos individuales en aproximadamente 3.5 minutos. El uso de memoria alcanza un máximo de alrededor de 18GB de memoria unificada durante la generación.
Requisitos:
- macOS en Apple Silicon (M1 o posterior)
- Python 3.11+
- 24GB+ de memoria unificada recomendada
- ~15GB de espacio en disco para los pesos del modelo
Configuración y uso
Inicio rápido:
git clone https://github.com/shivampkumar/trellis-mac.git
cd trellis-mac
hf auth login
bash setup.sh
source .venv/bin/activate
python generate.py path/to/image.pngNecesitas solicitar acceso a los modelos con acceso restringido en HuggingFace: facebook/dinov3-vitl16-pretrain-lvd1689m y briaai/RMBG-2.0.
Uso básico:
python generate.py photo.png
python generate.py photo.png --seed 123 --output my_model --pipeline-type 512Limitaciones
- Sin exportación de texturas (las mallas se exportan solo con colores de vértice)
- Relleno de agujeros desactivado (las mallas pueden tener pequeños agujeros)
- Más lento que CUDA (~10x más lento para convolución dispersa)
- Solo inferencia, sin soporte para entrenamiento
Implementación técnica
La convolución 3D dispersa construye un hash espacial de vóxeles activos, recopila características vecinas para cada posición del núcleo, aplica pesos mediante multiplicación de matrices y dispersa-suma los resultados nuevamente. La extracción de mallas reimplementa flexible_dual_grid_to_mesh usando diccionarios de Python en lugar de operaciones de mapa hash de CUDA.
Puntos de referencia en M4 Pro (24GB), tipo de pipeline 512:
- Carga del modelo: ~45s
- Preprocesamiento de imagen: ~5s
- Muestreo de estructura dispersa: ~15s
- Muestreo de SLat de forma: ~90s
- Muestreo de SLat de textura: ~50s
- Decodificación de malla: ~30s
- Total: ~3.5 min
📖 Leer la fuente completa: HN LLM Tools
👀 Ver también

Kontext CLI: Intermediario de Credenciales para Agentes de Codificación con IA
Kontext CLI es un intermediario de credenciales basado en Go que proporciona a los agentes de codificación con IA tokens de acceso de corta duración en lugar de claves API de larga duración. Utiliza el intercambio de tokens RFC 8693, transmite registros de auditoría para cada llamada de herramienta y funciona con Claude Code hoy mismo.

Cómo Mendral redujo los costos de LLM al actualizar a Opus: Patrón de Triaje, Acceso SQL y Arquitectura de Subagentes
Mendral pasó de Sonnet a Opus 4.6 para el análisis de fallos de CI, pero redujo costos mediante el uso de un triador Haiku que desvía el 80% de los fallos, dando a los agentes acceso SQL a ClickHouse en lugar de enviar registros, y generando subagentes baratos para hacer la investigación real.

La actualización de V6rge AI Suite agrega soporte para GPU NVIDIA y un agente de codificación en versión beta.
V6rge AI Suite ha lanzado una actualización que corrige problemas de detección de GPU, añade soporte completo para GPU NVIDIA para un mejor rendimiento e introduce un nuevo agente de programación en versión beta que genera y asiste con código directamente dentro de la aplicación.

OpenClaw PARA Habilidad Organiza Automáticamente Archivos Usando el Método de Tiago Forte.
Un desarrollador creó una habilidad para OpenClaw que aplica el método PARA (Proyectos, Áreas, Recursos, Archivos) para la organización automática de archivos, moviendo archivos desde un directorio raíz desordenado hacia carpetas estructuradas.