A complete Llama2 inference engine that fits in 1356 bytes of x86 assembly

monax 26 points 0 comments May 05, 2026

Related Discussions

Found 5 related stories in 782.1ms across 14,015 title embeddings via pgvector HNSW