Optimización de memfill (relleno de memoria por patrón)

Esta implementación no replica el comportamiento de memset estándar (byte a byte), sino que rellena memoria usando patrones de tamaño palabra (int, long, long long) con el objetivo de maximizar el rendimiento de escritura en memoria.

1. Alineación de memoria

Antes de realizar escrituras grandes, el puntero de destino se alinea a límites favorables para la caché (típicamente 64 bytes, tamaño habitual de una cache line).

Por qué importa:

Cómo se hace:


2. Construcción del patrón de escritura

El valor recibido es un int, pero se expande para llenar tipos más grandes:

Esto permite escribir una sola instrucción que copia múltiples bytes a la vez.

Ventaja: