Este formato (Web ARCHive) permite almacenar la cada vez mayor información disponible en Internet .
Una página web puede estar disponible hoy pero no mañana. Por eso, hacer seguimiento del cada vez mayor número de sitios web ha planteado un serio desafío a los documentalistas. Para facilitar esta tarea, la organización internacional de normalización ISO ha publicado la norma ISO 28500:2009 que ayudará a que la gran cantidad de información disponible en Internet no se pierda cuando una página cambie o desaparezca.
Esta norma recoge los requisitos del formato llamado WARC (del inglés Archivo Web), que ofrece la conjunción de una concatenación de múltiples objetos de datos en un gran archivo. El formato puede ser utilizado para construir aplicaciones que sirvan para extraer, gestionar, acceder e intercambiar contenido.
El formato WARC es una extensión del formato ARC que se ha estado utilizado para el archivo de Internet desde 1996 . WARC ofrece nuevas posibilidades frente al formato antiguo. Así por ejemplo, permite el registro de encabezamientos http y de metadatos, la ubicación de un identificador de cada archivo contenido, la gestión de duplicados y de documentos migrados, así como la segmentación de archivos. Los archivos WARC están concebidos para almacenar cualquier tipo de contenido digital, ya sean recuperados como http o con otro protocolo.