¿Qué es la procedencia de los datos? Ejemplos y mejores prácticas

¿Qué es la procedencia de los datos?

Una brecha afecta tu infraestructura en la nube a la 1:47 AM. Tu equipo de respuesta a incidentes se apresura a responder tres preguntas: ¿De dónde se originaron estos datos? ¿Quién los accedió? ¿Cómo cambiaron entre la ingestión y la exfiltración? Sin respuestas claras derivadas de datos de procedencia detallados y registros de auditoría, tu investigación forense se detiene, tu postura de cumplimiento se debilita y tu equipo legal carece de pruebas admisibles.

La procedencia de los datos resuelve este problema. Según el NIST Computer Security Resource Center, la procedencia de los datos "implica el método de generación, transmisión y almacenamiento de información que puede ser utilizada para rastrear el origen de una pieza de información" procesada por sistemas y flujos de trabajo. Realiza un seguimiento de cada pieza de datos desde el momento de su creación a través de cada transformación, evento de acceso y ubicación de almacenamiento durante todo su ciclo de vida.

La procedencia de los datos es la huella forense de tus datos. Te indica de dónde provienen los datos, quién los manipuló y qué les sucedió en cada paso.

Data Provenance - Featured Image | SentinelOne

Cómo se relaciona la procedencia de los datos con la ciberseguridad

La procedencia de los datos une la integridad forense, la búsqueda de amenazas y el cumplimiento normativo. Los CISA Incident Response Playbooks (agosto de 2024) integran el seguimiento de la procedencia a lo largo de las fases de respuesta a incidentes de NIST SP 800-61, específicamente durante la fase de análisis donde comprender el origen de los datos se vuelve esencial para una remediación efectiva.

Investigaciones revisadas por pares publicadas en ACM Computing Surveys confirman el valor operativo de estos sistemas, señalando que la detección de intrusiones basada en procedencia ha surgido como un enfoque prometedor para reducir alertas falsas, identificar ataques reales y facilitar la investigación al vincular causalmente actividades del sistema en gráficos de procedencia.

Incidentes del mundo real muestran por qué la procedencia es importante. El ataque a MGM Resorts en 2023 causó más de 100 millones de dólares en pérdidas cuando los atacantes usaron ingeniería social para obtener acceso inicial. Las organizaciones con un sólido seguimiento de procedencia pueden reconstruir cronologías de ataques en horas en lugar de semanas, identificando exactamente qué credenciales fueron comprometidas y a qué sistemas se accedió.

Cuando investigas un incidente de movimiento lateral, los datos de procedencia permiten la reconstrucción completa de la cadena de ataque. Documenta qué credenciales se usaron, a qué sistemas se accedió y en qué orden. Esta documentación transforma alertas de seguridad dispersas en narrativas coherentes de ataque que tu equipo de respuesta a incidentes puede abordar de inmediato.

Comprender los diferentes tipos de procedencia te ayuda a determinar qué capturar y cómo aplicarlo en tus operaciones de seguridad.

Tipos de procedencia de los datos

La procedencia de los datos se divide en dos categorías principales, cada una con un propósito distinto en las operaciones de seguridad.

Procedencia prospectiva captura la especificación de lo que debería suceder. Define flujos de trabajo esperados, rutas de datos aprobadas y pasos de procesamiento autorizados antes de que ocurra la ejecución. En ciberseguridad, la procedencia prospectiva establece tu línea base de seguridad. Documenta canalizaciones de compilación de software aprobadas, flujos de datos autorizados entre sistemas y patrones de acceso esperados. Cuando una política de cadena de suministro de software especifica que el código de producción debe pasar por tres etapas de compilación verificadas antes de su despliegue, esa especificación es procedencia prospectiva.
Procedencia retrospectiva captura lo que realmente sucedió. Registra el historial de ejecución detallado de cada proceso, transformación y evento de acceso después de los hechos. Este es el tipo más directamente relevante para la investigación forense. La procedencia retrospectiva indica a tu equipo SOC exactamente qué procesos se ejecutaron, qué archivos se modificaron y qué credenciales se usaron durante un incidente. Cuando la tecnología Storyline de SentinelOne reconstruye una cronología de ataque desde la creación de procesos hasta el movimiento lateral, está construyendo procedencia retrospectiva.

El valor de seguridad surge al comparar ambas. Cuando la procedencia retrospectiva se desvía de la prospectiva, tienes una anomalía que vale la pena investigar. Una canalización de compilación que de repente incluye un paso no autorizado, un flujo de datos que pasa por un servidor inesperado o una cuenta de usuario accediendo a recursos fuera de su patrón aprobado, todos representan brechas entre lo que debería suceder y lo que realmente sucedió.

La investigación en bases de datos también distingue la procedencia según las preguntas que responde:

Procedencia de por qué identifica qué entradas contribuyeron a una salida específica. En operaciones de seguridad: ¿Por qué se activó esta alerta?
Procedencia de cómo documenta las transformaciones aplicadas. En operaciones de seguridad: ¿Cómo se modificó este archivo?
Procedencia de dónde rastrea de qué ubicaciones de origen provino un valor de datos particular. En operaciones de seguridad: ¿De dónde se originó esta credencial?

Estas categorías se corresponden directamente con las preguntas que tu equipo SOC realiza durante cada investigación, y determinan lo que tu sistema de procedencia necesita capturar.

Procedencia de los datos vs. linaje de los datos

La procedencia de los datos y el linaje de los datos se superponen pero cumplen propósitos operativos diferentes. Confundir ambos conduce a brechas tanto en tu capacidad forense como en tu postura de cumplimiento.

Linaje de los datos mapea el flujo de datos desde la fuente hasta el destino. Responde "¿cómo llegaron estos datos aquí?" rastreando rutas de transformación, pasos de procesamiento y movimientos de sistema a sistema. El linaje te muestra que un registro de cliente se movió de una base de datos CRM a través de una canalización ETL hacia un almacén de datos, donde se agregó a un informe trimestral. En contextos de seguridad, el linaje te ayuda a entender cómo se propagó un ataque en tu entorno.
Procedencia de los datos agrega la capa forense que le falta al linaje. Responde "¿quién manipuló estos datos, cuándo y bajo qué autoridad?" La procedencia registra los agentes responsables, las marcas de tiempo de cada interacción y la cadena de custodia desde el origen hasta el estado actual. Durante una investigación, la procedencia te indica que una cuenta de servicio específica accedió a ese registro de cliente a las 2:14 AM, modificó tres campos y transfirió el resultado a una dirección IP externa, todo vinculado a una sola identidad con metadatos de auditoría completos.

Los equipos de seguridad necesitan ambos. El linaje reconstruye la ruta del ataque. La procedencia construye la cadena de custodia que se sostiene durante auditorías regulatorias y procedimientos legales. El estándar W3C PROV codifica ambas dimensiones a través de su modelo entidad-actividad-agente, donde las entidades capturan el estado de los datos, las actividades capturan las transformaciones (linaje) y los agentes capturan la responsabilidad (procedencia).

Ver cómo la procedencia y el linaje operan en la práctica en diferentes industrias hace que estas distinciones sean concretas.

Ejemplos de procedencia de los datos

La procedencia de los datos se aplica en todas las industrias donde se requiere integridad de los datos, responsabilidad forense o cumplimiento normativo.

Seguridad de la cadena de suministro de software. Durante el incidente de SolarWinds en 2020, los atacantes inyectaron código malicioso en una canalización de compilación de software legítima. Las organizaciones con seguimiento de procedencia de software, incluidos SBOMs y atestaciones de compilación firmadas, podían verificar si sus versiones desplegadas coincidían con la cadena de compilación esperada. Aquellas sin datos de procedencia pasaron meses determinando qué compilaciones fueron comprometidas. El NIST Secure Software Development Framework ahora exige controles de procedencia para artefactos de software.
Cumplimiento de datos en salud. Hospitales y organizaciones de investigación clínica rastrean la procedencia de los datos de pacientes para cumplir con los controles de auditoría HIPAA bajo §164.312(b). Cada acceso, modificación y transferencia de información de salud protegida requiere una cadena de custodia documentada. Cuando ocurre una brecha de datos, los registros de procedencia permiten a los equipos de cumplimiento determinar exactamente qué registros de pacientes fueron accedidos y por quién.
Investigación de incidentes en la nube. En entornos en la nube efímeros, los contenedores se inician y terminan en minutos. El seguimiento de procedencia en la capa de orquestación captura lo que hizo cada contenedor antes de su terminación, incluyendo a qué datos accedió, qué APIs llamó y qué conexiones de red realizó. Sin esta procedencia, la evidencia forense desaparece junto con la carga de trabajo.
Integridad de datos de entrenamiento de IA. A medida que las organizaciones implementan modelos de aprendizaje automático para operaciones de seguridad, el seguimiento de procedencia verifica que los conjuntos de datos de entrenamiento no hayan sido manipulados. Un aviso conjunto de 2025 de CISA, NSA y el FBI identifica la procedencia de los datos como un control clave para proteger los sistemas de IA contra ataques de envenenamiento de datos.

Estos ejemplos muestran la procedencia operando en diferentes niveles de granularidad, desde eventos de acceso a archivos individuales hasta la verificación de la cadena de suministro a nivel empresarial. Los componentes subyacentes permanecen consistentes en todos ellos.

Componentes principales de la procedencia de los datos

Cada sistema de procedencia de datos se basa en un marco estructurado de componentes interconectados. El estándar W3C PROV establece tres elementos principales:

Entidades: Los objetos de datos que rastreas, incluidos archivos, registros de bases de datos, entradas de registros, paquetes de red y artefactos de evidencia digital. El estándar W3C PROV define las entidades como "cosas físicas, digitales, conceptuales u otras con aspectos fijos".
Actividades: Los procesos, acciones y flujos de trabajo que crean o transforman entidades, como operaciones de cifrado, transferencias de archivos, llamadas a API y eventos de acceso de usuarios. El estándar W3C define las actividades como "aspectos dinámicos como procesos, acciones y flujos de trabajo".
Agentes: Las personas, organizaciones o software responsables de las actividades, incluyendo cuentas de usuario, principales de servicio, procesos autónomos e integraciones de terceros. Según W3C PROV, los agentes son "entidades que asumen la responsabilidad de actividades o de la existencia de una entidad".

Estos tres elementos se conectan a través de tipos de relación como wasGeneratedBy, wasAttributedTo y wasDerivedFrom, formando gráficos de procedencia que mapean relaciones causales en tu entorno.

Los sistemas de procedencia operativos también capturan metadatos específicos requeridos por los controles de auditoría NIST SP 800-171: marcas de tiempo, direcciones de origen y destino, identificadores de usuario o proceso, descripciones de eventos, indicadores de éxito o fallo, nombres de archivos involucrados y reglas de control de acceso invocadas.

Las bases de datos de grafos proporcionan la base de almacenamiento, permitiendo la exploración de relaciones que requieren las consultas de procedencia. Estándares de formato de eventos como Common Event Format (CEF) y el Open Cybersecurity Schema Framework (OCSF) normalizan los datos de procedencia entre herramientas de seguridad dispares, permitiendo análisis unificados en endpoints, redes y plataformas en la nube.

Con estos componentes en su lugar, la siguiente pregunta es cómo se conectan en un entorno de seguridad en vivo.

Cómo funciona la procedencia de los datos

En producción, los sistemas de procedencia mueven los datos a través de cinco etapas: desde la captura de eventos en bruto hasta el contexto de investigación accionable.

Paso 1: Captura y recopilación de eventos. Los sistemas de procedencia ingieren telemetría en bruto de endpoints, dispositivos de red, registros de auditoría en la nube, proveedores de identidad y capas de aplicación. Cada evento se etiqueta con metadatos en el punto de captura: marcas de tiempo, identificadores de origen y contexto de proceso.
Paso 2: Normalización y mapeo de esquemas. Los eventos en bruto llegan en diferentes formatos desde docenas de fuentes. La Singularity Platform de SentinelOne utiliza la normalización OCSF de forma nativa, eliminando los silos de datos y permitiendo la correlación entre fuentes sin transformación manual.
Paso 3: Construcción y correlación de grafos. Los eventos normalizados se vinculan en gráficos de procedencia utilizando relaciones causales. Los eventos de creación de procesos se conectan a modificaciones de archivos, las conexiones de red se vinculan al uso de credenciales y las acciones de identidad se mapean al acceso a recursos. Esta estructura de grafo transforma entradas de registro aisladas en cadenas de ataque conectadas.
Paso 4: Análisis de comportamiento y detección de anomalías. Los gráficos de procedencia permiten análisis de comportamiento alineados con el marco MITRE ATT&CK. Al mapear entidades de procedencia a técnicas ATT&CK, tus herramientas de seguridad identifican patrones sospechosos: una cuenta de servicio accediendo a archivos desconocidos, un proceso generando procesos hijo anómalos o el uso de credenciales que sugiere movimiento lateral.
Paso 5: Investigación y respuesta. Cuando tu equipo investiga una alerta, los datos de procedencia proporcionan el contexto completo. En lugar de correlacionar manualmente registros entre plataformas, consultas un grafo de procedencia unificado que reconstruye la cronología completa del ataque desde el acceso inicial hasta cada acción subsiguiente.

Este ciclo operativo ofrece ventajas medibles en las operaciones de seguridad, desde investigaciones más rápidas hasta una postura de cumplimiento más sólida.

Beneficios clave de la procedencia de los datos

Cuando se implementa de manera efectiva, la procedencia de los datos ofrece ventajas operativas en velocidad de investigación, integridad de la evidencia, cumplimiento, detección de amenazas y forense en la nube.

Investigación acelerada de incidentes

Los gráficos de procedencia eliminan la correlación manual de registros que consume la mayor parte del tiempo de los analistas durante las investigaciones. En lugar de saltar entre plataformas de seguridad desconectadas, tu equipo consulta una línea de tiempo unificada que muestra exactamente cómo progresó un ataque. La tecnología Storyline de SentinelOne demuestra esto al unir de forma autónoma eventos de seguridad dispares en narrativas completas de ataque sin intervención manual.

Integridad de la evidencia forense

Los enfoques basados en procedencia refuerzan la credibilidad de la evidencia forense digital durante la respuesta a incidentes. Una revisión exhaustiva en ACM Computing Surveys confirma que la documentación de procedencia sobre el manejo y transformación de la evidencia respalda directamente los requisitos de la ISO/IEC 27037 para la identificación, recolección, adquisición y preservación de evidencia digital.

Automatización del cumplimiento normativo

El Artículo 30 del RGPD exige que los responsables del tratamiento de datos mantengan registros detallados de las actividades de procesamiento, incluyendo propósitos, categorías de interesados, destinatarios y transferencias internacionales. Los sistemas de procedencia de datos generan estos registros de forma autónoma, convirtiendo una carga manual de cumplimiento en un subproducto de las operaciones normales de seguridad.

Detección avanzada de amenazas

Los sistemas de identificación de intrusiones basados en procedencia detectan ataques que las herramientas basadas en firmas no identifican, analizando relaciones causales entre eventos. Los gráficos de procedencia revelan campañas APT de múltiples fases, movimiento lateral entre máquinas y técnicas de evasión que parecen benignas cuando se ven como eventos aislados.

Forense en la nube en entornos efímeros

Una revisión revisada por pares en Computer Science Review encontró que la procedencia de los datos ayuda a capturar datos volátiles antes de que desaparezcan en entornos en la nube. Esta capacidad es esencial para investigar incidentes donde los métodos tradicionales de recolección de evidencia fallan debido a la asignación dinámica de recursos.

Estos beneficios conllevan desafíos reales de implementación que tu equipo debe planificar.

Desafíos y limitaciones de la procedencia de los datos

El seguimiento de procedencia introduce sus propios costos operativos y complejidad. Los siguientes desafíos afectan a la mayoría de las organizaciones que implementan procedencia a escala.

Crecimiento del almacenamiento e impacto en el rendimiento

Los datos de procedencia se acumulan rápidamente. Cada evento de seguridad, acceso a archivos y ejecución de procesos agrega nodos y aristas a tu grafo de procedencia. Según investigaciones publicadas en Computers & Security, las demandas de almacenamiento y procesamiento de los grafos de procedencia crecen sustancialmente con una mayor frecuencia de captura de eventos, y la sobrecarga en tiempo de ejecución sigue siendo un desafío clave para la implementación en el mundo real.

Fragmentación entre plataformas

Cada proveedor de nube mantiene mecanismos de auditoría separados con formatos, representaciones de marcas de tiempo y modelos de retención distintos. GCP utiliza dos flujos de registros separados por proyecto. AWS utiliza CloudTrail con su propia estructura de eventos. Están surgiendo estándares como OCSF para normalizar los esquemas de datos entre proveedores, permitiendo un seguimiento unificado de procedencia desde múltiples fuentes.

Puntos ciegos en cargas de trabajo efímeras

Las herramientas de procedencia tradicionales se centran en infraestructura persistente y tienen dificultades con funciones serverless, contenedores autoescalables y procesos solo en memoria. Los datos volátiles pueden sobrescribirse antes de su recolección en entornos en la nube, creando brechas forenses precisamente donde operan los ataques modernos.

Complejidad en la correlación de identidades

Los atacantes que pivotan entre AWS, Azure, GCP y sistemas on-premises explotan la fragmentación de identidades para romper las cadenas de procedencia. Cada plataforma mantiene almacenes de identidad separados, y correlacionar las acciones de un solo actor en estos entornos requiere un mapeo de identidad unificado antes de que el seguimiento de procedencia pueda reconstruir cadenas de ataque entre plataformas.

Conocer estos desafíos te ayuda a evitar los errores que descarrilan los programas de procedencia y aplicar las prácticas correctas desde el principio.

Mejores prácticas de procedencia de los datos

La madurez operativa en procedencia de datos requiere tanto saber qué hacer como evitar lo que frena el progreso.

Comienza con un análisis de brechas frente a los controles de auditoría NIST SP 800-171. Mapea tu cobertura de registros actual frente a los requisitos de NIST SP 800-171 para marcas de tiempo, identificadores de usuario, direcciones de origen y destino, descripciones de eventos y reglas de control de acceso. Identifica dónde falta metadatos de procedencia.
Normaliza a un solo esquema desde el principio, preferiblemente OCSF. El Open Cybersecurity Schema Framework se ha convertido en el estándar de la industria para la normalización de procedencia entre plataformas. Normalizar todos los datos de procedencia en la ingestión elimina los dolores de cabeza de correlación entre endpoints, redes e infraestructura en la nube.
Implementa captura basada en riesgos con retención escalonada. Rastrea todo en activos de alto valor como controladores de dominio y bases de datos financieras, y utiliza muestreo para estaciones de trabajo estándar. Usa almacenamiento en caliente para datos recientes que los analistas consultan durante investigaciones activas y niveles fríos para retención por cumplimiento.
Mapea entidades de procedencia a técnicas MITRE ATT&CK. Alinea los nodos y aristas de tu grafo de procedencia con tácticas ATT&CK para que tus analistas SOC puedan consultar datos de procedencia usando el mismo marco que emplean para threat hunting e ingeniería de detección.
Establece preparación forense antes de que ocurran incidentes. El marco de preparación forense de ISACA enfatiza definir procedimientos de recolección de evidencia y especificar los metadatos de procedencia requeridos de manera proactiva. Incluye la validación de datos de procedencia en cada ejercicio de mesa y en los ejercicios purple team.
Federar la identidad y proteger la integridad de la procedencia. Asegura que un solo actor pueda ser correlacionado de manera definitiva entre AWS, Azure, GCP y sistemas on-premises. Utiliza hash criptográfico, almacenamiento de solo escritura y controles de acceso estrictos para garantizar que los registros de procedencia no puedan ser manipulados después de su creación, protegiendo tanto la precisión forense como la admisibilidad legal según los estándares ISO/IEC 27037:2012.
Considera las cargas de trabajo efímeras. Las funciones serverless y los contenedores autoescalables requieren captura de procedencia en la capa de orquestación. Configura el registro de eventos de datos para todas las funciones serverless y almacenamiento de objetos para asegurar cobertura en entornos dinámicos.

Con estas prácticas establecidas, la plataforma adecuada puede operacionalizar la procedencia a escala.

Fortalece la procedencia de los datos con SentinelOne

La seguridad de IA comienza con los datos, no porque los datos sean abundantes, sino porque los errores cometidos en esta etapa son irreversibles. Con capacidades DSPM integradas, Singularity™ Cloud Native Security permite a las organizaciones establecer una puerta de “apto para entrenar” antes de que los datos en la nube lleguen a una canalización de IA. CNS proporciona visibilidad profunda en bases de datos y almacenes de objetos nativos de la nube, ayudando a los equipos a descubrir fuentes de datos no gestionadas u olvidadas, clasificar información sensible con precisión basada en políticas y evitar que datos de alto riesgo se utilicen en flujos de trabajo de entrenamiento o inferencia. El DSPM de SentinelOne establece un linaje y gobernanza de datos claros, asegurando que las organizaciones puedan rastrear exactamente cómo los datos sensibles se mueven, transforman y acceden a lo largo de sus canalizaciones de IA y entornos en la nube.

La Singularity Platform de SentinelOne ofrece procedencia de datos a través de capacidades integradas diseñadas para operaciones de seguridad.

La tecnología Storyline proporciona reconstrucción autónoma de la cronología de ataques al unir continuamente eventos de creación de procesos, conexiones de red, modificaciones de archivos y uso de credenciales en cadenas de procedencia coherentes. En las evaluaciones MITRE ATT&CK 2024, SentinelOne logró un 100% de detección sin retrasos y un 88% menos de alertas que la mediana de todos los proveedores evaluados.

Purple AI agrega y correlaciona información de procedencia de endpoints, nube, red y datos de usuario. Los analistas de seguridad consultan datos de procedencia usando lenguaje natural en lugar de esquemas propietarios complejos, y la plataforma recomienda acciones de respuesta que tu equipo puede ejecutar de inmediato.

El Singularity Data Lake proporciona la base de almacenamiento que requiere la procedencia. Todos los datos permanecen en caliente para análisis casi en tiempo real, la normalización OCSF elimina los silos de datos de forma autónoma y las opciones de retención flexibles de hasta 365+ días aseguran que la evidencia forense permanezca disponible durante investigaciones prolongadas. Singularity RemoteOps Forensics activa la recolección autónoma de evidencia forense en el momento en que se detecta una amenaza, con la evidencia recolectada analizada e ingerida directamente en el Data Lake para análisis inmediato.

Solicita una demostración con SentinelOne para evaluar cómo las operaciones de seguridad impulsadas por procedencia pueden fortalecer tus flujos de trabajo de investigación.

Singularity™ AI SIEM

Haga frente a las amenazas en tiempo real y agilice las operaciones diarias con el SIEM de IA más avanzado del mundo de SentinelOne.

Demostración

Puntos clave

La procedencia de los datos rastrea los datos desde el origen a través de cada transformación, proporcionando la base forense para la investigación de incidentes, el cumplimiento y la detección de amenazas. Dos tipos principales, prospectiva y retrospectiva, se combinan para revelar anomalías al comparar el comportamiento esperado con la ejecución real.

La Singularity Platform de SentinelOne operacionaliza la procedencia mediante la reconstrucción de ataques con Storyline, investigación en lenguaje natural con Purple AI, almacenamiento Data Lake normalizado con OCSF y recolección autónoma de evidencia a través de RemoteOps Forensics.

Preguntas frecuentes

La procedencia de los datos es el registro documentado del origen, movimiento y transformación de los datos a lo largo de su ciclo de vida. Rastrea de dónde provienen los datos, quién los accedió o modificó, y qué les sucedió en cada etapa.

En ciberseguridad, la procedencia de los datos proporciona la cadena de custodia forense necesaria para reconstruir las líneas de tiempo de los ataques, respaldar el cumplimiento normativo y preservar la integridad de la evidencia para procedimientos legales e investigaciones de incidentes.

Los registros de auditoría documentan eventos individuales de forma aislada. La procedencia de los datos conecta esos eventos en cadenas causales que muestran cómo se movieron los datos, quién los manipuló y qué los transformó en cada paso.

Un registro indica que un archivo fue accedido a las 2:14 AM. La procedencia indica que ese archivo fue creado por un proceso específico, modificado por una cuenta de servicio, movido a un servidor de preparación y exfiltrado mediante una llamada API, todo vinculado en un único grafo consultable.

Varios marcos principales requieren capacidades de procedencia de los datos. El Artículo 30 del RGPD exige registros de actividades de tratamiento. NIST SP 800-171 Control 3.3.1 requiere registros de auditoría con metadatos de procedencia, incluidos sellos de tiempo, identificadores de usuario y descripciones de eventos.

Los controles de auditoría de HIPAA bajo §164.312(b) requieren el seguimiento del acceso a información de salud protegida. CMMC Nivel 2 y 3 exigen contenido y revisión de registros de auditoría alineados con prácticas de procedencia.

Sí. Los grafos de procedencia rastrean los patrones de actividad de los usuarios en sistemas, archivos y aplicaciones a lo largo del tiempo, permitiendo análisis de comportamiento alineados con el marco MITRE ATT&CK.

Cuando un usuario interno se desvía de los patrones establecidos, como acceder a bases de datos fuera de su alcance habitual o transferir archivos a destinos no autorizados, los análisis basados en procedencia señalan la anomalía con contexto completo que muestra exactamente qué cambió y cuándo.

Los requisitos de almacenamiento escalan según el volumen de eventos y la granularidad de la captura. Las estrategias de captura basadas en riesgos que enfocan la procedencia completa en activos de alto valor y cuentas privilegiadas, mientras muestrean operaciones estándar, reducen sustancialmente las necesidades de almacenamiento.

La retención por niveles, utilizando almacenamiento activo para investigaciones en curso y almacenamiento frío para cumplimiento, ayuda a las organizaciones a gestionar el crecimiento mientras mantienen la reconstrucción completa de la cadena de ataque para sus activos más importantes.

¿Qué es la procedencia de los datos? Ejemplos y mejores prácticas