Saltar al contenido

Cómo incorporar los datos archivados de SAP a los data lakes

Los sistemas SAP incluyen terabytes de datos históricos. Sin embargo, los archivos históricos típicos de SAP son difíciles de incluir en aplicaciones analíticas y otras aplicaciones de inteligencia empresarial debido a su formato.

Los datos almacenados en las soluciones de archivo SAP tradicionales no contribuyen a mejorar las decisiones empresariales

Los sistemas SAP existen desde hace décadas, a diferencia de la mayoría de los data lakes locales (Hadoop) o basados en la nube (Google, Azure, AWS). Por eso, a menudo se archivan grandes cantidades de datos históricos de SAP. Esto plantea un reto: las soluciones de archivado histórico de SAP almacenan los datos en almacenes basados en archivos en un formato comprimido y es difícil integrar estos datos en los data lakes corporativos, por no hablar de ejecutar análisis en tiempo real, algoritmos de aprendizaje automático o crear valor empresarial a partir de ellos.

¿Cuál es el valor empresarial de un data lakes sin datos SAP, y cuál es el valor de los datos SAP sin archivos históricos SAP? A menudo, los datos empresariales en SAP S/4HANA se archivan tan pronto como después de 2 años debido al aumento de los costes de SAP HANA. Esto hace que proporcionar el archivo SAP histórico para una mayor inteligencia empresarial de autoservicio sea clave.

OutBoard ERP Archiving puede migrar o archivar datos antiguos de SAP en data lakes corporativos. Más de 40 de las 500 empresas de la lista Fortune ya confían en esta solución para conectar SAP con grandes data lakes, lo que permite disponer de datos SAP históricos y recientes almacenados en un único data lakes corporativo.

El poder del data lakes y por qué los datos SAP son clave.

El data lakes es un repositorio centralizado que permite almacenar todos los datos estructurados y no estructurados a cualquier escala. Esto permite tomar mejores decisiones empresariales, ya que puede almacenar los datos tal cual, sin tener que estructurarlos primero. Puede ejecutar diferentes tipos de análisis, desde cuadros de mando y visualizaciones hasta procesamiento de big data, análisis en tiempo real y aprendizaje automático.data lakes.

Basados en Microsoft Azure, los data lakes son también una solución rentable para ejecutar cargas de trabajo de big data. Puede elegir entre clústeres bajo demanda o un modelo de pago por trabajo cuando se procesan los datos. Los data lakes se amplían o reducen en función de las necesidades empresariales, y escalan de forma independiente el almacenamiento y la computación, lo que permite una mayor flexibilidad económica.

Según Google, el data lakes no es sólo almacenamiento, y no es lo mismo que un almacén de datos. Los data lakes proporcionan una plataforma escalable y segura que permite a las empresas ingerir cualquier dato de cualquier sistema a cualquier velocidad.

La gran mayoría de los clientes de SAP en S/4HANA o que planean la migración a S/4HANA necesitan reducir significativamente su huella en HANA y los documentos empresariales cerrados se archivan tan rápido como después de dos años. Teniendo esto en cuenta, es difícil imaginar data lakes y análisis de big data sin datos de archivos históricos de SAP (datos empresariales de entre 3 y 10 años de antigüedad).

Arquitectura típica con datos históricos de SAP integrados en el data lakes.

Aquí viene la solución: data lakes habilitados con un conjunto completo de datos de SAP, datos calientes recientes pero también con datos históricos de SAP. Los datos estructurados de SAP se combinan con datos estructurados y no estructurados procedentes de otras fuentes de datos (IoT, redes sociales, software empresarial no SAP, aplicaciones de terceros o personalizadas) y se habilitan para el procesamiento de big data y la inteligencia empresarial de autoservicio, con el fin de crear valor empresarial adicional y proporcionar información para la toma de decisiones empresariales correctas.

Cada vez más empresas buscan habilitar todos los datos empresariales en cualquier tecnología de data lakes. OutBoard ERP Archiving es una solución de archivado holística que mueve los datos entre la base de datos SAP y el almacenamiento externo, independientemente del proveedor de almacenamiento (por ejemplo, data lakes basados en la nube o locales) en función de su uso o antigüedad.

OutBoard ERP Archiving es la única solución disponible que hace que los datos archivados estén disponibles para su posterior análisis en el data lakes en la nube, ya que los datos históricos se pueden proporcionar en formato transparente en varios formatos de data lakes, como Hadoop HIVE, Impala, AWS Redshift, Azure Data Lake Service, Azure Databricks, Google Big Query, Snowflake, etc.

Los datos activos permanecen en la base de datos durante las operaciones diarias, los datos fríos o antiguos se archivan. Los datos archivados pueden seguir utilizándose para informes. En el data lakes, todos los datos de SAP, incluidos los históricos, se habilitan y amplían con datos que no son de SAP (por ejemplo, atributos de clientes) y ayudan a orientar mejor las decisiones empresariales.