Basados en Microsoft Azure, los data lakes son también una solución rentable para ejecutar cargas de trabajo de big data. Puede elegir entre clústeres bajo demanda o un modelo de pago por trabajo cuando se procesan los datos. Los data lakes se amplían o reducen en función de las necesidades empresariales, y escalan de forma independiente el almacenamiento y la computación, lo que permite una mayor flexibilidad económica.
Según Google, el data lakes no es sólo almacenamiento, y no es lo mismo que un almacén de datos. Los data lakes proporcionan una plataforma escalable y segura que permite a las empresas ingerir cualquier dato de cualquier sistema a cualquier velocidad.
La gran mayoría de los clientes de SAP en S/4HANA o que planean la migración a S/4HANA necesitan reducir significativamente su huella en HANA y los documentos empresariales cerrados se archivan tan rápido como después de dos años. Teniendo esto en cuenta, es difícil imaginar data lakes y análisis de big data sin datos de archivos históricos de SAP (datos empresariales de entre 3 y 10 años de antigüedad).
Arquitectura típica con datos históricos de SAP integrados en el data lakes.
Aquí viene la solución: data lakes habilitados con un conjunto completo de datos de SAP, datos calientes recientes pero también con datos históricos de SAP. Los datos estructurados de SAP se combinan con datos estructurados y no estructurados procedentes de otras fuentes de datos (IoT, redes sociales, software empresarial no SAP, aplicaciones de terceros o personalizadas) y se habilitan para el procesamiento de big data y la inteligencia empresarial de autoservicio, con el fin de crear valor empresarial adicional y proporcionar información para la toma de decisiones empresariales correctas.
Cada vez más empresas buscan habilitar todos los datos empresariales en cualquier tecnología de data lakes. OutBoard ERP Archiving es una solución de archivado holística que mueve los datos entre la base de datos SAP y el almacenamiento externo, independientemente del proveedor de almacenamiento (por ejemplo, data lakes basados en la nube o locales) en función de su uso o antigüedad.
OutBoard ERP Archiving es la única solución disponible que hace que los datos archivados estén disponibles para su posterior análisis en el data lakes en la nube, ya que los datos históricos se pueden proporcionar en formato transparente en varios formatos de data lakes, como Hadoop HIVE, Impala, AWS Redshift, Azure Data Lake Service, Azure Databricks, Google Big Query, Snowflake, etc.
Los datos activos permanecen en la base de datos durante las operaciones diarias, los datos fríos o antiguos se archivan. Los datos archivados pueden seguir utilizándose para informes. En el data lakes, todos los datos de SAP, incluidos los históricos, se habilitan y amplían con datos que no son de SAP (por ejemplo, atributos de clientes) y ayudan a orientar mejor las decisiones empresariales.