Las herramientas de ETL constituyen un componente fundamental del Data Warehouse ya que gestionan la extracción periódica de datos de las fuentes de entrada, así como su integración, reorganización y carga en el Data Warehouse. Para descargar el texto completo y obtener más información, haz clic AQUÍ
Diversas son las fases de un proceso ETL. La extracción, la primera de ellas, implica la preparación de rutinas capaces de leer los registros contenidos en la base de datos origen y prepararlos para la fase siguiente de transformación. Transformación La mayoría de las herramientas prevén rutinas de extracción específicas para los sistemas ERP más conocidos.o.i.mas.usados.aplicativos. Después de recopilar los datos, las rutinas de transformación se encargan de prepararlos para su nueva ubicación. Existen diversas técnicas de transformación. La agregación permite reemplazar numerosos registros detallados con pocos registros resumidos que se almacenan en las soluciones de Business Intelligence. Los data marts y los data warehouses, que constituyen el núcleo de las soluciones de Business Intelligence, son mini bases de datos que permiten a los usuarios analizar metadatos, es decir, conjuntos de datos previamente agregados y resumidos según criterios definidos, presentados de manera bastante intuitiva (como gráficos), con el fin de verificar tendencias, macro-tendencias y características sobresalientes de un determinado fenómeno. Los data marts no requieren información detallada sino datos agregados, para poder ser utilizados directamente por el responsable de la toma de decisiones, reduciendo los tiempos y mejorando el uso de la información. Los responsables de marketing de una empresa podrán, por ejemplo, utilizar los data marts para obtener una idea del resultado de las campañas de publicidad y comunicación de los últimos cinco años, los responsables de ventas podrán utilizar los datos de ventas «concentrados» para examinar la facturación de cada producto.en.el.transcurso.de.los.últimos.años.de.actividad. Filtrado/Limpieza Las aplicaciones ETL agregan datos con poco esfuerzo. La traducción a valores de los datos es una técnica de transformación utilizada frecuentemente. Las bases de datos operativas, de hecho, almacenan información codificada para reducir al mínimo el espacio ocupado. Sin embargo, los data marts contienen información resumida y están diseñados para un uso fácil. Además de derivar campos de manera simple, a partir de la unión de dos o más campos anteriores, el software ETL también permite crear nuevos campos mediante la utilización de funciones matemáticas o estadísticas y análisis lógicos. Una rutina de transformación es la limpieza, es decir, la utilización de algoritmos para eliminar del sistema los datos inexactos o inconsistentes en relación con el fenómeno a evaluar. Las funcionalidades de limpieza también pueden utilizarse para reemplazar con un solo valor los datos que aparecen en múltiples formas dentro de la base de datos: el nombre Fiat puede aparecer bajo diferentes campos, como Fiat S.p.A., Fiat Auto, Fiat, etc. y durante la fase de limpieza las múltiples versiones del mismo dato serán reemplazadas por un solo dato – único.Carga La última fase del proceso ETL es la carga de los datos en la base de datos de destino. En la fase de carga existen dos modelos distintos de replicación de datos. En la replicación «push», la aplicación empuja los datos transformados a la base de datos de destino. En la replicación «pull», por el contrario, la aplicación o la base de datos de destino solicitan los datos, conforme a las necesidades específicas del momento. Los sistemas ETL son, de hecho, la infraestructura clave para el soporte a la toma de decisiones de los sistemas de Business Intelligence. Se trata de que permiten transformar los datos y contenidos no organizados en información estratégicamente útil para tomar decisiones críticas y operar con eficacia. Esto se denomina Information Asset Management, que permite recopilar, validar, organizar, gestionar y distribuir la información correcta a la persona adecuada, en el momento necesario y con la herramienta más idónea. El Data Warehouse, como se mencionó anteriormente, es el conjunto de estructuras de datos y herramientas necesarias para proporcionar a los gerentes un soporte para la toma de decisiones. La información útil en este sentido se obtiene de datos operacionales producidos y gestionados por un innovador sistema de información empresarial. El Data Warehouse no es solo una novedad tecnológica sino también estratégica, ya que la actividad de análisis se traslada de personal especializado a todos los gerentes de la empresa. Comprender las tendencias y hacer comparaciones antes de tomar decisiones importantes se vuelve más fácil gracias a la información a nivel agregado que puede ser visualizada y analizada rápidamente. El acceso a datos detallados se realiza si es necesario. El Data Warehouse es la base de toda aplicación de Analytical CRM ya que representa el medio para recopilar, validar, integrar y almacenar los datos empresariales del cliente provenientes de canales clásicos o del canal Web que constituyen la entrada para las actividades de análisis (las bases de datos en que se apoya son de tipo relacional, es decir, consultables directamente mediante S.Q.L., Structured Query Language). Es, además, el conjunto de estructuras de datos y herramientas necesarias para obtener, a partir de los datos operacionales producidos y gestionados por un sistema de información empresarial, información útil para los gerentes como soporte para las decisiones. Con Webhouse se entiende un Data Warehouse que también recopila datos provenientes del canal web (clickstream, registros de usuarios, etc.). El Data Warehouse es una base de datos con las siguientes características: • Subject-oriented: los datos están organizados en función de un proceso empresarial específico. • Integrated: los datos que confluyen en el Data Warehouse provienen normalmente de varias fuentes (sistemas transaccionales, operacionales, otras bases de datos). Se limpian y transforman para permitir un acceso simple y eficaz. • Non-volatile: el acceso a los datos es de solo lectura y resulta extremadamente rápido. • Time-variant: los datos se organizan según la dimensión temporal, fundamental para los análisis de negocio. A diferencia de los Source System – en particular de los OLTP – los DWH están diseñados y optimizados para el procesamiento analítico. En colaboración con otras herramientas y aplicaciones los DWH constituyen los sistemas OLAP (On-Line Analytical Processing System). Entre las definiciones más reconocidas de Data Warehouse, dos en particular identifican sus características peculiares: “Una plataforma sobre la cual se almacenan y gestionan datos provenientes de las diferentes áreas de la organización; dichos datos son actualizados, integrados y consolidados por los sistemas de carácter operativo para soportar todas las aplicaciones de soporte a la toma de decisiones” (Gartner Group) “Un conjunto de datos subject oriented, integrado, time variant, no volátil construido para apoyar el proceso decisional” (W.H.Inmon) Se destaca, por lo tanto, ante todo la característica del Data Warehouse como colección de datos para apoyar el proceso decisional de la gerencia. El Data Warehouse agrupa los datos decisionales por áreas o temas de interés y los organiza respecto a la utilización final; se diferencia en esto de las bases de datos tradicionales cuyo diseño está guiado por los requisitos de las aplicaciones que garantizan los procesos de gestión. En el ámbito del Data Warehouse la información adquiere un valor empresarial más que departamental, porque es el resultado integrado de datos provenientes de múltiples fuentes, también externas a la empresa. Toda la información se hace coherente mediante un modelo común de datos y la definición de estándares empresariales (naming convention, unidades de medida, codificaciones). Tiene un horizonte temporal amplio, garantizando el mantenimiento de información histórica, para favorecer actividades de análisis comparativos en diferentes períodos temporales. La información está consolidada, es consistente en el tiempo y no puede ser modificada por el usuario que la accede exclusivamente en lectura. Con el término Data Mart se indican colecciones de información dirigidas a una audiencia departamental y orientadas a un tema específico. El nivel de agregación de datos en el Data Mart resulta a menudo más alto que en el Data Warehouse, que también contiene datos detallados, ya que está diseñado para satisfacer de manera más directa y explícita las necesidades del usuario final. Es evidente la importancia del principio de separación entre ambientes operacionales y ambientes decisionales, informativos. La insistencia simultánea de dos clases de usuarios de diferente naturaleza y con diferentes funciones sobre la misma base de datos plantearía problemas de competencia, creando tiempos de respuesta no planificables y a menudo inaceptables para los procesos transaccionales. Por otra parte, la necesaria separación de los ambientes, obtenida a través de un proceso de mera replicación de los ambientes transaccionales, no responde, sin embargo, a las necesidades, porque las bases de datos operacionales están dirigidas al proceso y no proporcionan una visión integrada de los datos de interés. El objetivo del Data Warehouse es dar una respuesta oportuna y correcta a problemas decisionales relacionados con las actividades institucionales de la Administración, garantizando mejores resultados en términos de eficacia y eficiencia. La necesidad informativa obviamente no es nueva, pero desde un punto de vista tecnológico hoy existen las condiciones para apoyar esta solicitud de manera adecuada. Los aspectos tecnológicos habilitantes son la disponibilidad de potencia de procesamiento para gestionar grandes volúmenes de datos a bajo costo y la posibilidad de distribución de la información mediante tecnología intranet/internet. Sin embargo, debe subrayarse que, si el factor tecnológico es un requisito necesario para el desarrollo de soluciones de Data Warehouse, el factor crítico de éxito es la involucración del usuario final. Solo un patrocinio adecuado por parte de la dirección puede garantizar la contribución necesaria en el proyecto de diversos sectores empresariales con el correspondiente aporte de conocimiento de los procesos y los datos. REPRODUCCIÓN RESERVADA.
Pubblicato in Negocios
Sé el primero en comentar