Practicas y Proyecto Datamining

PROYECTO DATAMINING


El proyecto  para “DW de llamadas” deberá contar con la siguiente documentación:

·         Definición del Modelo de Datos
·         Implementación del DW documentando el por que de la elección
·         Implementación de procesos ETL
·         Implementación de extracción de Información


Todos los procesos deberán estar documentados.

El proyecto se calificará de la siguiente manera:

1             Proyecto Completo, con todos los puntos mencionados anteriormente y entregado a tiempo.
1             Modelo
2             Implementación DW (tablas, vistas, índices, particiones)
1             Documentación de la Implementación DW
2             Implementación procesos ETL
2             Implementación extracción información
1             Documentación de la extracción y diccionario de datos.
               

La sintaxis debe estar correcta por lo que se deberá poder ejecutarla sin que marque ningún error y realizar lo que se haya solicitado.


Una telefónica desea implementar un DW para poder seleccionar las promociones mas adecuadas  para incrementar y conservar sus clientes.


Se  cuenta con una base de datos con la siguiente estructura:




También puede obtener información de su competencia solicitándola a la central de comunicaciones.

Requerimientos de consultas mas frecuentes:

Numero de llamadas al mes de un cliente
Uso de llamadas de un tipo específico
Zonas con mayor demanda
Consultas sugeridas, documentado su finalidad (3 mínimo).


Diccionario de datos

Lista de todos los objetos y sus características (tablespace, particiones, índices, tablas……), mediante querys.


PRACTICAS


Practica Funciones de Grupo

Ejecuta lo siguiente, y analiza las diferencias entre los diferentes group by

CREATE TABLE dimension (
  c_1_id   NUMBER NOT NULL,
  c_2_id   NUMBER NOT NULL,
  c_3_id   NUMBER NOT NULL,
  c_4_id   NUMBER NOT NULL,
  monto_vta NUMBER(10,2) NOT NULL
);

INSERT INTO dimension
SELECT trunc(dbms_random.value(1,3))  AS c_1_id,
        trunc(dbms_random.value(1,6))  AS c_2_id,
        trunc(dbms_random.value(1,11))  AS c_3_id,
        trunc(dbms_random.value(1,11))  AS c_4_id,
       round(dbms_random.value(1,3),2)
FROM   dual
CONNECT BY level <= 1000;

select sum(monto_vta)
from dimension;

select c_1_id , count(*), sum(monto_vta)
from dimension
group by c_1_id
order by c_1_id;

select c_1_id , c_2_id, count(*), sum(monto_vta)
from dimension
group by  rollup (c_1_id, c_2_id)
order by c_1_id, c_2_id;

select c_1_id , c_2_id, count(*), sum(monto_vta)
from dimension
group by  cube (c_1_id, c_2_id)
order by c_1_id, c_2_id;


select c_1_id , c_2_id,  sum(monto_vta)
from dimension
group by  grouping sets (c_1_id, c_2_id)
order by c_1_id, c_2_id;

select c_1_id , c_2_id,  sum(monto_vta), GROUPING_ID (C_1_ID) X
from dimensionMLF
group by  grouping sets (c_1_id, c_2_id)
order by c_1_id, c_2_id

No hay comentarios:

Publicar un comentario