Ingeniería de proyectos de explotación de la información

a de los mismos. CRISP-DM identifica las relaciones entre las técnicas de explotación de información y las variables que modelan los problemas de inteligencia de negocio esbozando parcialmente los procesos a desarrollar. Fig. 3. Fases Metodología P3TQ SEMMA y PTQ no identifican relaciones entre técnicas de explotación de información y problemas de inteligencia de negocio, ni procesos de explotación de información. En síntesis, las metodologías se centran fuertemente en las técnicas de explotación de información y en la tipificación de los datos sin enfatizar cómo las variables vinculadas a los datos modelan el negocio ni cuáles son los procesos de explotación de información que a partir de aplicar las técnicas al conjunto de valores de las variables, permiten obtener una solución para cada problema de inteligencia de negocio. LÍNEA DE INVESTIGACIÓN Y DESARROLLO Este proyecto se articula a través de las siguientes líneas de investigación: Aplicación de técnicas de Ingeniería del Conocimiento a la Educción de Requisitos de Proyectos de Explotación de Información. En esta línea ya trabaja un tesista de magister. 174 WICC 2010 XII Workshop de Investigadores en Ciencias de la Computación Aplicación de formalismos de Ingeniería del Conocimiento al encapsulamiento de requisitos de Proyectos de Explotación de Información educidos. Esta línea supone extender formalismos existentes como lo propuesto en [Britos et al, 2008], Modelo de Procesos para Proyectos de Explotación de Información. Esta línea de trabajo, busca construir el modelo a partir de modelos de procesos de software y metodologías de desarrollo de proyectos de explotación de Información de uso habitual en la industria. El proyecto incluye la construcción de métricas de calidad de ingeniería de requerimientos En esta línea ya trabaja un tesista de magister. Modelo de Ciclo de Vida Genérico para Proyectos de Explotación de Información. Se toma como base para esta línea los modelos de ciclo de vida conocidos en ingeniería del software y metodologías de desarrollo de proyectos de explotación de información de uso habitual en la industria. En esta línea ya trabaja un tesista de magister. Mapa de Actividades para Proyectos de Explotación de Información. Se toman como base los resultados de las líneas de investigación Modelo de Procesos y Modelo de Ciclo de Vida para Proyectos de Explotación de Información. Metodología para la Especificación de Requisitos en Proyectos de Explotación de Información. Esta línea busca construir la metodología en interacción con las líneas ingeniería del conocimiento aplicada al encapsulamiento de requisitos educidos, modelo de ciclo de vida y modelo de procesos para proyectos de proyectos de explotación de información. RESULTADOS OBTENIDOS/ESPERADOS La necesidad de desarrollar una ingeniería de proyectos de explotación de información surge del relevamiento efectuado en el campo metodológico, en el que se identifica la carencia de técnicas asociadas a la ejecución de cada una de las fases planteadas en las metodologías identificadas. En este contexto, este proyecto busca desarrollar un conjunto de herramientas para la etapa temprana del proyecto de explotación de información, focalizando las acciones en la formalización de requisitos, la adopción de un ciclo de vida, la estructuración según un modelo de procesos y el ordenamiento del proyecto a través de un mapa de actividades. FORMACIÓN DE RECURSOS HUMANOS El grupo de trabajo se encuentra formado por dos investigadores formados y por tres investigadores en formación. En el marco de este proyecto se están desarrollando: una tesis doctoral y tres tesis de maestría. Se prevee incorporar adicionalmente, dos tesistas de maestría.

[1]  Ivan Bratko,et al.  Machine Learning and Data Mining; Methods and Applications , 1998 .

[2]  S. Matwin,et al.  Learning Two-Tiered Descriptions of Flexible Concepts: The POSEIDON System , 1992, Machine Learning.

[3]  Katharina Morik,et al.  A Multistrategy Approach to the Classification of Phases in Business Cycles , 2002, ECML.

[4]  Ryszard S. Michalski,et al.  A theory and methodology of inductive learning , 1993 .

[5]  Pablo Pytel,et al.  PROCESOS DE EXPLOTACIÓN DE INFORMACIÓN BASADOS EN SISTEMAS INTELIGENTES INFORMATION MINING PROCESSES BASED ON INTELLIGENT SYSTEMS , 2008 .

[6]  Jaideep Srivastava,et al.  Web usage mining: discovery and applications of usage patterns from Web data , 2000, SKDD.

[7]  Jaideep Srivastava,et al.  Creating adaptive Web sites through usage-based clustering of URLs , 1999, Proceedings 1999 Workshop on Knowledge and Data Engineering Exchange (KDEX'99) (Cat. No.PR00453).

[8]  Paola Britos,et al.  Requirements Elicitation in Data Mining for Business Intelligence Projects , 2008, Advances in Information Systems Research, Education and Practice.

[9]  Paola Verónica Britos,et al.  Ingenieria de Sistemas Expertos , 2004 .

[10]  Igor Kononenko,et al.  Machine Learning and Data Mining: Introduction to Principles and Algorithms , 2007 .

[11]  Efraim Turban,et al.  Business Intelligence: Second European Summer School, eBISS 2012, Brussels, Belgium, July 15-21, 2012, Tutorial Lectures , 2013 .

[12]  Gerald DeJong,et al.  Explanation-Based Learning: An Alternative View , 2005, Machine Learning.

[13]  Nenad Stefanovic,et al.  Supply Chain Business Intelligence Model , 2006 .

[14]  Larissa Terpeluk Moss,et al.  Business Intelligence Roadmap: The Complete Project Lifecycle for Decision-Support Applications , 2003 .

[15]  Ajith Abraham,et al.  Business Intelligence from Web Usage Mining , 2003, J. Inf. Knowl. Manag..