Conclusiones


·         El pre procesamiento de los datos  para ejecutar  el desarrollo  de minería de datos,  juega un papel muy importante por no decir indispensable, ya que de él depende la claridad y veracidad de la información o el conocimiento resultante; se debe ser cuidadoso y estricto en la selección e implementación de las técnicas utilizadas para el análisis de los datos en el pre procesamiento, con el fin de mejorar la calidad de un conjunto de datos escogidos para la extracción de la información buscada.

·         Para que el procesamiento de datos sea de óptimos resultados es fundamental utilizar una jerarquía de las técnicas llevadas a cabo, debido a que siempre van de la mano una con la otra, se representa como filtros  de limpieza y eliminación de la información que no se va utilizar o no cumple una función en el objetivo a seguir.

·         Los datos no siempre están disponibles para ser tratados, a veces son redundantes, tienen errores o faltantes, los cuales  deben ser tratados por medio de métodos que se pueden combinar entre sí como: estrategias, algoritmos de integración, discretizaciòn  y/0 presentación (se describen en este blog) que sirven para obtener un conjuntos de reglas orientadas a la selección  de datos para que tengan mayor interpretación.



Ventaja: El pre procesamiento de datos permite aplicar los modelos de Aprendizaje/Minería de Datos de forma más rápida y sencilla, obteniendo modelos/patrones de más calidad: precisión e/o interpretabilidad.
Un inconveniente: El pre procesamiento de datos no es un área totalmente estructura con una metodología concreta de actuación para todos los problemas. Cada problema puede requerir una actuación diferente, utilizando diferentes herramientas de pre procesamiento. Francisco Herrera (Reunión Red Nacional DM & ML) Madrid, 6-7 Mayo, 2014.


Comentarios