Que es data mining

¿qué es la minería de datos?

La minería de datos, también conocida como descubrimiento de conocimiento en los datos (KDD), es el proceso de descubrir patrones y otra información valiosa a partir de grandes conjuntos de datos. Dada la evolución de la tecnología de almacenamiento de datos y el crecimiento del big data, la adopción de técnicas de minería de datos se ha acelerado rápidamente en las últimas dos décadas, ayudando a las empresas a transformar sus datos brutos en conocimiento útil. Sin embargo, a pesar de que la tecnología evoluciona continuamente para manejar los datos a gran escala, los líderes todavía se enfrentan a desafíos con la escalabilidad y la automatización.
La minería de datos ha mejorado la toma de decisiones de las organizaciones a través de análisis de datos perspicaces. Las técnicas de minería de datos que sustentan estos análisis pueden dividirse en dos propósitos principales: pueden describir el conjunto de datos objetivo o pueden predecir resultados mediante el uso de algoritmos de aprendizaje automático. Estos métodos se utilizan para organizar y filtrar los datos, sacando a la luz la información más interesante, desde la detección de fraudes hasta los comportamientos de los usuarios, los cuellos de botella e incluso las brechas de seguridad.

minería de datos: definición, métodos y formas de aplicación

La minería de datos es un proceso de búsqueda de patrones potencialmente útiles a partir de enormes conjuntos de datos. Se trata de una habilidad multidisciplinar que utiliza el aprendizaje automático, la estadística y la IA para extraer información que permita evaluar la probabilidad de eventos futuros. Los conocimientos derivados de la minería de datos se utilizan para el marketing, la detección de fraudes, los descubrimientos científicos, etc.
La minería de datos consiste en descubrir relaciones ocultas, insospechadas y previamente desconocidas pero válidas entre los datos. La minería de datos también se denomina «descubrimiento de conocimientos en los datos» (KDD), «extracción de conocimientos», «análisis de datos/patrones», «recolección de información», etc.

¿qué es la minería de datos y por qué es importante?

La minería de datos es el proceso de encontrar anomalías, patrones y correlaciones dentro de grandes conjuntos de datos para predecir resultados. Utilizando una amplia gama de técnicas, se puede utilizar esta información para aumentar los ingresos, reducir los costes, mejorar las relaciones con los clientes, reducir los riesgos y mucho más.
El proceso de indagar en los datos para descubrir conexiones ocultas y predecir tendencias futuras tiene una larga historia. Aunque a veces se denomina «descubrimiento de conocimientos en bases de datos», el término «minería de datos» no se acuñó hasta la década de 1990. Pero sus fundamentos comprenden tres disciplinas científicas entrelazadas: la estadística (el estudio numérico de las relaciones entre los datos), la inteligencia artificial (la inteligencia similar a la humana desplegada por los programas informáticos y/o las máquinas) y el aprendizaje automático (los algoritmos que pueden aprender de los datos para hacer predicciones). Lo que era viejo vuelve a ser nuevo, ya que la tecnología de la minería de datos sigue evolucionando para seguir el ritmo del potencial ilimitado de los grandes datos y la potencia informática asequible.
En la última década, los avances en la potencia y la velocidad de procesamiento nos han permitido pasar de las prácticas manuales, tediosas y lentas, al análisis de datos rápido, fácil y automatizado. Cuanto más complejos sean los conjuntos de datos recopilados, mayor será el potencial para descubrir ideas relevantes. Minoristas, bancos, fabricantes, proveedores de telecomunicaciones y aseguradoras, entre otros, están utilizando la minería de datos para descubrir las relaciones entre todo, desde la optimización de los precios, las promociones y la demografía hasta cómo la economía, el riesgo, la competencia y los medios sociales están afectando a sus modelos de negocio, ingresos, operaciones y relaciones con los clientes.

qué es la minería de datos

La información sobre la minería de datos está ampliamente disponible. No importa cuál sea su nivel de conocimientos, puede encontrar libros y artículos útiles sobre la minería de datos. Por ejemplo: http://en.wikipedia.org/wiki/Data_mining
La minería de datos es la práctica de buscar automáticamente en grandes almacenes de datos para descubrir patrones y tendencias que van más allá del simple análisis. La minería de datos utiliza sofisticados algoritmos matemáticos para segmentar los datos y predecir la probabilidad de que se produzcan eventos futuros en función de los eventos pasados. La minería de datos también se conoce como descubrimiento de conocimientos en los datos (KDD).
La minería de datos se realiza mediante un modelo que utiliza un algoritmo para actuar sobre un conjunto de datos. Los modelos de minería de datos pueden utilizarse para extraer los datos sobre los que se construyen, pero la mayoría de los tipos de modelos son generalizables a nuevos datos. El proceso de aplicar un modelo a nuevos datos se conoce como puntuación.
Muchas formas de minería de datos son predictivas. Por ejemplo, un modelo puede predecir los ingresos en función de la educación y otros factores demográficos. Las predicciones tienen una probabilidad asociada (¿Qué probabilidad hay de que esta predicción sea cierta?). Las probabilidades de predicción también se conocen como confianza (¿Qué confianza puedo tener en esta predicción?).