En la actualidad vivimos en una época donde estamos inmersos de lleno en los datos y estos crecer en gran volumen, con un ritmo importante. Es por eso que la minería de datos tiene tanta relevancia en estos tiempos.
A través de la minería se pueden aumentar los conocimientos y las ventajas competitivas, y todo esto debido a la misma evolución de la tecnología y de la capacidad que tienen estas. En tiempos anteriores los mismos sistemas de almacenamiento no podían ofrecer la misma capacidad para así gestionar sistemas que pudieran atender funciones de escritura y lectura con más capacidad y rapidez.
Esta evolución de tecnología e infraestructura ha hecho más fácil acceder, así como generar más datos que provienen de transacciones bancarios, tiendas online, interacción entre dispositivos, etc. La interpretación de estos datos por medio de su manipulación para así encontrar patrones, relaciones, tendencia, permite que esta información se pueda interpretar para los seres humanos.
El poder conseguir esta información da una ventaja competitiva, ya que facilita las decisiones que se puedan tomar en cualquier sector.
Índice de Contenidos
¿Qué es la minería de datos?
Para seguir profundizando sobre la minería de datos, es necesario que sepamos definir la minería de datos. Esta es la ciencia o metodología que permite explotar datos con el fin de que se generen modelos que hagan posible describir, encontrar patrones, establecer agrupaciones, así como clasificar, segmentar, asociar clientes, productos.
Business Intelligence
Este es un grupo de metodologías, prácticas y capacidades que están orientadas a que se genere y se haga gestión de la información. Esta va a permitir que se tomen decisiones a los usuarios de alguna organización.
Dentro del business intelligence podemos encontrar tecnologías como: Data warehouse, reporting, análisis OLAP, cuadros de Mando.
Esta puede responder preguntas como: qué pasó, cómo pasó, con qué frecuencia, cuál es el problema, qué se debe hacer. Por lo que permite que se entienda una situación que pasó o que está pasando en una organización.
Business Analytics
Es la metodología, técnica o sistema que permite predecir conductas o eventos futuros a partir del pasado, esto por medio del descubrimiento de patrones.
Big Data
El Big Data proporciona un entorno que se pueda adaptar a las 3 V’s: Volumen, velocidad, variedad.
Volumen
Acá nos encontramos con tecnología de almacenamiento que tiene capacidad de shariding o gestión de almacenamiento distribuido para así dar espacio a un gran volumen o con sistema de fichero, como lo sería Hadoop Distributed File System para la clusterización y la aplicación del método MapReduce.
Velocidad
Las tasas de generación de datos cada vez son más altas, por lo que se debe disponer de un entorno que tenga una gran velocidad de carga y procesamiento.
Variedad
Los datos pueden presentarse estructurados, donde muestran formas atómicas elementales, como no estructuradas: texto, imágenes, audios o vídeo. También podrían presentarse como semiestructuradas.
Madurez de una empresa
Hay una variedad de modelos que permiten la evaluación de una empresa con respecto a sus competencias analíticas. Por ejemplo, si una empresa se centra en la Inteligencia de negocio, se tendría el modelo BIMM definido en el framework COBIT. Así como el modelo DELTA de Thomas Davenport donde se encuentran muchas referencias.
Este último modelo hace mención de tres capacidades que toda empresa debe considerar:
Organizar los procesos que permiten lograr los objetivos, así como la aplicación de estos procesos.
Capacidades en su personal para la búsqueda de habilidades para promover actividades y cultura analítica.
Contar con tecnología que facilite obtener datos de calidad, así como aplicaciones integradas.
Tipos de empresas según el modelo:
Organizaciones que no consideran el análisis
En este caso, no hay empresa u organización de procesos analíticos y que tenga los conocimientos de los clientes, mercados y los competidores. Es limitado. En cuanto a la tecnología, no tienen procesos integrados y los datos con los que cuentan son de baja calidad. Tampoco disponen del factor humano con aspiraciones analíticas ni capacidades tanto de diseño como dirección. Toman decisiones solo por intuición y experiencia.
Organizaciones con actividad analítica aislada
En este tipo de negocio, existe cierta información donde hay procesos analíticos, pero esto es desconocido por el resto de la organización. Se cuenta con una tecnología un poco más desarrollada con datos relacionales, pero cuentan con un modelo inconexo, además de que no posee información relevante. Tiene un personal con curiosidad analítica que adquiere conocimiento y experiencia a medida que aplican los procesos.
Aspirantes analíticos
La organización está coordinada y se empezaron a definir métricas de interés, así como los procesos de análisis de la calidad del dato. Estos procesos muestran algo de separación de acuerdo a las áreas, pero la conciencia empresarial es completa. La tecnología se expande y desarrolla almacenes de datos. El personal tiene habilidad analíticas en la mayoría de los departamentos, pero le falta integrarse entre ellos.
Te puede interesar: ¿Qué es Big Data y para qué sirve?