La capacidad de generar y almacenar información crece de una
manera considerable, duplicándose toda esa información a un aproximado de 20
años. Es por esto por lo que las grandes organizaciones tienden a almacenarlos
de una forma jerárquica pero no los pueden analizar eficientemente.
Las sentencias SQL permiten realizar un primer análisis de
la información almacenada de una organización hasta un 80%, pero todo este
análisis es de información no tan importante, lo cual el 20% restante radica la
información más importante en donde requiere las utilizaciones de técnicas más
avanzadas.
El Descubrimiento de Conocimiento (KDD) es un proceso no
trivial que identifica patrones válidos, novedosos y potencialmente útiles,
apuntando que el usuario podrá convivir solo con información valiosa que este
requiera.
Su principal objetivo es el hallazgo de conocimiento útil,
valido, relevante y nuevo sobre un fenómeno mediante algoritmos eficientes,
presentando resultados profundos de lo requerido para que su interpretación sea
clara y precisa.
Otro de sus aspectos que su calidad de información que
presenta no se ve afectada por los volúmenes excesivos de datos o por los
ruidos que generan estos. En donde los algoritmos de búsqueda utilizados deben
ser robustos.
No hay comentarios:
Publicar un comentario