É«¿Ø´«Ã½

Skip to Content

?Qu¨¦ es la desviaci¨®n de datos? Modelo de desviaci¨®n desmitificada

En el mundo de la , la desviaci¨®n de datos se ha convertido en una preocupaci¨®n importante y algo inevitable. Comprender y administrar la desviaci¨®n de datos es esencial para mantener la relevancia y confiabilidad de los flujos de trabajo y proyectos de AI para garantizar que proporcionen informaci¨®n valiosa frente a los datos del mundo real en r¨¢pida evoluci¨®n. La administraci¨®n adecuada de la desviaci¨®n de datos ayuda a mantener modelos de AI din¨¢micos que se adaptan f¨¢cilmente a su entorno comercial en constante cambio y permiten a las empresas mantenerse a la vanguardia, y a sus competidores.?

Este art¨ªculo examina qu¨¦ es la desviaci¨®n de datos, por qu¨¦ es importante, la diferencia entre la desviaci¨®n de datos y la desviaci¨®n de conceptos, la importancia de los modelos din¨¢micos y c¨®mo tener una infraestructura de almacenamiento de datos lista para la AI ayuda a evitar la desviaci¨®n de datos.?

?Qu¨¦ es la desviaci¨®n de datos?

La desviaci¨®n de datos se refiere al fen¨®meno en el que las propiedades estad¨ªsticas de los datos de entrada utilizados para entrenar un modelo de aprendizaje autom¨¢tico cambian con el tiempo. En t¨¦rminos m¨¢s simples, los datos en los que se capacit¨® inicialmente el modelo, los datos de entrada, ya no representan con precisi¨®n los nuevos datos que encuentra el modelo. Este cambio puede ser gradual o abrupto y puede ser el resultado de varios factores, como cambios en el comportamiento del cliente, cambios en las condiciones ambientales o modificaciones en los m¨¦todos de recopilaci¨®n de datos.

Ejemplos de desviaci¨®n de datos en escenarios del mundo real

Finanzas

En el comercio algor¨ªtmico, un modelo capacitado en datos hist¨®ricos del mercado puede experimentar una desviaci¨®n de datos a medida que evolucionan las condiciones del mercado. Los eventos econ¨®micos repentinos o los cambios en las pol¨ªticas pueden provocar cambios en los precios de las acciones y los patrones de negociaci¨®n, lo que afecta la precisi¨®n predictiva del modelo.

Salud

Un modelo predictivo capacitado en datos de pacientes para identificar los riesgos de enfermedad puede encontrarse con una desviaci¨®n de datos si hay cambios en las caracter¨ªsticas demogr¨¢ficas de la poblaci¨®n, los patrones de estilo de vida o las pr¨¢cticas de atenci¨®n m¨¦dica a lo largo del tiempo. Estos cambios pueden afectar la capacidad del modelo para hacer predicciones precisas, lo que, en ¨²ltima instancia, podr¨ªa afectar el tratamiento y los resultados del tratamiento.?

Comercio electr¨®nico

Un sistema de recomendaci¨®n de comercio electr¨®nico que se base en el comportamiento del usuario puede enfrentar una desviaci¨®n de datos si hay cambios en las preferencias del consumidor, los h¨¢bitos de compra o la disponibilidad del producto. Las nuevas tendencias o cambios en las preferencias del cliente pueden afectar la eficacia del modelo de recomendaci¨®n y, en ¨²ltima instancia, afectar la experiencia del cliente.?

Monitoreo del clima

Los modelos que predicen patrones clim¨¢ticos o cambios clim¨¢ticos pueden experimentar una desviaci¨®n de datos debido a alteraciones en las condiciones ambientales. Factores como la deforestaci¨®n, la urbanizaci¨®n o el cambio clim¨¢tico global pueden provocar cambios en los patrones de datos que afectan la precisi¨®n de la predicci¨®n del modelo.

Seguridad cibern¨¦tica

Un sistema de detecci¨®n de intrusos puede encontrar una desviaci¨®n de datos si hay cambios en las t¨¢cticas y t¨¦cnicas utilizadas por los ciberatacantes. A medida que los panoramas de amenazas evolucionan, el modelo debe adaptarse a nuevos patrones de comportamiento malicioso para mantener su eficacia.

?Por qu¨¦ es importante la desviaci¨®n de datos??

En pocas palabras, la desviaci¨®n de datos dificulta el rendimiento de los modelos de AI. Se reduce a la idea de ¡°recolecci¨®n de basura¡±. Cuando los modelos de AI utilizan datos obsoletos, producen decisiones obsoletas. En un mundo en el que se crean 2,5 billones de bytes de datos todos los d¨ªas,?las organizaciones no pueden permitirse trabajar en datos obsoletos.?

Las decisiones err¨®neas basadas en modelos de AI pueden provocar errores costosos en aplicaciones del mundo real. Por ejemplo, un modelo de predicci¨®n de ventas podr¨ªa juzgar err¨®neamente la demanda si no considera cambiar las preferencias del cliente. Como se mencion¨® anteriormente, los modelos obsoletos o obsoletos debido a la desviaci¨®n de datos tambi¨¦n pueden provocar p¨¦rdidas financieras, una menor satisfacci¨®n del cliente y oportunidades perdidas.

Desviaci¨®n de conceptos y la importancia de los modelos din¨¢micos

La creaci¨®n de modelos de AI se centra en encontrar la funci¨®n F que asigna los datos de entrada x a una salida y (la predicci¨®n, decisi¨®n o acci¨®n) a trav¨¦s del modo y=F(x). Pero los modelos no pueden permanecer est¨¢ticos en un mundo altamente din¨¢mico dentro de un entorno operativo empresarial en evoluci¨®n.?

Cuando la desviaci¨®n de datos implica que los datos comerciales de entrada x cambien, la desviaci¨®n del concepto implica que la salida y (el resultado comercial deseado que se modela) cambie. En cualquier caso, el modelo F debe cambiar din¨¢micamente a medida que se producen desviaciones en las entradas y/o los resultados.?

La desviaci¨®n conceptual puede afectar significativamente el rendimiento de los modelos de aprendizaje autom¨¢tico al causar:

Degradaci¨®n del modelo

A medida que evoluciona la distribuci¨®n de datos subyacente, el modelo puede volverse menos preciso con el tiempo. Es posible que los patrones iniciales y las relaciones aprendidas durante la capacitaci¨®n ya no se mantengan, lo que provoca una disminuci¨®n en el rendimiento predictivo.

Reducci¨®n de la generalizaci¨®n

Los modelos que experimentan una desviaci¨®n conceptual pueden tener dificultades para generalizarse bien a datos nuevos e invisibles. El conocimiento adquirido durante la capacitaci¨®n puede ser menos aplicable a medida que el modelo se encuentra con caracter¨ªsticas de entrada que difieren de las observadas durante la fase de capacitaci¨®n.

Aumento de falsos positivos/negativos

La desviaci¨®n de conceptos puede llevar a clasificaciones err¨®neas, lo que resulta en tasas m¨¢s altas de falsos positivos o falsos negativos. Esto es particularmente problem¨¢tico en aplicaciones como la atenci¨®n de la salud o las finanzas, donde las predicciones precisas son cruciales.

Desaf¨ªos de adaptaci¨®n

Los modelos deben adaptarse a los patrones de datos cambiantes para mantener la eficacia. Si no se adapta r¨¢pidamente a la desviaci¨®n del concepto, los modelos obsoletos pueden proporcionar predicciones imprecisas, lo que podr¨ªa llevar a una toma de decisiones deficiente.

Uso de recursos pesados

Abordar la desviaci¨®n de conceptos puede requerir recursos inform¨¢ticos adicionales y esfuerzos de recapacitaci¨®n. Es posible que sea necesario realizar actualizaciones y recalibraciones peri¨®dicas del modelo para mantenerse al d¨ªa con los patrones de datos en evoluci¨®n, lo que aumenta los requisitos generales de recursos.

Riesgo de la obsolescencia del modelo

Si la desviaci¨®n del concepto no se gestiona adecuadamente, los modelos pueden volverse obsoletos y perder su eficacia. Esto es particularmente preocupante en aplicaciones donde las predicciones oportunas y precisas son cruciales, como la detecci¨®n de fraude o los sistemas aut¨®nomos.

Impacto en la toma de decisiones

En situaciones en las que los modelos de aprendizaje autom¨¢tico informan decisiones cr¨ªticas, la desviaci¨®n de conceptos puede llevar a predicciones poco confiables, lo que puede dar lugar a opciones y resultados sub¨®ptimos.

Para evitar que los modelos de AI se vean afectados por cualquier tipo de desviaci¨®n, los propios modelos deben ser din¨¢micos.?

Imagine que crea un modelo de aprendizaje autom¨¢tico para predecir los precios de las acciones o el comportamiento del cliente. Lo entrena en algunos datos y funciona bien. Luego, el entorno en el que opera su modelo cambia. Las preferencias de los clientes cambian, la din¨¢mica del mercado evoluciona y, de repente, su modelo podr¨ªa no ser tan definido como sol¨ªa ser.

Aqu¨ª es donde entran en juego los desaf¨ªos. Los modelos est¨¢ticos, que no se adaptan a los cambios en su entorno, tienen dificultades en entornos din¨¢micos. Es como intentar usar un mapa que nunca se actualiza, no muy ¨²til cuando el paisaje cambia constantemente.

?Las consecuencias? Los resultados de modelos obsoletos significan predicciones que ya no son precisas, lo que puede llevar a todos los problemas mencionados anteriormente. Si conf¨ªa en estas predicciones para la toma de decisiones, es posible que se encuentre tomando decisiones basadas en informaci¨®n obsoleta. Imagine un pron¨®stico del tiempo que nunca considere el clima cambiante, no muy confiable.

Las salidas err¨®neas tambi¨¦n pueden crear problemas. Si su modelo malinterpreta los patrones cambiantes en los datos, es como tener un GPS que le indique que gire a la izquierda en un lago porque no sabe que el camino ha cambiado. No solo es inconveniente, puede tener consecuencias reales.

La conclusi¨®n aqu¨ª es que los modelos deben ser tan din¨¢micos como el mundo en el que operan. Las actualizaciones peri¨®dicas, el monitoreo constante y tal vez un toque de magia de aprendizaje autom¨¢tico pueden ayudar a mantenerlos sincronizados con el panorama de datos en constante cambio. En un mundo din¨¢mico, sus modelos tambi¨¦n deben ser din¨¢micos.

Detecci¨®n de desviaci¨®n de datos y conceptos

Detectar la desviaci¨®n de datos y conceptos es como darles a sus modelos de AI un par de anteojos para ver los cambios en su entorno.?

?Por qu¨¦ es tan crucial la detecci¨®n oportuna??

Imagine que est¨¢ dirigiendo un barco a trav¨¦s de mares en constante cambio. Si no nota un cambio en la corriente o un cambio en los patrones clim¨¢ticos, podr¨ªa perder el rumbo. Lo mismo sucede con los modelos de aprendizaje autom¨¢tico que navegan por los datos en evoluci¨®n.

Detectar la desviaci¨®n en los datos de entrada y salida es como tener un radar para los cambios. No se trata solo de mirar hacia atr¨¢s el camino que ha recorrido, sino tambi¨¦n de estar atento al horizonte para lo que vendr¨¢.

Entonces, ?c¨®mo lo hace? Para la desviaci¨®n de datos de entrada, los m¨¦todos estad¨ªsticos como las pruebas de Kolmogorov-Smirnov o los m¨¢s avanzados como la prueba de Page-Hinkley pueden ser como los pronosticadores del tiempo de datos. Le ayudan a detectar cu¨¢ndo comienzan a cambiar los patrones en sus datos de entrada, lo que le da una ventaja.

Cuando se trata de datos de salida, monitorear los cambios en la precisi¨®n de predicci¨®n o las tasas de error puede ser un signo revelador. Si su modelo lo estaba logrando ayer pero de repente comienza a tambalear, es una se?al de alerta.

Y no olvide el rol de los algoritmos de aprendizaje autom¨¢tico. No son solo para hacer predicciones, tambi¨¦n pueden ser guardianes contra la deriva. Los m¨¦todos de Ensemble, que combinan varios modelos, pueden actuar como un consejo de ancianos sabios, cada uno aportando su perspectiva sobre los cambios de datos.

El aprendizaje en l¨ªnea es otro superh¨¦roe de esta historia. Es como tener un modelo que no solo aprende de su pasado, sino que se adapta sobre la marcha, manteni¨¦ndose afilada frente a los panoramas de datos en evoluci¨®n.

Tambi¨¦n hay herramientas dise?adas espec¨ªficamente para la detecci¨®n de desviaciones. Consid¨¦relos como nuestros complementos del aprendizaje autom¨¢tico, equipados con algoritmos para hacer sonar la alarma cuando algo cambia en la atm¨®sfera de datos.

En resumen, detectar la desviaci¨®n no se trata solo de mirar hacia atr¨¢s y decir: ¡°Oh, las cosas cambiaron¡±. Se trata de equipar los modelos con los sensores y las herramientas para anticipar esos cambios para garantizar que sigan en curso en los mares de datos en constante cambio.?

C¨®mo adaptar los modelos a la desviaci¨®n

Piense en la desviaci¨®n de datos como una danza complicada a la que sus modelos necesitan adaptarse constantemente. Cuando los datos se desv¨ªan o el concepto cambia a un nuevo ritmo, sus modelos de AI deben hacer m¨¢s que simplemente mantenerse al d¨ªa; necesitan ajustar sus movimientos para mantenerse sincronizados.

Las estrategias para adaptarse a la desviaci¨®n de datos son como tener un instructor de danza o un core¨®grafo para sus modelos. Un movimiento estrat¨¦gico es volver a capacitar, lo que es como enviar sus modelos de vuelta a la clase de baile con nuevos datos para que puedan aprender los ¨²ltimos pasos. Las actualizaciones peri¨®dicas los mantienen n¨ªtidos y en sinton¨ªa con los ritmos cambiantes.

Luego est¨¢ el aprendizaje en l¨ªnea, que se trata de ajustar sus movimientos en tiempo real. Los modelos que emplean el aprendizaje en l¨ªnea pueden adaptarse sobre la marcha, manteni¨¦ndose ¨¢giles frente a las din¨¢micas de datos cambiantes.

Pero tambi¨¦n debe pensar en el equilibrio. Pi¨¦nselo como dirigir un barco. No quiere mover la rueda cada segundo, pero tampoco quiere navegar directamente a un iceberg porque se niega a adaptarse. Es una danza delicada.

Equilibrar la estabilidad y la flexibilidad significa realizar ajustes bien pensados. Ensamblar m¨¦todos, donde varios modelos unen fuerzas, puede ser como tener una empresa de danza: cada miembro ofrece su estilo ¨²nico, pero juntos crean un rendimiento armonioso.

En resumen, adaptar los modelos a la deriva no se trata solo de ser reactivos, sino de ser bailarines proactivos en el sal¨®n de datos en constante evoluci¨®n. Se trata de encontrar el ritmo, ajustar los pasos y asegurarse de que los modelos se mantengan sin problemas, deslizando con gracia a trav¨¦s de los ritmos cambiantes del mundo de los datos.

Por qu¨¦ É«¿Ø´«Ã½ le ofrece una ventaja para la deriva de datos?

La desviaci¨®n de datos obliga a todos los equipos involucrados con los datos, pero especialmente a los desarrolladores y analistas, a permanecer muy atentos. El problema es que la desviaci¨®n de datos a menudo implica un movimiento de datos muy costoso. Mover los datos lleva mucho tiempo, utiliza muchos recursos y requiere mucho espacio. Estos procesos a menudo fallan o se rompen y pueden afectar la capacidad de una empresa para informar o analizar sus datos, lo que generalmente conlleva consecuencias financieras.?

Tenga en cuenta que el entorno de almacenamiento de datos suele ser el entorno m¨¢s grande de una empresa. Contar con un entorno de prueba/desarrollo que coincida con la producci¨®n es un desaf¨ªo tanto log¨ªstico como financiero para la mayor¨ªa de las empresas. Incluso si tiene entornos de prueba que coinciden con la producci¨®n, los desaf¨ªos log¨ªsticos a menudo hacen imposible mantenerlos sincronizados con los datos actuales. A menudo, solo se actualizan una o dos veces al a?o con puestas de sol de datos que se trasladan a entornos m¨¢s bajos seg¨²n sea necesario. Esto crea una desviaci¨®n de datos, lo que generalmente lleva a un movimiento constante de datos hacia y desde un entorno de prueba para resolver problemas de informes.?

É«¿Ø´«Ã½ mueve los datos de forma r¨¢pida, eficiente y sin costo, ya que las copias de datos son gratuitas. É«¿Ø´«Ã½ ? FlashBlade ? puede acelerar las consultas de an¨¢lisis, mientras que FlashArray ? incorpora la administraci¨®n de datos de copia. Cuando mueve sus datos a É«¿Ø´«Ã½, los procesos que tardaban horas en mover los datos ahora lo hacen en milisegundos. Esta es una gran ventaja cuando se trata de administrar la desviaci¨®n de datos.?

Obtenga m¨¢s informaci¨®n sobre FlashBlade y FlashArray .

10/2023
Driving AI Analytics and Future Business Expansion
NavInfo (Europe) uses Kubernetes on the AIRI architecture to make the AI platform transparent and easy to use. The company¡¯s large models and data sets put high demands on data storage because tasks can run on many different servers and may be moved between them.
Casos de estudio de clientes
2 pages

Buscar recursos y eventos clave

VIDEO
Vea: El valor de una Enterprise Data Cloud.

Charlie Giancarlo explica por qu¨¦ la administraci¨®n de datos, no el almacenamiento, es el futuro. Descubra c¨®mo un enfoque unificado transforma las operaciones de TI de una empresa.

Mirar ahora
RECURSO
El almacenamiento heredado no puede impulsar el futuro.

Las cargas de trabajo modernas exigen velocidad, seguridad y escalabilidad listas para la AI. ?Su pila est¨¢ lista?

Realizar la evaluaci¨®n
DEMOSTRACIONES DE PURE360
Explore, aprenda y experimente É«¿Ø´«Ã½.

Acceda a videos y demostraciones seg¨²n demanda para ver lo que É«¿Ø´«Ã½ puede hacer.

Mire las demostraciones
LIDERAZGO DE PENSAMIENTO
La carrera de la innovaci¨®n.

Los ¨²ltimos conocimientos y perspectivas de l¨ªderes de la industria que est¨¢n a la vanguardia de la innovaci¨®n en almacenamiento.

M¨¢s informaci¨®n
?Su navegador ya no es compatible!

Los navegadores m¨¢s antiguos a menudo representan riesgos de seguridad. Para brindar la mejor experiencia posible al utilizar nuestro sitio, actualice a cualquiera de estos navegadores m¨¢s recientes.