Ética en la ciencia de datos y privacidad y uso adecuados de los datos

Este artículo fue publicado como parte del Blogatón de ciencia de datos.

Los datos pueden utilizarse para tomar decisiones y tener una gran influencia en las empresas. Sin embargo, este valioso recurso no está exento de inconvenientes. ¿Cómo pueden las empresas adquirir, conservar y utilizar datos de forma ética? ¿Cuáles son los derechos que deben ser protegidos? Algunas prácticas éticas deben ser seguidas por el personal comercial que maneja datos. Los datos son la información personal de alguien y debe haber una forma adecuada de utilizar los datos y mantener la privacidad.

¿Qué es la ética?

El término “ética” proviene de la palabra griega Ethos, que significa “hábito” o “costumbre”. La ética nos instruye sobre lo que está bien y lo que está mal. Los filósofos han reflexionado sobre este tema crucial durante mucho tiempo y tienen mucho que decir al respecto. La mayoría de las personas asocian la ética con la moralidad: un sentido natural de lo que es "bueno". Nosotros, como humanos, vivimos en una sociedad, y la sociedad tiene reglas y regulaciones. Debemos ser capaces de decidir qué está bien y qué está mal. La ética se ocupa de los sentimientos, las leyes y las normas sociales que determinan el bien del mal. Nuestras formas de vida deben ser razonables y estar a la altura de las normas de la sociedad.

¿Por qué es importante la ética en la ciencia de datos?

Hoy en día, la ciencia de datos tiene un impacto significativo en la forma en que se llevan a cabo los negocios en disciplinas tan diversas como las ciencias médicas, las ciudades inteligentes y el transporte. Ya sea la protección de datos de identificación personal, el sesgo implícito en la toma de decisiones automatizada, la ilusión de la libre elección en la psicografía, los impactos sociales de la automatización o el aparente divorcio entre la verdad y la confianza en la comunicación virtual, los peligros de la ciencia de datos sin ética. Las consideraciones son tan claras como siempre. La necesidad de un enfoque en la ética de la ciencia de datos se extiende más allá de un balance de estos problemas potenciales porque las prácticas de la ciencia de datos desafían nuestra comprensión de lo que significa ser humano.

Los algoritmos, cuando se implementan correctamente, ofrecen un enorme potencial para el bien del mundo. Cuando los empleamos para realizar trabajos que antes requerían una persona, los beneficios pueden ser enormes: ahorro de costos, escalabilidad, velocidad, precisión y consistencia, por nombrar algunos. Y debido a que el sistema es más preciso y confiable que un ser humano, los resultados son más equilibrados y menos propensos a los prejuicios sociales.

(Fuente de la imagen: https://www.pexels.com/photo/pie-graph-illustration-669621/)

Un mundo digital

Todos vivimos en un mundo digital, donde nuestra vida cotidiana depende de las aplicaciones, administradas por empresas de tecnología. Necesitamos tomar un taxi, llamamos a un Uber. Necesitamos pedir comida, usamos Zomato, etc. Estas empresas tienen nuestros datos personales. Nuestra identificación de correo electrónico, números de teléfono, dirección, historial de compras, etc., etc. La protección de datos personales es, por tanto, un aspecto importante en la actualidad. Quizás ningún aspecto de la ética de la ciencia de datos haya recibido mayor atención en los últimos años que la protección de los datos personales. Nuestras relaciones con las redes sociales y económicas han experimentado una revolución digital, revelando quiénes somos, qué creemos y qué hacemos.

En India, el Proyecto de Ley de Protección de Datos Personales afirma los derechos de los ciudadanos digitales y aborda los peligros de la explotación comercial de los datos personales y de identificación personal. El proyecto de ley de protección de datos es una ley largamente esperada y desesperadamente necesaria que reemplazaría la actual política de protección de datos anticuada, obsoleta e inadecuada de la India. Tiene el potencial de aumentar la comprensión de los usuarios sobre su privacidad y responsabilizar a los custodios y procesadores de datos. Leer más al respecto esta página.

¿Quién regula y es propietario de nuestros Datos?

Al codificar referentes éticos como el derecho a la información, el derecho a objetar, el derecho al acceso, el derecho a la rectificación y el derecho al olvido, estos marcos legales intentan reequilibrar las relaciones desiguales de poder e influencia entre organizaciones y organizaciones. individuos

Las divisiones entre público y privado, individuos y sociedad, y ricos y pobres en recursos se están redefiniendo a medida que los datos se convierten en la nueva moneda de la economía internacional. ¿Qué derechos se pueden asignar con permiso expreso o implícito y de quién son los datos personales? ¿Hasta qué punto se debe permitir que las instituciones gubernamentales y comerciales recopilen y controlen enormes bases de datos de interacción humana? ¿Hasta qué punto deben ser responsables estos controladores y procesadores de datos por la pérdida o el abuso de nuestra información personal?

Ética de la ciencia de datos

Los analistas, los científicos de datos y los profesionales de la tecnología de la información deben preocuparse por la ética de la ciencia de datos. Cualquiera que trabaje con datos debe comprender los fundamentos. Cualquier persona que maneje cualquier tipo de datos debe informar cualquier instancia de robo de datos, recopilación, almacenamiento, uso de datos poco éticos, etc.

Por ejemplo, desde la primera vez que un consumidor ingresa su dirección de correo electrónico en su sitio web hasta el momento en que compra sus productos, su organización puede recopilar y conservar datos sobre sus viajes. Las personas del equipo de marketing podrían estar tratando con los datos. Los datos de la persona deben ser conservados.

Los datos protegidos se han hecho públicos en Internet en el pasado, lo que ha causado daños a las personas cuya información se ha puesto a disposición. Las bases de datos mal configuradas, el software espía, el robo o la publicación en un foro público pueden provocar fugas de datos. Las personas y las organizaciones deben utilizar prácticas informáticas seguras, realizar auditorías frecuentes del sistema y adoptar políticas para abordar la seguridad informática y de datos. Las empresas deben tomar las medidas de ciberseguridad adecuadas para evitar la fuga de datos e información. Esto es más importante para los bancos y las instituciones financieras que manejan el dinero de los clientes. Las protecciones deben mantenerse incluso cuando el equipo se transfiere o se desecha, de acuerdo con las políticas.

Tomando decisiones:

Los científicos de datos nunca deben emitir juicios sin contactar a un cliente, incluso si la decisión es por el interés del proyecto. Tanto los científicos de datos como los clientes deben entender las metas y los objetivos de los proyectos.

Supongamos que un científico de datos desea tomar medidas en nombre de un cliente en un determinado proyecto en curso. Incluso si la acción es ventajosa para el cliente y el proyecto, se debe explicar al cliente y no se debe hacer ninguna elección en su nombre. Los científicos de datos solo deben tomar decisiones cuando así lo establezca expresamente el contrato o cuando su autoridad se lo permita.

Privacidad y Confidencialidad de los Datos:

Los científicos de datos están continuamente involucrados en la producción, el desarrollo y la recepción de información. Los datos relativos a afiliados de clientes, clientes, trabajadores u otras partes con las que los clientes tienen un acuerdo de confidencialidad a menudo se incluyen en esta categoría. Entonces, independientemente del tipo de información confidencial, es responsabilidad del científico de datos protegerla. Solo cuando el cliente brinde permiso para que los científicos de datos compartan o hablen sobre este tipo de información, se debe divulgar o hablar sobre ella. Se debe mantener la total privacidad de los datos de los clientes o de los clientes.

Incluso si un consumidor da su consentimiento para que su organización recopile, almacene y analice su información de identificación personal (PII), eso no significa que quiera que se haga pública.

Personalmente, la información identificable incluye:

Número de teléfono, Dirección, Nombre completo, Número de tarjeta PAN, etc.

Para preservar la privacidad de las personas, asegúrese de mantener la información en una base de datos segura para que no caiga en las manos equivocadas. La protección con contraseña de autenticación dual y el cifrado de archivos son dos soluciones de seguridad de datos que ayudan a proteger la privacidad.

Propiedad de los datos:

Uno de los conceptos importantes de la ética en Data Science es que el individuo tiene la propiedad de los datos. Recopilar datos personales de alguien sin su consentimiento es ilegal e inmoral. Como resultado, se requiere el consentimiento para adquirir los datos de alguien.

Los acuerdos escritos firmados, las políticas de privacidad digital que requieren que los usuarios acepten los términos y condiciones de una empresa y las ventanas emergentes con casillas de verificación que permiten a los sitios web realizar un seguimiento del comportamiento en línea de los usuarios mediante el uso de cookies son todos enfoques típicos para obtener el consentimiento. Para evitar problemas éticos y legales, nunca asuma que un consumidor está de acuerdo con que usted recopile sus datos; Siempre pide permiso.

Las intenciones de recopilación y análisis de datos deben ser buenas. Los profesionales de datos deben tener claro cómo y por qué usan los datos. Si un equipo recopila datos sobre los hábitos de gasto de los usuarios para crear una aplicación para administrar los gastos, entonces la intención es buena.

Transparencia:

Los interesados tienen derecho a saber cómo planea adquirir, mantener y utilizar su información personal, además de poseerla. Se debe utilizar la transparencia al adquirir datos. Debe crear una política que explique cómo se utilizan las cookies para rastrear la actividad del usuario y cómo la información recopilada se mantiene en una base de datos segura, así como entrenar un algoritmo que brinde una experiencia en línea personalizada. Es derecho del usuario tener acceso a esta información para que pueda elegir si acepta o no las cookies de su sitio.

Algunos ejemplos de la vida real:

Publicación de datos de OK Cupid:

En 2016, Emil Kirkegaard y Julius Daugbjerg Bjerrekr de Dinamarca compartieron un conjunto de datos en Open Science Framework que incluía información sobre más de 70,000 XNUMX miembros del servicio de citas en línea OkCupid. Los investigadores extrajeron información del sitio de OkCupid, incluidos los nombres de usuario (pero no los nombres reales), las edades, el género, la religión y las características de personalidad, así como las respuestas a las preguntas que el sitio hace a los nuevos miembros para ayudar a descubrir posibles coincidencias, para construir su propio conjunto de datos.

La información, que fue recopilada entre noviembre de 2014 y marzo de 2015, no es anónima y es bastante personal. La única razón por la que los investigadores no han compartido las imágenes de los usuarios es que ocuparía demasiado espacio en el disco duro, según los investigadores.

Cualquiera que haya repetido un nombre de usuario de un sitio a otro, o que haya usado un nombre que se pueda rastrear hasta ellos, de repente puede ser gravemente vulnerable. Los datos se rasparon y cargaron en violación de las normas éticas básicas que observan los científicos sociales. Cuando se les preguntó en Twitter, los investigadores afirmaron que los datos ya eran públicos porque se habían enviado a OkCupid.

Este fue un caso de comportamiento poco ético con los datos. A pesar de que los datos eran públicos, recopilarlos y compartirlos explícitamente no estaba bien.

Violación de datos de Robinhood:

La empresa estadounidense de servicios financieros Robinhood anunció una violación de datos en noviembre de 2021, que afectó a más de cinco millones de usuarios de la aplicación comercial. Se utilizó un sistema de atención al cliente para obtener direcciones de correo electrónico, nombres, números de teléfono y otra información. Según la firma, no se revelaron números de Seguro Social durante la investigación. No se incluyeron cuentas bancarias ni tarjetas de débito.

Este fue un caso de robo de datos y ocurrió debido a problemas de seguridad en el almacenamiento de datos. Se deben tomar medidas para prevenir estos casos.

Data Science en la lucha contra el Covid-19:

El análisis de brotes, una metodología de ciencia de datos destinada a guiar la respuesta a brotes, ha aumentado en respuesta a la creciente complejidad de los datos de brotes.

El gobierno de Corea del Sur utilizó análisis en tiempo real para mejorar el diseño de planes preventivos y la vigilancia de pacientes con covid-positivo. Incorpora datos de sistemas IoT e IA que sustentan redes reales de ciudades inteligentes, así como datos personales proporcionados por pacientes confirmados. Con el uso de análisis de big data, los investigadores pueden seguir los viajes de los pacientes, identificar sus contactos y anticipar la posible magnitud del brote en un lugar específico. La información también se utiliza para crear planes e instrucciones de prevención.

Este es un ejemplo de cómo se utilizan los datos para un buen propósito.

Conclusión:

La ética de la ciencia de datos es un tema importante de discusión en el mundo actual. Las organizaciones y empresas que usan datos e implementan la ciencia de datos deben seguir un conjunto de ética al tratar con datos. Cuando se usan de manera ética, los datos pueden ayudarlo a tomar mejores decisiones y hacer una diferencia en el mundo.

Los medios que se muestran en este artículo no son propiedad de Analytics Vidhya y se utilizan a discreción del autor.

Inteligencia de datos generativa

Ética en la ciencia de datos y privacidad y uso adecuados de los datos

¿Qué es la ética?

¿Por qué es importante la ética en la ciencia de datos?

Un mundo digital

¿Quién regula y es propietario de nuestros Datos?

Ética de la ciencia de datos

Algunos ejemplos de la vida real:

Conclusión:

Relacionado:

Immersed For Vision Pro le ofrece monitores virtuales adicionales

Google y Harvard mapean una pequeña porción del cerebro humano con extrema precisión

Información más reciente

café vc

café vc

OpenAI lanza GPT-4o, un modelo de IA en tiempo real que interactúa a través de voz, texto y visión – Tech Startups

Diseñado para el éxito: cómo las soluciones de software personalizadas de Cody impulsan a las empresas hacia adelante

Las 5 principales ventajas de un servicio profesional de extinción de incendios 24/7

Se informa que Apple está a punto de vender Vision Pro fuera de EE. UU.