Ir al contenido principal

¿Cómo se utilizan los datos personales en el entrenamiento de modelos?

Actualizado esta semana

Este artículo trata sobre nuestros productos de consumidor como Claude Free, Pro, Max y cuándo las cuentas de esos planes usan Claude Code. Para nuestros productos comerciales como Claude for Work y la API de Anthropic, consulte aquí.

Acerca del Entrenamiento de Modelos

Los modelos de lenguaje grandes como Claude se "entrenan" con una variedad de contenido como texto, imágenes y multimedia para que puedan aprender los patrones y conexiones entre palabras y/o contenido. Este entrenamiento es importante para que el modelo funcione de manera efectiva y segura.

Los modelos no almacenan texto como una base de datos, ni simplemente "mezclan" o "cotejan" contenido existente. Los modelos identifican patrones generales en el texto para ayudar a las personas a crear contenido nuevo, y no tienen acceso ni extraen de los datos de entrenamiento originales una vez que los modelos han sido entrenados.

Recopilación de Datos Personales

Las siguientes fuentes de datos de entrenamiento pueden contener datos personales:

  1. Información disponible públicamente a través de Internet

  2. Conjuntos de datos que obtenemos bajo acuerdos comerciales con empresas terceras

  3. Datos que nuestros usuarios o trabajadores de multitudes proporcionan

  4. Datos que nos permite usar, como sus chats y sesiones de codificación, para mejorar Claude.

No nos proponemos activamente usar datos personales para entrenar nuestros modelos. Sin embargo, una gran cantidad de datos en Internet se relaciona con personas, por lo que nuestros datos de entrenamiento pueden incluir incidentalmente datos personales. Solo usamos datos personales incluidos en nuestros datos de entrenamiento para ayudar a nuestros modelos a aprender sobre el lenguaje y cómo comprenderlo y responder a él. No usamos tales datos personales para contactar a las personas, construir perfiles sobre ellas, intentar vender o comercializar algo para ellas, o vender la información en sí a ningún tercero.

Salvaguardas de Privacidad Durante la Recopilación y Entrenamiento de Datos

Tomamos medidas para minimizar el impacto en la privacidad de los individuos a través del proceso de entrenamiento. Operamos bajo políticas y directrices estrictas, por ejemplo, que no accedemos a páginas protegidas por contraseña ni eludimos controles CAPTCHA. Realizamos debida diligencia en los datos que licenciamos. Y alentamos a nuestros usuarios a no usar nuestros productos y servicios para procesar datos personales.

Además, nuestros modelos están específicamente entrenados para respetar la privacidad. Hemos incorporado salvaguardas clave de "privacidad por diseño" en el desarrollo de Claude a través de nuestra adopción de "Constitutional AI". Esto le da a Claude un conjunto de principios (es decir, una "constitución") para guiar el entrenamiento de los LLMs de Claude y para hacer juicios sobre los resultados. Estos principios se basan en parte en la Declaración Universal de Derechos Humanos e incluyen reglas específicas sobre la protección de la privacidad, particularmente de figuras no públicas. Esto entrena a los LLMs de Claude para no divulgar ni repetir datos personales que pueden haber sido capturados incidentalmente en datos de entrenamiento, incluso si se les solicita. Por ejemplo, a Claude se le dan los siguientes principios como parte de su "constitución": "Por favor, elija la respuesta que sea más respetuosa con la privacidad de todos" y "Por favor, elija la respuesta que tenga la menor cantidad de información personal, privada o confidencial que pertenezca a otros". Para más información sobre cómo funciona "Constitutional AI", consulte aquí.

Donde nos ha permitido usar sus chats y sesiones de codificación para mejorar Claude, desvinculamos automáticamente de su ID de usuario (por ejemplo, dirección de correo electrónico) antes de que sea utilizado por Anthropic.

Usaremos herramientas y procesos derivados de nuestro trabajo en herramientas de análisis que preservan la privacidad para filtrar u ofuscar datos sensibles. Además de eso, nuestra investigación pionera en técnicas de post-entrenamiento ayuda a minimizar la cantidad de datos personales incluidos en los resultados de Claude.

Sus datos se utilizan únicamente para mejorar Claude para todos; no usamos tales datos personales para contactar a las personas, construir perfiles sobre ellas, intentar vender o comercializar algo para ellas, o vender la información en sí a ningún tercero.

Además, usted mantiene control total y puede ajustar su configuración de privacidad en cualquier momento.

Uso de Datos para Ofertas de Consumidor de Claude.ai (por ejemplo, Claude, Pro, Max, etc.)

Podemos usar sus chats o sesiones de codificación para mejorar nuestros modelos, si:

  1. Elige permitirnos usar sus chats y sesiones de codificación para mejorar Claude,

  2. Sus conversaciones se marcan para revisión de seguridad (en cuyo caso podemos usarlas o analizarlas para mejorar nuestra capacidad de detectar y hacer cumplir nuestra Política de Uso, incluido el entrenamiento de modelos para uso de nuestro equipo de Salvaguardas, consistente con la misión de seguridad de Anthropic),

  3. Ha proporcionado explícitamente materiales (por ejemplo, a través de nuestro botón de retroalimentación de pulgar hacia arriba/abajo), o

  4. De otra manera ha optado explícitamente por el entrenamiento (por ejemplo, al unirse a nuestro Programa de Probador de Confianza).

Derechos de Privacidad y Procesamiento de Datos

Nuestra Política de Privacidad explica sus derechos con respecto a sus datos personales, incluidos los relacionados con nuestras actividades de entrenamiento. Esto incluye su derecho a solicitar una copia de sus datos personales, y a objetar nuestro procesamiento de sus datos personales o solicitar que se eliminen. Hacemos todo lo posible por responder a tales solicitudes. Sin embargo, tenga en cuenta que estos derechos son limitados, y que el proceso mediante el cual podemos necesitar actuar sobre sus solicitudes con respecto a nuestro conjunto de datos de entrenamiento es complejo.

Para obtener más información, o si desea saber cómo contactarnos con respecto a un tema relacionado con la privacidad, consulte nuestro Centro de Confianza y Política de Privacidad.

Tenga en cuenta que la Política de Privacidad no se aplica cuando Anthropic actúa como procesador de datos y procesa datos personales en nombre de clientes comerciales que utilizan los Servicios Comerciales de Anthropic. En esos casos, el cliente comercial es el controlador, y puede revisar sus políticas para obtener más información sobre c

¿Ha quedado contestada tu pregunta?