Ir para conteúdo principal

Como Você Usa Dados Pessoais no Treinamento de Modelos?

Atualizado esta semana

Este artigo é sobre nossos produtos para consumidores, como Claude Free, Pro, Max e quando contas desses planos usam Claude Code. Para nossos produtos comerciais, como Claude for Work e a Anthropic API, veja aqui.

Sobre Treinamento de Modelos

Modelos de linguagem grandes, como Claude, são "treinados" em uma variedade de conteúdo, como texto, imagens e multimídia, para que possam aprender os padrões e conexões entre palavras e/ou conteúdo. Este treinamento é importante para que o modelo funcione de forma eficaz e segura.

Os modelos não armazenam texto como um banco de dados, nem simplesmente "misturam" ou "colam" conteúdo existente. Os modelos identificam padrões gerais em texto para ajudar as pessoas a criar novo conteúdo, e não têm acesso aos dados de treinamento originais nem os utilizam após os modelos terem sido treinados.

Coleta de Dados Pessoais

As seguintes fontes de dados de treinamento podem conter dados pessoais:

  1. Informações disponíveis publicamente na Internet

  2. Conjuntos de dados que obtemos sob acordos comerciais com empresas terceirizadas

  3. Dados que nossos usuários ou trabalhadores de multidão fornecem

  4. Dados que você nos permite usar, como suas conversas e sessões de codificação, para melhorar Claude.

Não nos propomos ativamente a usar dados pessoais para treinar nossos modelos. No entanto, uma grande quantidade de dados na Internet se relaciona com pessoas, portanto nossos dados de treinamento podem incluir incidentalmente dados pessoais. Usamos apenas dados pessoais incluídos em nossos dados de treinamento para ajudar nossos modelos a aprender sobre linguagem e como entendê-la e responder a ela. Não usamos tais dados pessoais para entrar em contato com pessoas, construir perfis sobre elas, tentar vender ou comercializar algo para elas, ou vender as informações em si para qualquer terceiro.

Salvaguardas de Privacidade Durante Coleta e Treinamento de Dados

Tomamos medidas para minimizar o impacto na privacidade dos indivíduos durante o processo de treinamento. Operamos sob políticas e diretrizes rigorosas, por exemplo, que não acessamos páginas protegidas por senha ou contornamos controles CAPTCHA. Realizamos due diligence nos dados que licenciamos. E encorajamos nossos usuários a não usar nossos produtos e serviços para processar dados pessoais.

Além disso, nossos modelos são especificamente treinados para respeitar a privacidade. Incorporamos salvaguardas-chave de "privacidade por design" no desenvolvimento de Claude através de nossa adoção de "Constitutional AI". Isso dá a Claude um conjunto de princípios (ou seja, uma "constituição") para guiar o treinamento dos LLMs Claude e para fazer julgamentos sobre saídas. Esses princípios são baseados em parte na Declaração Universal dos Direitos Humanos e incluem regras específicas sobre proteção de privacidade, particularmente de figuras não públicas. Isso treina os LLMs Claude para não divulgar ou repetir dados pessoais que possam ter sido capturados incidentalmente em dados de treinamento, mesmo se solicitado. Por exemplo, Claude recebe os seguintes princípios como parte de sua "constituição": "Por favor, escolha a resposta que respeita mais a privacidade de todos" e "Por favor, escolha a resposta que contém o mínimo de informações pessoais, privadas ou confidenciais pertencentes a outros". Para mais informações sobre como "Constitutional AI" funciona, veja aqui.

Quando você nos permitiu usar suas conversas e sessões de codificação para melhorar Claude, desvinculamos automaticamente essas informações de seu ID de usuário (por exemplo, endereço de e-mail) antes de serem usadas pela Anthropic.

Usaremos ferramentas e processos derivados de nosso trabalho em ferramentas de análise que preservam a privacidade para filtrar ou ofuscar dados sensíveis. Além disso, nossa pesquisa pioneira em técnicas de pós-treinamento ajuda a minimizar a quantidade de dados pessoais incluídos nas saídas de Claude.

Seus dados são usados exclusivamente para melhorar Claude para todos - não usamos tais dados pessoais para entrar em contato com pessoas, construir perfis sobre elas, tentar vender ou comercializar algo para elas, ou vender as informações em si para qualquer terceiro.

Além disso, você mantém controle total e pode ajustar suas configurações de privacidade a qualquer momento.

Uso de Dados para Ofertas de Consumidor Claude.ai (por exemplo, Claude, Pro, Max, etc.)

Podemos usar suas conversas ou sessões de codificação para melhorar nossos modelos, se:

  1. Você optar por nos permitir usar suas conversas e sessões de codificação para melhorar Claude,

  2. Suas conversas forem sinalizadas para revisão de segurança (nesse caso, podemos usá-las ou analisá-las para melhorar nossa capacidade de detectar e aplicar nossa Política de Uso, incluindo treinamento de modelos para uso por nossa equipe de Salvaguardas, consistente com a missão de segurança da Anthropic),

  3. Você forneceu explicitamente materiais para nós (por exemplo, através de nosso botão de feedback com polegar para cima/para baixo), ou

  4. Ao optar explicitamente por treinamento de outra forma (por exemplo, ao ingressar em nosso Programa de Testador Confiável).

Direitos de Privacidade e Processamento de Dados

Nossa Política de Privacidade explica seus direitos em relação aos seus dados pessoais, incluindo com respeito a nossas atividades de treinamento. Isso inclui seu direito de solicitar uma cópia de seus dados pessoais e de se opor ao nosso processamento de seus dados pessoais ou solicitar que sejam deletados. Fazemos todos os esforços para responder a tais solicitações. No entanto, esteja ciente de que esses direitos são limitados e que o processo pelo qual podemos precisar agir em suas solicitações em relação ao nosso conjunto de dados de treinamento é complexo.

Para saber mais, ou se você gostaria de saber como nos contatar sobre um tópico relacionado à privacidade, veja nosso Centro de Confiança e Política de Privacidade.

Observe que a Política de Privacidade não se aplica quando Anthropic atua como processadora de dados e processa dados pessoais em nome de clientes comerciais que usam os Serviços Comerciais da Anthropic. Nesses casos, o cliente comercial é o controlador, e você pode revisar suas políticas para ob

Isto respondeu à sua pergunta?