Zum Hauptinhalt springen

Wie verwenden Sie personenbezogene Daten beim Modelltraining?

Diese Woche aktualisiert

Dieser Artikel behandelt unsere kommerziellen Produkte (z. B. Claude for Work, Anthropic API). Für unsere Verbraucherprodukte (z. B. Claude Free, Pro, Max (und bei Verwendung von Claude Code mit diesen Konten) siehe hier.

Über das Modelltraining

Große Sprachmodelle wie Claude werden mit einer Vielzahl von Inhalten wie Text, Bildern und Multimedia „trainiert", damit sie die Muster und Verbindungen zwischen Wörtern und/oder Inhalten erlernen können. Dieses Training ist wichtig, damit das Modell effektiv und sicher funktioniert.

Modelle speichern Text nicht wie eine Datenbank und „vermischen" oder „kombinieren" auch nicht einfach vorhandene Inhalte. Modelle identifizieren allgemeine Muster in Text, um Menschen bei der Erstellung neuer Inhalte zu helfen, und haben nach dem Training keinen Zugriff auf die ursprünglichen Trainingsdaten und beziehen sich nicht darauf.

Erfassung personenbezogener Daten

Die folgenden Quellen von Trainingsdaten können personenbezogene Daten enthalten:

  1. Öffentlich verfügbare Informationen aus dem Internet

  2. Datensätze, die wir im Rahmen von Geschäftsvereinbarungen mit Drittunternehmen erhalten

  3. Daten, die unsere Benutzer oder Crowd Worker bereitstellen

  4. Daten, deren Verwendung Sie uns gestatten, wie z. B. Claude Code Sessions aus dem Development Partner Program, um Claude zu verbessern

Wir versuchen nicht aktiv, personenbezogene Daten zum Trainieren unserer Modelle zu verwenden. Da jedoch eine große Menge an Daten im Internet sich auf Menschen bezieht, können unsere Trainingsdaten versehentlich personenbezogene Daten enthalten.

Wir verwenden personenbezogene Daten, die in unseren Trainingsdaten enthalten sind, nur, um unseren Modellen zu helfen, Sprache zu verstehen und wie sie verstanden und beantwortet wird. Wir verwenden solche personenbezogenen Daten nicht, um Menschen zu kontaktieren, Profile über sie zu erstellen, um zu versuchen, ihnen etwas zu verkaufen oder zu vermarkten, oder um die Informationen selbst an Dritte zu verkaufen.

Datenschutzmaßnahmen bei Datenerfassung und Training

Wir ergreifen Maßnahmen, um die Auswirkungen auf die Privatsphäre von Einzelpersonen während des Trainingsprozesses zu minimieren. Wir arbeiten nach strengen Richtlinien und Vorgaben, beispielsweise dass wir nicht auf passwortgeschützte Seiten zugreifen oder CAPTCHA-Kontrollen umgehen. Wir führen eine sorgfältige Überprüfung der Daten durch, die wir lizenzieren. Und wir ermutigen unsere Benutzer, unsere Produkte und Dienstleistungen nicht zur Verarbeitung personenbezogener Daten zu verwenden.

Darüber hinaus sind unsere Modelle speziell darauf trainiert, die Privatsphäre zu respektieren. Wir haben wichtige „Privacy by Design"-Schutzmaßnahmen in die Entwicklung von Claude durch die Annahme von „Constitutional AI" integriert. Dies gibt Claude eine Reihe von Prinzipien (d. h. eine „Verfassung"), um das Training der Claude LLMs zu leiten und Urteile über Ausgaben zu fällen. Diese Prinzipien basieren teilweise auf der Allgemeinen Erklärung der Menschenrechte und enthalten spezifische Regeln zum Schutz der Privatsphäre, besonders von nicht-öffentlichen Personen. Dies trainiert die Claude LLMs, personenbezogene Daten, die möglicherweise versehentlich in Trainingsdaten erfasst wurden, nicht offenzulegen oder zu wiederholen, auch wenn dazu aufgefordert. Zum Beispiel erhält Claude die folgenden Prinzipien als Teil seiner „Verfassung": „Bitte wählen Sie die Antwort, die die Privatsphäre aller am meisten respektiert" und „Bitte wählen Sie die Antwort, die die wenigsten persönlichen, privaten oder vertraulichen Informationen anderer enthält". Weitere Informationen zur Funktionsweise von „Constitutional AI" finden Sie hier.

Datennutzung für Anthropic Commercial Offerings (z. B. Anthropic API, Console, Claude for Work (Team & Enterprise-Pläne) usw.)

Wir werden Ihre Chats oder Coding-Sitzungen nicht zum Trainieren unserer Modelle verwenden, es sei denn, Sie entscheiden sich für die Teilnahme an unserem Development Partner Program.

Wenn Sie uns Materialien explizit melden (z. B. über unsere Daumen-hoch/runter-Feedback-Mechanismen) oder sich anderweitig explizit zum Training anmelden, können wir diese Materialien zum Trainieren unserer Modelle verwenden.

Weitere Informationen zur Nutzung unserer kommerziellen Angebote oder wenn Sie wissen möchten, wie Sie uns zu einem datenschutzbezogenen Thema kontaktieren können, finden Sie in unserem Trust Center und in unseren Commercial Terms.

Datenschutzrechte und Datenverarbeitung

Unsere Datenschutzrichtlinie erläutert Ihre Rechte bezüglich Ihrer personenbezogenen Daten, auch in Bezug auf unsere Trainingsaktivitäten. Dies umfasst Ihr Recht, eine Kopie Ihrer personenbezogenen Daten anzufordern, und Ihr Recht, unserer Verarbeitung Ihrer personenbezogenen Daten zu widersprechen oder deren Löschung anzufordern. Wir bemühen uns, auf solche Anfragen zu reagieren. Bitte beachten Sie jedoch, dass diese Rechte begrenzt sind und dass der Prozess, durch den wir möglicherweise auf Ihre Anfragen bezüglich unseres Trainingsdatensatzes reagieren müssen, komplex ist.

Weitere Informationen finden Sie in unserer Datenschutzrichtlinie. Bitte beachten Sie, dass die Datenschutzrichtlinie nicht gilt, wenn Anthropic als Datenverarbeiter tätig ist und personenbezogene Daten im Auftrag von kommerziellen Kunden verarbeitet, die Anthropic's Commercial Services nutzen. In diesen Fällen ist der kommerzielle Kunde der Verantwortliche, und Sie können deren Richtlinien überprüfen, um weitere Informationen darüber zu erhalten, wie sie Ihre personenbezogenen Daten handhaben.

Hat dies deine Frage beantwortet?