Praxis
Kontakt-Deduplizierung
Kontakt-Deduplizierung erkennt und verschmilzt doppelte Adressbucheinträge – über normalisierte E-Mails und Telefonnummern plus unscharfen Namensvergleich.
Dubletten sind der Normalzustand eines Adressbuchs, das ein paar Smartphones überlebt hat. Jeder CSV-Import, jedes synchronisierte Konto (Google, iCloud, Exchange, WhatsApp) und jeder Visitenkarten-Scan kann eine zweite Kopie derselben Person erzeugen, weil die beteiligten Systeme keine gemeinsame Kennung teilen. Deduplizierung ist der Korrekturlauf: Datensätze finden, die denselben Menschen beschreiben, entscheiden, welcher überlebt, und den Rest verlustfrei hineinverschmelzen.
Die Erkennung stützt sich auf zwei Arten von Abgleich. Exakter Schlüsselabgleich normalisiert zuerst: E-Mail kleinschreiben und trimmen, Telefonnummer nach E.164 wandeln (+4915123456789), damit "0151 234 56 789" und "+49 151 2345 6789" kollidieren – und vergleicht dann. Unscharfer Abgleich greift, wenn kein Schlüssel geteilt wird: Editierdistanz oder Jaro-Winkler-Ähnlichkeit auf Namen, meist nach Anfangsbuchstaben geblockt, damit es schnell bleibt. Im unscharfen Abgleich wohnen die Fehltreffer – "Thomas Müller" matcht den eigenen Sohn.
Das Verschmelzen ist Policy-Sache: Felder vereinigen, wo möglich (eine Person darf drei Nummern haben), bei Konflikten den zuletzt bearbeiteten Wert bevorzugen – und immer einen Undo-Pfad behalten. Ein aggressiver Auto-Merge, der falsch rät, zerstört Daten endgültiger, als Dubletten es je taten.
Wie Dubletten überhaupt entstehen
Drei Fabriken produzieren die meisten Dubletten. Multi-Source-Sync: Dein Handy blendet Google-, iCloud- und SIM-Kontakte zu einer Ansicht zusammen, aber jede Quelle behält ihren eigenen Datensatz – Konto deaktivieren und wieder aktivieren, und die "verschmolzene" Person zerfällt in zwei. Importe ohne Kennung: vCards haben genau dafür die UID-Property, doch die meisten Exporter erzeugen pro Export eine frische UID, sodass ein erneuter Import derselben Datei alles verdoppelt. Und menschliche Eingabe: Du speicherst "Sarah Yoga" im Kurs, ein Jahr später taucht "Sarah Lindqvist" über WhatsApp auf. Weil die Ursachen strukturell sind, ist Deduplizierung wiederkehrende Wartung – kein einmaliges Aufräumen.
Exakte Schlüssel, unscharfe Namen und die Fehltreffer-Falle
Ein vernünftiger Matcher arbeitet in Vertrauensstufen. Stufe eins: identische normalisierte E-Mail oder E.164-Nummer – sicher genug für einen automatischen Vorschlag, mit einer Einschränkung: gemeinsame Festnetznummern und Familien-Mailadressen existieren. Stufe zwei: sehr hohe Namensähnlichkeit plus ein bestätigendes Feld (gleicher Geburtstag, gleiche Organisation). Stufe drei: Namensähnlichkeit allein – hier niemals automatisch verschmelzen. Spitznamen (Bill/William, Sepp/Josef), Transliterationsvarianten (Müller/Mueller), Ehenamen und Junior/Senior-Paare hebeln naive String-Distanz aus. Die Kostenasymmetrie bestimmt das Design: Eine übersehene Dublette ist Unordnung, ein falscher Merge ist stiller Datenverlust in den Datensätzen zweier Menschen.
Ein Dedup-Lauf mit Endearist
Endearist bringt ein Dedup-Tool mit, das genau diese gestufte Logik anwendet: Es normalisiert E-Mails und Telefonnummern, bewertet Namensähnlichkeit und präsentiert Merge-Kandidaten nach Konfidenz gruppiert – du bestätigst jede Zusammenführung, statt einer Blackbox zu vertrauen. Weil Endearist local-first ist, läuft der gesamte Vergleich auf deinem Gerät; dein Adressbuch wird zum Abgleich nie auf einen Server hochgeladen. Feld-Vereinigungen erhalten jede Nummer und Notiz aus beiden Datensätzen, und der Import nutzt dasselbe Matching – ein altes vCard- oder CSV-Export einzuspielen erzeugt Merge-Vorschläge statt stiller Verdopplung.
Zum Ausprobieren
Häufige Fragen
- Warum zeigt mein Handy ständig doppelte Kontakte?
- Fast immer Multi-Account-Sync. Dein Handy zeigt eine zusammengeführte Ansicht der Kontakte aus Google, iCloud, Exchange, WhatsApp und SIM, aber jedes Konto speichert seine eigene Kopie. Versagt die Verknüpfungsheuristik – Spitzname in der einen Quelle, voller Name in der anderen – siehst du zwei Einträge. Behebe es an der Quelle: ein Hauptkonto für Kontakte wählen, die übrigen exportieren, ins Hauptkonto importieren und dort deduplizieren.
- Sollten Dubletten automatisch verschmolzen werden?
- Nur auf der höchsten Vertrauensstufe – identische normalisierte E-Mail oder Nummer – und selbst dann mit Undo. Alles, was auf Namensähnlichkeit beruht, braucht menschliche Bestätigung, denn die Fehlerfälle (Eltern und Kind mit gleichem Namen, Kollegen mit gemeinsamer Büronummer, Paare mit einer E-Mail-Adresse) sind häufig, und ein falscher Merge vermischt die Historien zweier Menschen unumkehrbar. Gute Tools schlagen in Masse vor, lassen dich aber pro Paar bestätigen.
- Welche Felder eignen sich am sichersten für den Abgleich?
- In absteigender Verlässlichkeit: eine geteilte stabile Kennung wie die vCard-UID (in der Praxis selten), normalisierte E-Mail-Adresse, Telefonnummer in E.164-Form, dann Name plus ein bestätigendes Feld wie Geburtstag oder Arbeitgeber. Namen allein sind das schwächste Signal – voller Spitznamen, Schreibvarianten und tatsächlich verschiedener Menschen mit gleichem Namen. Postadressen sind fast nutzlos: Haushalte teilen sie, und die Formatierung variiert wild.
Zuletzt aktualisiert: 2026-06-10
Beziehungen pflegen, nicht verwalten.
Endearist ist ein local-first Personal CRM. Kostenlos bis 25 Kontakte.
Kostenlos starten