Endearist
DE EN Get Endearist

Praxis

Kontakt-Deduplizierung

Kontakt-Deduplizierung erkennt und verschmilzt doppelte Adressbucheinträge – über normalisierte E-Mails und Telefonnummern plus unscharfen Namensvergleich.

Dubletten sind der Normalzustand eines Adressbuchs, das ein paar Smartphones überlebt hat. Jeder CSV-Import, jedes synchronisierte Konto (Google, iCloud, Exchange, WhatsApp) und jeder Visitenkarten-Scan kann eine zweite Kopie derselben Person erzeugen, weil die beteiligten Systeme keine gemeinsame Kennung teilen. Deduplizierung ist der Korrekturlauf: Datensätze finden, die denselben Menschen beschreiben, entscheiden, welcher überlebt, und den Rest verlustfrei hineinverschmelzen.

Die Erkennung stützt sich auf zwei Arten von Abgleich. Exakter Schlüsselabgleich normalisiert zuerst: E-Mail kleinschreiben und trimmen, Telefonnummer nach E.164 wandeln (+4915123456789), damit "0151 234 56 789" und "+49 151 2345 6789" kollidieren – und vergleicht dann. Unscharfer Abgleich greift, wenn kein Schlüssel geteilt wird: Editierdistanz oder Jaro-Winkler-Ähnlichkeit auf Namen, meist nach Anfangsbuchstaben geblockt, damit es schnell bleibt. Im unscharfen Abgleich wohnen die Fehltreffer – "Thomas Müller" matcht den eigenen Sohn.

Das Verschmelzen ist Policy-Sache: Felder vereinigen, wo möglich (eine Person darf drei Nummern haben), bei Konflikten den zuletzt bearbeiteten Wert bevorzugen – und immer einen Undo-Pfad behalten. Ein aggressiver Auto-Merge, der falsch rät, zerstört Daten endgültiger, als Dubletten es je taten.

Wie Dubletten überhaupt entstehen

Drei Fabriken produzieren die meisten Dubletten. Multi-Source-Sync: Dein Handy blendet Google-, iCloud- und SIM-Kontakte zu einer Ansicht zusammen, aber jede Quelle behält ihren eigenen Datensatz – Konto deaktivieren und wieder aktivieren, und die "verschmolzene" Person zerfällt in zwei. Importe ohne Kennung: vCards haben genau dafür die UID-Property, doch die meisten Exporter erzeugen pro Export eine frische UID, sodass ein erneuter Import derselben Datei alles verdoppelt. Und menschliche Eingabe: Du speicherst "Sarah Yoga" im Kurs, ein Jahr später taucht "Sarah Lindqvist" über WhatsApp auf. Weil die Ursachen strukturell sind, ist Deduplizierung wiederkehrende Wartung – kein einmaliges Aufräumen.

Exakte Schlüssel, unscharfe Namen und die Fehltreffer-Falle

Ein vernünftiger Matcher arbeitet in Vertrauensstufen. Stufe eins: identische normalisierte E-Mail oder E.164-Nummer – sicher genug für einen automatischen Vorschlag, mit einer Einschränkung: gemeinsame Festnetznummern und Familien-Mailadressen existieren. Stufe zwei: sehr hohe Namensähnlichkeit plus ein bestätigendes Feld (gleicher Geburtstag, gleiche Organisation). Stufe drei: Namensähnlichkeit allein – hier niemals automatisch verschmelzen. Spitznamen (Bill/William, Sepp/Josef), Transliterationsvarianten (Müller/Mueller), Ehenamen und Junior/Senior-Paare hebeln naive String-Distanz aus. Die Kostenasymmetrie bestimmt das Design: Eine übersehene Dublette ist Unordnung, ein falscher Merge ist stiller Datenverlust in den Datensätzen zweier Menschen.

Ein Dedup-Lauf mit Endearist

Endearist bringt ein Dedup-Tool mit, das genau diese gestufte Logik anwendet: Es normalisiert E-Mails und Telefonnummern, bewertet Namensähnlichkeit und präsentiert Merge-Kandidaten nach Konfidenz gruppiert – du bestätigst jede Zusammenführung, statt einer Blackbox zu vertrauen. Weil Endearist local-first ist, läuft der gesamte Vergleich auf deinem Gerät; dein Adressbuch wird zum Abgleich nie auf einen Server hochgeladen. Feld-Vereinigungen erhalten jede Nummer und Notiz aus beiden Datensätzen, und der Import nutzt dasselbe Matching – ein altes vCard- oder CSV-Export einzuspielen erzeugt Merge-Vorschläge statt stiller Verdopplung.

Zum Ausprobieren

Häufige Fragen

Warum zeigt mein Handy ständig doppelte Kontakte?
Fast immer Multi-Account-Sync. Dein Handy zeigt eine zusammengeführte Ansicht der Kontakte aus Google, iCloud, Exchange, WhatsApp und SIM, aber jedes Konto speichert seine eigene Kopie. Versagt die Verknüpfungsheuristik – Spitzname in der einen Quelle, voller Name in der anderen – siehst du zwei Einträge. Behebe es an der Quelle: ein Hauptkonto für Kontakte wählen, die übrigen exportieren, ins Hauptkonto importieren und dort deduplizieren.
Sollten Dubletten automatisch verschmolzen werden?
Nur auf der höchsten Vertrauensstufe – identische normalisierte E-Mail oder Nummer – und selbst dann mit Undo. Alles, was auf Namensähnlichkeit beruht, braucht menschliche Bestätigung, denn die Fehlerfälle (Eltern und Kind mit gleichem Namen, Kollegen mit gemeinsamer Büronummer, Paare mit einer E-Mail-Adresse) sind häufig, und ein falscher Merge vermischt die Historien zweier Menschen unumkehrbar. Gute Tools schlagen in Masse vor, lassen dich aber pro Paar bestätigen.
Welche Felder eignen sich am sichersten für den Abgleich?
In absteigender Verlässlichkeit: eine geteilte stabile Kennung wie die vCard-UID (in der Praxis selten), normalisierte E-Mail-Adresse, Telefonnummer in E.164-Form, dann Name plus ein bestätigendes Feld wie Geburtstag oder Arbeitgeber. Namen allein sind das schwächste Signal – voller Spitznamen, Schreibvarianten und tatsächlich verschiedener Menschen mit gleichem Namen. Postadressen sind fast nutzlos: Haushalte teilen sie, und die Formatierung variiert wild.

Zuletzt aktualisiert: 2026-06-10

Beziehungen pflegen, nicht verwalten.

Endearist ist ein local-first Personal CRM. Kostenlos bis 25 Kontakte.

Kostenlos starten