Przejdź do treści

Dokumentacja systemu Deduplikator

Deduplikator to system, który rozpoznaje i łączy duplikaty profili klientów powstałe w historii zamówień platformy Rainbow. Ten sam klient pojawia się w wielu zamówieniach — często pod nieco różnymi danymi (literówka, zdrobnienie imienia, inny adres). Deduplikator sprowadza takie rozproszone wpisy do jednego, spójnego profilu.

Mapa dokumentacji

Rozdział Co znajdziesz
Przegląd Po co jest system, z czego się składa i jak przepływają dane
Droga zamówienia Krok po kroku: co dzieje się z jednym zamówieniem
Workery Cztery etapy przetwarzania — czym się zajmują
Algorytmy Jak system decyduje, czy dwa profile to ta sama osoba
Normalizacja Jak surowe dane z zamówień są porządkowane
Integracje Powiązanie z systemem LDE, blacklista, logowanie
Rededuplikacja Ponowne przetworzenie całej historii zamówień
Słowniczek Wyjaśnienie pojęć używanych w przykładach

Jak to działa — w skrócie

flowchart LR
    Zam["Zamówienia\n(Rainbow)"]
    Ded["Deduplikator"]
    An["Serwer\nanalityczny"]

    Zam -->|"dane osób\nz zamówień"| Ded
    Ded -->|"ujednolicone,\nzdeduplikowane profile"| An

System obserwuje napływające zamówienia, porządkuje dane każdej osoby, szuka istniejących profili tej samej osoby i scala duplikaty. Gotowy wynik — wraz z informacją, kto złożył zamówienie — trafia na serwer analityczny.

Do czego to służy

Dzięki temu, że każde zamówienie jest powiązane z jednym, poprawnie zidentyfikowanym profilem klienta, możliwe jest wiarygodne raportowanie — przede wszystkim powracalności klientów: ilu klientów wraca i jak często.