Dokumentacja systemu Deduplikator¶
Deduplikator to system, który rozpoznaje i łączy duplikaty profili klientów powstałe w historii zamówień platformy Rainbow. Ten sam klient pojawia się w wielu zamówieniach — często pod nieco różnymi danymi (literówka, zdrobnienie imienia, inny adres). Deduplikator sprowadza takie rozproszone wpisy do jednego, spójnego profilu.
Mapa dokumentacji¶
| Rozdział | Co znajdziesz |
|---|---|
| Przegląd | Po co jest system, z czego się składa i jak przepływają dane |
| Droga zamówienia | Krok po kroku: co dzieje się z jednym zamówieniem |
| Workery | Cztery etapy przetwarzania — czym się zajmują |
| Algorytmy | Jak system decyduje, czy dwa profile to ta sama osoba |
| Normalizacja | Jak surowe dane z zamówień są porządkowane |
| Integracje | Powiązanie z systemem LDE, blacklista, logowanie |
| Rededuplikacja | Ponowne przetworzenie całej historii zamówień |
| Słowniczek | Wyjaśnienie pojęć używanych w przykładach |
Jak to działa — w skrócie¶
flowchart LR
Zam["Zamówienia\n(Rainbow)"]
Ded["Deduplikator"]
An["Serwer\nanalityczny"]
Zam -->|"dane osób\nz zamówień"| Ded
Ded -->|"ujednolicone,\nzdeduplikowane profile"| An
System obserwuje napływające zamówienia, porządkuje dane każdej osoby, szuka istniejących profili tej samej osoby i scala duplikaty. Gotowy wynik — wraz z informacją, kto złożył zamówienie — trafia na serwer analityczny.
Do czego to służy¶
Dzięki temu, że każde zamówienie jest powiązane z jednym, poprawnie zidentyfikowanym profilem klienta, możliwe jest wiarygodne raportowanie — przede wszystkim powracalności klientów: ilu klientów wraca i jak często.