Słowniczek pojęć¶
Strona wyjaśnia terminy, które pojawiają się w przykładowych scenariuszach w całej dokumentacji. Scenariusze pochodzą z testów systemu, dlatego używają oryginalnych, angielskich nazw — poniższa tabela pozwala je rozszyfrować.
Decyzje dopasowania¶
Porównując dwa profile klientów, Deduplikator podejmuje jedną z trzech decyzji:
| Termin | Znaczenie |
|---|---|
| AutoMerge | Scalenie automatyczne — system jest pewny, że to ta sama osoba, i łączy profile bez udziału człowieka. |
| AutoMergeWithReview | Scalenie z weryfikacją — system łączy profile, ale dodatkowo oznacza parę do sprawdzenia przez operatora. |
| Different | Różne osoby — system uznaje, że to dwie różne osoby, i nie łączy profili. |
Poziomy pewności¶
Każda decyzja ma przypisany poziom pewności:
| Termin | Znaczenie |
|---|---|
| Certain | Pewność absolutna — np. ten sam identyfikator z systemu lojalnościowego. |
| High | Wysoka pewność — profile scalane automatycznie. |
| Medium | Średnia pewność — scalenie trafia do weryfikacji operatora. |
| Low / None | Brak wystarczających podstaw do scalenia. |
Poziomy zgodności pojedynczego pola¶
Każde porównywane pole (imię, nazwisko, e-mail itd.) otrzymuje ocenę:
| Termin | Znaczenie |
|---|---|
| Perfect | Wartości identyczne. |
| WithTypo | Drobna literówka — prawdopodobnie ta sama wartość. |
| NoMatch | Wartości wyraźnie różne. |
| NotPresent | Brak danych w jednym lub obu profilach. |
Nazwy pól w scenariuszach¶
| Nazwa w scenariuszu | Pole |
|---|---|
| FirstName | Imię |
| LastName | Nazwisko |
| BirthDate | Data urodzenia |
| Gender | Płeć |
| Adres e-mail | |
| Phone | Numer telefonu |
| Street | Ulica |
| HouseNumber | Numer domu |
| ApartmentNumber | Numer mieszkania |
| City | Miasto |
| PostalCode | Kod pocztowy |
| MatchDetails | Zestaw ocen porównania poszczególnych pól |
Etapy przetwarzania¶
| Etap | Rola |
|---|---|
| Scanner | Obserwuje źródło zamówień i przekazuje dane osób dalej. |
| Stage1 | Porządkuje (normalizuje) dane osoby i zakłada lub aktualizuje profil klienta. |
| Stage2 | Szuka duplikatów i scala profile tej samej osoby. |
| AnalyticsSync | Zapisuje gotowe wyniki na serwerze analitycznym. |