Lepší data, lepší byznys: V jakém stavu je vaše firemní „rodinné stříbro“?

V konkurenčním prostředí firmy bojují o své zákazníky. Nové zbraně do tohoto boje přinášejí rostoucí možnosti počítačových technologií. Jednou z nich je maximální využití zákaznických údajů, které se vyskytují v podnikových systémech.

Lepší data, lepší byznys: V jakém stavu je vaše firemní „rodinné stříbro“?


Tato data – právem někdy označovaná jako „rodinné stříbro“ firem – jsou však často ve špatném stavu a takové využití neumožňují. „Rodinné stříbro“ může být trochu zašlé časem, ale existují možnosti, jak je oprášit a vyčistit do původního lesku.

Sjednocení zákaznických dat má využití v mnoha oblastech. Například:

  • Marketing: Zlepšení komunikace se zákazníkem – posílat dopisy na správné adresy, oslovovat zákazníka pouze jednou, lépe zacílit marketingové kampaně, segmentovat klienty.
  • Obchod: Nabídnout tomu správnému zákazníkovi ten správný produkt. Mít na jednom místě informace ze všech systémů, znát profitabilitu a významnost zákazníka.
  • Oddělení péče o zákazníky: Okamžitý komplexní pohled na zákazníka, znalost všech jeho produktů, znalost historie komunikace.
  • Řízení rizik: Stanovení kreditního rizika vyžaduje kompletní pohled na zákaznickou historii, tzn. především identifikace zákazníka. Často jde o požadavky v reálném čase, kdy na výsledku záleží další postup, např. schválení nebo poskytnutí spotřebního úvěru.
  • Regulatorní reporting: Určení přesného počtu klientů daného typu, identifikace vazeb mezi subjekty pro určení rizik.

Ve velkých firmách jsou systémy vybudovány jako produktové. Takové systémy dobře podporují prodej a správu konkrétního produktu (např. hypotéčního úvěru, životního pojištění), ale chápou zákazníka pouze ve vlastním kontextu.

Pro mnoho úloh je však třeba pracovat se zákaznickými daty v kontextu celé firmy, případně celého holdingu. Nejde o nic nového. Velký boom CRM řešení (na přelomu tisíciletí) souvisí právě s touto změnou paradigmatu od organizace zaměřené na produkty k podniku zaměřenému na zákazníka.

V různých systémech jsou však zákaznická data uložena různě. Organizace sice fungují bezproblémově – pojistná nebo hypotéční smlouva obsahuje všechny potřebné náležitosti, které má mít – problém však nastává v okamžiku, kdy se zadaná data mají spojit s daty v jiném systému.

V následujícím příkladu jsou záznamy o jedné fyzické osobě. Každý pochází z jiného systému, jsou seřazeny podle poslední aktualizace (příklad č. 1).

 

 

příklad č. 1

 

Jméno

 

Příjmení

 

r.č.

 

dat. nar.

 

adresa

 

Petra

 

Málková

 

7152132845

 

13.2.1971

 

Praha - Kamýk, Smotlachova 3

 

Petra

 

Málková

 

r.č. 7152132845

 

13.3.1971

 

Smotlachova 939/3, 142 00 Praha 4 – Kamýk

 

Petra

 

Máková, Ing.

 

 

13.2.1971

 

Smotlachova 3, 140 00 Praha 4

 

 

Ing. Petra Nováková

 

7152132845

 

 

Smotlachova 939, 142 00 Praha 4

 

Petra

 

Ing. Nováková

 

715213/2845

 

13.2.1971

 

Křižíkova 65/55, 186 00 Praha 8

 

 

Každý záznam vypadá jinak. Petra Málková vystudovala vysokou školu (získala titul Ing.), vdala se a přestěhovala z Prahy 4 na Prahu 8. Odlišnost záznamů je způsobena jednak jejich časovou rozdílností, jednak způsobem uložení dat v jednotlivých systémech. Např. systém 4 má pro jméno pouze jedno pole, do kterého je uloženo jméno, příjmení i akademické tituly. V datech jsou chyby – druhý záznam má špatně datum narození, ve třetím záznamu je překlep v příjmení (Máková místo Málková).

Dobrá adresa

V  příkladu je čtyřikrát uvedena stejná adresa. V každém záznamu je však napsaná jinak. Jakým způsobem zjistit, že se jedná o jednu adresu? Otázka je to důležitá, protože podle odpovědi budeme usuzovat, jde-li o jednu osobu nebo ne.

Ideální by bylo mít nějaký jednoznačný seznam (registr) všech adres a místo textového zápisu jednotlivých adresních komponent (ulice, číslo popisné, číslo orientační atd.) mít v systémech uložený odkaz na záznam v registru.

Dostáváme se tak ke konceptu „master dat“. Kdybychom měli číselník všech adres a všech klientů, pak bychom mohli v našich produktově orientovaných systémech používat odkazy na tento číselník a problém s nekonzistencí dat by úplně odpadl.

V České republice existuje centrální registr adresních bodů (UIR-ADR) spravovaný Ministerstvem práce a sociálních věcí a aktualizovaný týdně. UIR-ADR identifikuje adresní bod, kterým je „vchod do domu“. Registr je dostupný veřejně, nicméně automatická identifikace vzhledem k tomuto registru není snadná. Jednu a tutéž adresu lze napsat mnoha různými způsoby. Kromě přejmenovávání ulic a rušení pošt komplikují identifikaci další věci: zaměnitelnosti čísla popisného s orientačním a obce s částí obce. Komplikací je i používání zkratek (Benešov n. Plouč., Nábř. kpt. Jaroše), ale i samotné názvy ulic nebo obcí.

Pane, vy jste vdova!

Identifikaci adresy vůči registru adres lze provést automatizovaně, avšak ne ve všech případech. Chceme-li zamezit všem chybně identifikovaným nebo nerozhodnutelným případům, musíme zvolit konzervativní přístup a adresu předat k ručnímu vyčištění nebo doplnění. V případě adres je takovou adresou například Křižíkova 55, 186 00 Praha 8. V Křižíkově ulici jsou dva domy s číslem 55. Jednou jde o číslo popisné, jednou o číslo orientační. Automatická identifikace by v takovém případě měla adresu označit jako nejednoznačnou a nechat uživatele, aby adresní bod určit manuálně, resp. doplnil chybějící komponentu.

Podobné riziko může představovat automatická oprava a doplňování atributů osob, ať již fyzických nebo právnických. Často nelze jednoznačně určit typ osoby (fyzická, právnická), a musí se proto vycházet z kombinace jiných atributů. Je-li vyplněno IČO, pak asi půjde o právnickou osobu, je-li vyplněno rodné číslo, pak asi o osobu fyzickou.

Čistá data  – půl zdraví

Vyčištěná data představují půlku řešení, druhou polovinou je aplikace pravidel, která rozhodují o tom, že záznamy odpovídají téže fyzické nebo právnické osobě. Tato pravidla by měla respektovat rovněž konzervativní přístup, tedy nikdy (automaticky) nesloučit dva záznamy, které by mohly odpovídat dvěma různým lidem.

V námi dodávaných systémech se vychází z požadavku, že shoda silného identifikátoru (rodné číslo) musí být doplněna shodou ve jménu. Toleranci k chybě ve jménu je třeba kompenzovat shodou v jiném slabším atributu (např. datum narození, číslo občanského průkazu, telefon, mail). Chybějící (nebo nepoužitelný) silný identifikátor lze nahradit shodou v dalších dvou slabých atributech.

Firewall datové kvality

Ideálním stavem by bylo špatná data vůbec do systému nevpustit. Firewally v počítačových systémech omezují komunikaci mezi vnějším světem a vnitřní počítačovou sítí tak, aby dovnitř nemohlo proniknout nic zlého.

Podobně například DQ firewall (řešení využívající Ataccama DQC) zajišťuje, aby data byla vkládána do systému správně. Například když uživatel vloží adresu Křižíkova 55, Praha 8, DQ firewall se uživatele dotáže, kterou ze dvou možných adres má na mysli, a požádá jej o doplnění chybějící komponenty. Současně s tím do systému vloží i číslo adresního bodu, které umožní aktualizovat adresu v případě změny některé z jejích komponent v registru adres. Řešení využívající například DQ firewallu společně s řešením centrální údržby master dat tak představuje významnou pomoc pro obchodní procesy. S lepšími daty se dělá lepší byznys.

Komentáře