Přihlásit se

SPECIÁL DATA

Máme kvanta dat, ale málo je využíváme

David Slánský z KPMG o tom, co všechno o nás firmy vědí

Jan Hrdlička

Jak moc data ovlivňují životy běžných lidí? Jsme skutečně tak dobře zmapovaní? A proč nestačí data pouze mít? Na tyto a další otázky odpovídá David Slánský z KPMG.

Na Slovensku proběhly parlamentní volby a nechvalně se tam proslavil exit poll, který neodhadl, jak lidé ve skutečnosti volili. Jakou roli v tom hrála data?

Jakákoli analytika je založena na datech. A když nemáte kvalitní data, je výstup logicky nepřesný, ba až pokřivený. Ten poll je příklad toho, kdy máte typickou analytiku založenou na manuálním sběru dat a na jejich základě se udělal závěr. Jenže volič neřekl pravdu, což není neobvyklé. Jiný příklad je z dob začátků mobilních operátorů, kdy nabízeli kredit výměnou za osobní údaje. Najednou se ukázalo, že na Václavském náměstí žije asi tisíc Mickey Mousů. Je to ukázka toho, že jakákoli analytika závisí na datech a ta byla, jsou a budou nekvalitní. Otázka je jen, do jaké míry a co to způsobuje.

Jak rychle využití dat postupuje a jak moc je žádoucí? V mnohých oborech ještě před pár lety nevěděli, o co jde.

Není to revoluce, spíš evoluce. Samozřejmě jsou tu datoví misionáři, ale já v tom žiji téměř 30 let a mám pocit, že se toho příliš nezměnilo. Nebo jinak: Data a analytika pronikají do čím dál většího množství různých povolání, ale to tempo je víceméně stejné. Datová analytika je stará minimálně 500 let. Na přednáškách mluvím o Jacobu Fuggerovi, německém obchodníkovi a bankéři. Traduje se, že je to historicky nejbohatší člověk všech dob. Svůj úspěch založil na informacích – měl síť lidí, kteří mu posílali zprávy z byznysu, a on na základě toho rozhodoval a úspěšně podnikal.

Data pronikají třeba i do sportu, řídí se podle nich i fotbalové kluby při nákupu hráčů. Existuje nějaké minimum, na kterém se jako společnost shodneme? Kde data potřebujeme a kde už jsou zbytečná?

Nemyslím si. Pokud jako společnost hledáme minimum pro to, abychom ve své činnosti používali data, je ono minimum na jedné straně dáno existencí těchto dat a na druhé straně naší schopností tato data smysluplně využít. Nestačí data pouze mít, ostatně podle jednoho průzkumu je 75 procent světových dat nevyužito.

Jak moc data ovlivňují životy běžných lidí? Jsme skutečně tak dobře zmapovaní?

Extrémně. Zanecháváme za sebou obrovskou datovou stopu. Personalizovanou i anonymizovanou, s níž toho moc neuděláme. Příklad anonymizovaných dat s přidanou hodnotou je kriminalita v daném místě. Pokud chcete otevřít nějakou pobočku restaurace či banky, zajímá vás, jestli se tam pohybují lidé. Pokud nemáte přímo údaje o pohybu, můžete se podívat na veřejně dostupná data o lokální kriminalitě. Vysoká drobná kriminalita jako kapesní krádeže bude znamenat relativně velký pohyb lidí. Samozřejmě to není jediný faktor, ale je to příklad datové stopy, kterou lze vytěžit.

Funguje to podobně i u běžných zákazníků?

Jednoznačně. Češi jsou velmi aktivní sběratelé věrnostních kartiček. Hlavní důvod, proč nám je firmy nabízejí, je mít přehled o tom, co nakupujeme, a na základě toho personalizovat nabídku. Zrovna tady vidíme, že tato data krásně sbírat umíme, s jejich využitím je to ale horší – většina programů založených na věrnostních kartách nedosahuje plánovaných výsledků. Přitom by často místo sofistikované vědy stačila primitivní datová logika, která sleduje postup v životě klienta. Když si klient koupil odrážedlo pro dvouleté dítě, dává smysl mu po několika letech nabídnout dětské jízdní kolo. Ale kolikrát se vám to v životě stalo? Firmy, které toto pochopily, jsou v této oblasti úspěšné. Jiný příklad byznysového využití dat je prodej analytických výsledků dalším společnostem – například evidence návštěvnosti jednotlivých oblastí Šumavy, podpora výzkumů farmaceutických firem anonymizovanými daty nebo monetizované digitální služby klasických odvětví, jako je třeba automobilismus, kdy Tesla nabízí třeba možnost vyhřívání sedaček za úplatu.

Není to vlastně úplně bláznivé? V jakém světě to žijeme a jak moc ho data řídí?

Když data správně použijeme, může nám to pomoci. Nevadí mi, kolik toho o mně firmy vědí, naopak. Pokud mi nabídnou zajímavý produkt, který ve své životní situaci potřebuji, jen mi to ušetří čas. Ale asi je to dnes docela nepopulární názor. Data nicméně objektivně pomáhají. V Británii vznikla studie, podle níž má student, který nedostuduje vysokou školu, výrazně vyšší šanci, že nedostane tak dobrou práci, že sklouzne k drogám nebo kriminalitě. Potom se pro společnost stává zátěží. Takže v momentě, kdy škola díky datům ví, kolik lidí dostuduje a komu pomoci studium dokončit v době, kdy se dostane do nějakých těžkostí, jsou data k nezaplacení.

Jsou Češi konzervativní v tom, jak moc jsou ochotni sdílet data o sobě?

Je to spíš sociodemografický než národnostní problém. Vysoce i středně příjmové skupiny mají tendenci celkem zdravého kritického myšlení a v okamžiku, kdy tam tato schopnost je, tak myslím, že ochota využívat pokročilejší řešení je vyšší.

Často se říká, že soukromý sektor je v těchto záležitostech napřed. Jak zvládá práci s daty český stát?

Mohl by na tom být lépe, ale mám radost i z maličkostí. Například základní registry mně jako občanovi velmi zjednodušují život. Zmizela mi třeba povinnost chodit na poštu, takže to vnímám jako pohyb správným směrem. Mohli bychom jít rychleji, nicméně nechci nás srovnávat s Estonskem. To je úplně jiná situace.

Jak moc začala data ovlivňovat umělá inteligence?

Data jako taková tolik neovlivňuje. Upřímně řečeno, dnes je moderním termínem umělá inteligence, dřív to byla data science, předtím data mining a 40 let zpátky statistika. A přitom je to vše dost podobné, respektive jedna vývojová větev. Jsme opět u schopnosti společnosti data a analytiku využít. Dost často neumíme nebo nechceme využít jednodušší produkty. Nemyslím si, že nás AI sama zcela nahradí. Určitě nahradí činnosti, které jsou zbytečné, ale o tom přesně datová analytika je. Vlastně už dnes nepíšu nic, co bych nekonzultoval s AI. A určitě lidé používající AI nahradí ty, které ji používat nebudou. Už dnes lidé používající jednodušší formy datové analytiky nahrazují ty, kteří nejsou schopni ani toho.

Může to něco zásadnějšího udělat s pracovním trhem?

Připravujeme studenty na profese, které ještě neexistují. Nejžádanější práce dneška ještě před pár lety neexistovaly. Trh se mění a bude třeba i nějaké míry datové gramotnosti. Dosud se zdůrazňovala hlavně finanční gramotnost, ale budou třeba i další schopnosti, jako je právě práce s daty.

Co etický aspekt celé věci?

Z mého pohledu je vlastně nejdůležitější. Svoji kariéru jsem začínal programováním různých datových řešení, která analyzovala všechno možné, nicméně firmy časem zjistily, že je tam etická hranice, což je dobře. Nechcete sledovat něco, co nemáte, takže GDPR podle mě byl správný nápad. Bohužel trochu těžkopádný v realizaci, ale svoji úlohu plní.

Jak hodnotíte nakládání s daty v koronavirové pandemii?

Kdyby náš stát byl datově gramotnější a nehrál v té době prim populismus, mohla být úmrtnost výrazně nižší. Výhodou dat je, že vám dají pohled očištěný od emoce. V okamžiku, kdy se rozhoduji na základě nějakého svého okamžitého pocitu, vnáší se obrovské riziko chyby. Podle mého tehdejší vláda selhala, protože šla po populistických rozhodnutích na základě emocí a objektivně tam chyběla důkladná práce s daty.

Mělo se stát něco konkrétního, co by té katastrofě zabránilo?

Byly týmy, které naprosto přesně věděly, kolik v kterém místě máme nemocných, respektive pozitivních testů, navíc mohly pracovat i s externími daty, například z mobilů. Kdyby se o svá data podělily s ostatními zapojenými orgány, mohli jsme vidět, jak se nám co šíří, a podle toho cíleněji směřovat pomoc. Nemocnice mohly být připravenější, kdyby se data víc sdílela.

KMPG už několik let spolupořádá v Praze Data Festival. Jaký má účel?

Data jsou obrovské bohatství, obrovský potenciál, ale i riziko. Je to vždycky náš pomocník, nikoli pán. Zamysleme se nad tím, jak je využít, ale současně jejich využití kontrolujme. A právě sdílení znalostí o datech a analytice mezi odborníky a laiky, stejně jako jasná komunikace problémů a otevřená diskuse, je cílem tohoto festivalu. Jsme rádi, že u něj můžeme být jako titulární partner a ukazovat, co vedlo k úspěchu našich klientů v oblasti datové analytiky. Hlavní ingrediencí úspěchu je uvědomění si hodnoty i rizika datové analytiky a správné zkombinování práce člověka a stroje.