REstart Program
DE Model

Data-driven? Yes, please!

Ludwik Krakowiak
21-05-24 10:56

Budowanie strategii firmy w oparciu o dane nigdy nie było tak proste jak dziś. Technologia osiągnęła taki poziom, że wiele rzeczy po prostu się da – przekonuje Marcin Żukowski, współzałożyciel firmy Snowflake.

Marcin Żukowski, SnowflakeSnowflake to założony w 2012 w kalifornijskim San Mateo producent chmurowych rozwiązań do przetwarzania danych. Platforma Snowflake, będąca początkowo hurtownią danych świadczoną w modelu usługowym, z biegiem czasu obrastała w dodatkowe funkcjonalności, m.in. z takich obszarów jak data engineering i data science. Obecnie przetwarza ok. 1 mld zapytań dziennie.

Atrybutem Snowflake’a jest Data Cloud, globalna platforma wymiany danych między organizacjami użytkującymi narzędzie. Umożliwia firmom udostępnianie danych w ekosystemie partnerów oraz dostęp do danych pochodzących ze źródeł zewnętrznych.

Spółka w 2020 z przytupem zadebiutowała na Wall Street. Prawie 3,4 mld dolarów wpływów w ramach pierwszej oferty publicznej, przeprowadzonej w połowie września ub. roku, to najlepsze IPO spółki produkującej oprogramowanie w historii notowań na nowojorskim parkiecie. Snowflake zatrudnia dziś ponad 2000 osób a z jej rozwiązania korzysta ponad 3500 przedsiębiorstw.

Co z tym data-driven

Organizacje, które chcą podejmować świadome decyzje biznesowe w oparciu o posiadane zasoby danych, mierzą się z kilkoma wyzwaniami – mówił Marcin Żukowski, gość specjalny czwartego tegorocznego spotkania społeczności CIONET Polska, „Being Data Driven”.

Przede wszystkim, znacząco wzrosła ilość wytwarzanych dziś danych – w dodatku generują je nie tylko użytkownicy, ale i urządzenia; jest też coraz więcej danych nieustrukturyzowanych. Powiększył się katalog źródeł danych – do, w przeszłości nielicznych, źródeł wewnętrznych, takich jak firmowe systemy informatyczne, dołączyły źródła zewnętrzne: partnerzy, dostawcy technologii, klienci, konkurenci, domena publiczna… Takiej ilości danych nie możemy lub nie jesteśmy w stanie skopiować i przechowywać. To sprawia, że hurtownie danych stają się ważniejsze niż kiedykolwiek.

Jednocześnie dostępu do tych danych oczekuje coraz więcej użytkowników, a sam dostęp wymagany jest w czasie rzeczywistym. Użytkownicy od zawsze oczekiwali jak najszybszego dostępu do danych.

Dziś ma to tym większe znaczenie, że decyzje biznesowe podejmowane są nie na danych sprzed kilku dni, tylko sprzed chwili. Iteracyjna obróbka danych wymaga szybkiego przetwarzania – podkreślał Żukowski.

Pomoc w chmurze

Odpowiedzią na ten problemy jest chmura: opłacalny i elastyczny system przechowywania. Rozwój technologii sprawił, że powstało wiele doskonałych narzędzi, zwłaszcza z zakresu analityki i Business Intelligence. W dziedzinie systemów bazodanowych w ostatnich latach nastąpiła prawdziwa rewolucja – narzędzia te oferują znacznie wyższą wydajność przetwarzania zapytań, w dodatku mogą pracować na danych różnych typów. Dzięki temu użytkowanie i przetwarzanie danych stało się dużo łatwiejsze.

Elastyczność chmury sprawia, że nowoczesne systemy zarządzania danymi (chmurowe hurtownie, takie jak Snowflake, ale i usługi data querying) są w stanie wspierać dowolną ilość użytkowników. Ci zaś nie dość, że mają dostęp do tych samych danych, to pracując na nich niezależnie nie przeszkadzają sobie, co nie było takie oczywiste w środowiskach on-premise – wskazuje Żukowski.

Na podstawie danych możemy rozpoznawać i rozwiązywać problemy, o których nawet jeszcze nie wiemy, że istnieją. Skuteczna analityka wymaga jednak przechowywania wszystkich danych, gdyż powinno się ją prowadzić na dwóch różnych poziomach – wyszukiwania hot spotów („trendów”) w dużych zbiorach danych oraz pojedynczych zapytań i zdarzeń.

Bogatsi w wiedzę analityczną, możemy w następstwie projektować rozwiązania naprawcze a nawet, dzięki specjalnym metrykom, oceniać ich potencjalną skuteczność przed implementacją – mówi przedstawiciel Snowflake’a.

Czy polskie firmy są gotowe na bycie data-driven?

Tomasz Mazurek, dyrektor sprzedaży w Snowflake na Europę Wschodnią: Bycie data-driven to umiejętność podejmowania decyzji biznesowych na bazie danych, a nie założeń i przypuszczeń. Ale czy firmy mają wystarczająco dużo danych by takie decyzje podejmować?  

Przez lata wyzwaniem było zbieranie danych z różnych miejsc i konsolidowanie ich, by stanowiły centralne źródło informacji i stanowiły podstawę do podejmowania decyzji. Tego problemu już nie ma, ale pojawił się nowy – wykorzystanie tych dane w taki sposób, by biznes mógł uzyskać z nich dodatkową wartość.  

Wydaje mi się, że jesteśmy pod tym względem bardziej zaawansowani, niż jeszcze kilka lat temu. Jednak patrząc na kierunek jaki wyznaczają Europa Zachodnia i przede wszystkim Stany Zjednoczone, widzimy jak wiele jest jeszcze do zrobienia. Firmy, zwłaszcza duże, stoją przed wyzwaniem polegającym na migracji z ekosystemów, w których działały przez wiele lat. Jeżeli tego nie zrobią, nadal będą pracować w silosach, na poszatkowanych danych. 

Istotną kwestią, która wpływa na gotowość do bycia data-driven, jest dostęp do chmury publicznej. Ten jest w Polsce nadal dużo niższy niż w państwach rozwiniętych, a adaptacja chmury przebiega wolniej, niż byśmy tego chcieli. Coraz większe zaangażowanie w lokalny rynek dostawców chmury publicznej (Microsoft Azure, Google Cloud Platform, AWS) znacząco poprawi sytuację. Musimy zdawać sobie sprawę, że wszyscy dostawcy rozwiązań chmurowych – zarówno operatorzy chmury publicznej, jak i producenci bazujących na niej rozwiązań PaaS i SaaS, w tym Snowflake – grają do jednej bramki. Dzięki naszym działaniom zwiększa się świadomość klientów.

Tutaj daj znać, jeśli chcesz otrzymywać od nas informacje o nowych inicjatywach