Blog

Data tim na Ljetnom akceleratoru 2021. – Naša CROZ priča

By January 18, 2022 March 27th, 2023 No Comments

Nakon burne 2020. došla je ništa manje burna 2021., ali CROZ Ljetni akcelerator još se jednom pokazao kao jedina konstanta u ovim neizvjesnim vremenima. Jednako tako konstantna su i (vrlo) pozitivna iskustva (hrpe) studenata koji u njemu svake godine sudjeluju. Mi koji smo sudjelovali u data praksi nismo iznimka po tom pitanju, a ovo je naša priča.

Prije nego što je počela prava radnja naše priče, postojao je i uvod, a to je bio intervju za praksu. Zašto intervju spada pod casually spomenuti uvod, a ne neki ogroman zaplet? Jer je to točno ono što je i bio – opušten i ugodan razgovor na kojem smo imali priliku pokazati svoje znanje i (još važnije) interese i zanimanja te se upoznati s našim budućim mentorima i onime što ćemo raditi na praksi.

Nakon toga dobili smo mjesto na praksi i tu je naša priča zapravo počela. Svaka dobra priča odgovara na 6 temeljnih pitanja: što, kako, zašto, gdje, kada, tko pa tako i naša.

Što?

Cilj je bio istražiti 3 cloud tehnologije: Amazonov AWS, IBM-ov Cloud Pak i Microsoftov Azure. Na početku smo svi skupa radili na čišćenju podataka i definiranju korisničkih zahtjeva, ali kasnije smo se podijelili u 3 ekipe. Svaka je ekipa istraživala jednu tehnologiju pa smo na kraju prakse uspoređivali dojmove i rezultate kako bismo vidjeli koja je od njih najbolja.

Kao što znamo, o bilo kakvoj novoj tehnologiji najbolje se uči iz prakse, a naša praksa bila je napraviti projekt koji ima 3 cjeline: skladište podataka, vizualizaciju podataka i isprobavanje mogućnosti strojnog učenja za sve 3 cloud tehnologije. Svaki od tih cloudova ima ugrađene alate za rad s tim cjelinama pa nismo morali izmišljati toplu vodu nego smo morali naučiti raditi s tim alatima i nakon toga je sve (više-manje) išlo bez problema.

Svrha projekta bila je analizirati i istražiti kvartove i nekretnine u Zagrebu, napraviti skladište podataka te na kraju vizualizirati sve što smo otkrili. Također smo koristili strojno učenje za predikcije cijena nekretnina u ovisnosti o broju kvadrata i kvartu u kojem se nalaze. Parametri koje smo gledali uključivali su: prosječnu cijenu nekretnina po kvadratu, broj sadržaja (sportskih, zabavnih, kulturnih, itd.), blizina javnog prijevoza, demografska kompozicija kvarta i slično. Bilo je jako zabavno smišljati koje bismo parametre mogli gledati i što bismo htjeli/mogli saznati iz dostupnih podataka. Podaci koje smo koristili uključivali su izvore kao što su: Open Street Map, data.zagreb.hr, Airbnb i Hrvatski zavod za statistiku.

Kako?

Praksa je počela uz male „školice” gdje smo učili stvari poput agilnog razvoja i Gita, ali i naprednog SQL-a i skladišta podataka (koji su naš bread and butter) kako bismo svi imali osnovno znanje u startu. Neke od tih „školica” bile su baš pravi mali tečajevi, dok su neke bili više neformalna druženja gdje bi nam mentori davali primjere dobrih praksi i podijelili iskustva iz svog dugogodišnjeg rada.

Cloud tehnologije (s kojima smo radili većinu vremena) bile su relativno nove za sve nas, što je impliciralo puno kopanja po službenim dokumentacijama, ali i međusobnog pomaganja (rad u ekipi definitivno je puno pomogao da kopanje i istraživanje bude uspješnije i zabavnije). Uvijek smo i mentore mogli pitati za pomoć ako nam je zatrebala. Odnos broja mentora i studenata bio je gotovo 1:1 tako da smo dobili odgovore na sva naša pitanja.

Zašto?

CROZ uvijek radi na napretku (kako svojih zaposlenika, tako i tehnologija koje se koriste), a ove godine je na praksi naglasak bio baš na tome. Htjele su se isprobati tehnologije budućnosti i vidjeti kako je to raditi s njima (jer budimo sigurni da će se u budućnosti sve preseliti na cloud). Kao praktikanti imali smo priliku iz prve ruke učiti o tim najnovijim tehnologijama i koristiti ih u izradi pravog projekta kojim smo se (i mi i mentori) na kraju jako ponosili.

Gdje?

Ove godine se data praksa po prvi put održavala u 2 grada: Zagrebu i Rijeci. To samo pokazuje da nije bitno gdje radite, svugdje ćete imati kolege i mentore i svugdje ćete imati nekoga s kime ćete se moći družiti i koga ćete moći pitati za pomoć ako vam zatreba. I tko zna, možda ćemo sljedeće godine imati praksu u još više gradova (ili možda čak van Hrvatske jer CROZ ima urede u čak 5 država).

Kada?

Praksa je trajala nešto manje od 3 mjeseca, od sredine srpnja do kraja rujna. Iako se na prvu to čini kao puno vremena, vrijeme je zaista brzo prošlo i pred kraj smo se međusobno zapitali je li zaista moguće da je praksa već gotova. Izgleda da vrijeme zaista leti kad se zabavljaš.

Tko?

Za kraj valja upoznati protagoniste koji su temelj svake priče. Ove godine data praksa bila je veća nego ikada (što je odraz rastuće potrebe industrije za data inženjerima i da, ako se želite bavite ovim područjem, sigurno nećete pogriješiti). Na praksi nas je bilo s raznih fakulteta i iz različitih gradova, ali ono što nas povezuje jest ljubav prema radu s podacima i znatiželja za otkrivanjem novoga. A sad je red da upoznamo naše protagoniste…

Započet ćemo s Dinom. Zašto započinjemo s njim? Jer je on bio taj koji je započeo sve online sastanke (naš dežurni icebreaker), tj. probio bi led tako da nitko drugi ne mora. Dok ne započinje sastanke, Dino se priprema za rad s kavom (duplom). Nakon Dine imamo Laru koja se specijalizirala za vizualizaciju podataka. Također smo otkrili da ima skriveni talent za dizajn majica pa smo uz njenu pomoć imali najbolje majice na zadnjem danu prakse. Kako bi Lara imala kompletne i točne podatke za vizualizaciju, pobrinuo se Marin koji je marljivo radio na ETL procesu. Marin je također zagrebačku ekipu upoznao s pićem koje su Riječani ljubomorno čuvali za sebe – pašaretom. Sljedeći nam je Andro. Uz njega atomski satovi postaju stvar prošlosti… Ako trebate namjestiti sat samo pogledajte kada dolazi na posao i kada dođe možete biti sigurni da je točno 9:00. Andro je također na praksi otkrio skriveni talent za vizualizaciju podataka koji je nastavio razvijati i nakon prakse. Nakon Andre dolazi nam Franko – na praksi je bio doktor za poligone, a trenutno je doktor za big data. Također je žustri protivnik „razbijenih prozora”, tj. loših programskih praksi. U ekipi smo imali i Gabrijelu, našu dežurnu statističarku. U slobodno vrijeme jako voli planinariti, a u usporedbi s tim se traženje bugova činilo kao odmor. U ekipi smo također imali i Mister Doriana, našeg stručnjaka za strojno učenje. Pošto nam dobiveni podaci nisu bili dovoljni (jer pravi data inženjeri stalno žele više podataka), on se pomoću „python magije” pobrinuo da ih dobijemo još. Na kraju imamo mene, Roberta, nekoga tko između ostalog jako voli pisati – kako dokumentaciju i korisničke zahtjeve, tako i ovaj osvrt na praksu… I nekoga tko je, ne samo puno naučio, nego se i zabavio na praksi.

To je bila naša CROZ priča. Jedino što je ostalo jest napisati kako završava… A kod nas je to sretno. Svi smo ostali raditi u CROZ-u nakon kraja prakse. Mislim da to dovoljno govori koliko nam je bilo dobro i da ćemo u budućnosti ovdje napisati još puno drugih priča.

Robert Pavliš
Bivši data praktikant, sada zaposlen kao student u CROZ-u