Praca data scientist od kuchni

Praca data scientist

od kuchni

029

⏰

01:06:32

Naszą gościnią jest Sylwana Kaźmierska – data scientist z ponad 5-letnim stażem, która na co dzień pracuje w łódzkiej firmie Digica. Kulisami swej pracy dzieli się na swoim instagramie programistka_ai. Lubi memy, dane i programowanie neurolingwistyczne.

Posłuchaj odcinka

👂

Posłuchaj

‍

🍿

Obejrzyj

✏️

Notatki do odcinka

📔 Książki:

„Kwantechizm 2.0, czyli klatka na ludzi” Andrzej Dragan

🔗 Linki:

Instagram Sylwany - @programistka_ai
Baza danych Kaggle

👤 Osoby:

Rafał Jańczyk

💻 Firmy:

T-Mobile
Lego
Tomtom
National Health Service
Digica - firma, w której pracuje Sylwana

🧠 Pojęcia:

Fizyka kwantowa
Data Science
Sieć neuronowa
Use case
Próbki danych
Ekonometria
Dane
Edukacja dwustronna
Odwrócona funkcja celu
Przewidywanie inwazji szczurów
NLP (Natural Language Processing)

💡 Wskazówki i rady:

Jak wygląda praca Data Science?
Przygotowanie branżowe (z branż klientów)
Jakiego rodzaju dane dostają od klientów?
Ścieżka edukacji Data Science
Szukanie wzorców
Rozwój wewnątrz organizacji
Rola w zespole na przestrzeni lat
Rozwój organizacji
Założenie firmy i jej początki
Zarządzaniem projektem w Data Science
Najciekawsze wyzwania w data science: generowanie fake newsów, zastępowanie prostych zawodów AI
Data Science, a AI
Uczenie maszynowe zawiera się w analizie danych
Dzienny rozwój AI
Czy algorytmy są uprzedzone i dlaczego?
Cyberbezpieczeństwo w Data Science
Projekty w data science
Kompleksowe projekty
Tworzenie aplikacji

🔧 Narzędzia:

ChatGPT
Midjourney
Python
NumPy
Pandas
Matplotlib
SciPy
PyTorch

📝

Transkrypcja

Paulina:
Cześć, tu Paulina Kacprzak!

Aga:
I Aga Naplocha. W podcaście Design Practice rozmawiamy o praktycznych stronach pracy na styku technologii i designu, zarówno od strony projektowania, jak i zarządzania.

Paulina:
W tym odcinku porozmawiamy o tym, czym jest data science i uczenie maszynowe, jaki związek mają szczury, pomidory i sieci neuronowe, jak wygląda praca osób zajmujących się data science i jakie są wyzwania, ciekawostki i zagrożenia w tym obszarze.

Aga:
Naszą gościnią jest Sylwana Kaźmierska - data scientist z ponad 5-letnim stażem, która na co dzień pracuje w łódzkiej firmie Digica. Kulisami swej pracy dzieli się na swoim instagramie @programistka_ai. Lubi memy, dane i programowanie neurolingwistyczne. Notatki i linki wymienione w tym odcinku znajdziecie na stronie: designpractice.pl/029.

Aga:
Cześć Sylwana!

Paulina:
Hej Sylwana!

Sylwana:
Hej, hej! Cześć dziewczyny!

Paulina:
Na początek zadamy Ci pytanie, które zadajemy wszystkim naszym gościom. Jesteśmy bardzo ciekawe, jaką książkę ostatnio przeczytałaś?

Sylwana:
Słuchajcie, czytałam ostatnio „Kwantechizm” Andrzeja Dragana bodajże. Nie wiem, czy kojarzycie tego ziomeczka od fizyki kwantowej?

Aga:
Tak, tak, kojarzymy.

Sylwana:
W ogóle jestem bardzo ostatnio podjarana fizyką i jak czytam o tych rzeczach, to nie wiem, czuje jakąś taką magię za tym. Chociaż wiem, że to jest jakby turbo naukowe. To jest najbardziej naukowe ze wszystkiego co się da w tym momencie, ale to w jaki sposób tłumaczy rzeczy, to naprawdę jest... to jest to, co ja np. chcę robić ze swoją dziedziną osobiście, nie? Żeby to było zjadliwe, żeby to się czytało w moment, bo ja tą książkę przeczytałam w niecałe dwa dni.

Aga:
Wow!

Sylwana:
Polecam. Bardzo taka lekka, a jednocześnie na temat gruby, więc to nie jest takie spotykane, żeby ta dwa przymiotniki się łączyły w jednym zdaniu.

Aga:
Czyli osoby, które nie mają styku z fizyką kwantową albo podchodzą trochę do niej jak do jeża, poradzą sobie z tą lekturą?

Sylwana:
Myślę, że tak, a jak nie, to w ostateczności zostaną z jakimiś 50 śmiesznymi anegdotami autora, więc też nie stracą czasu.

Data science, sieć neuronowa - co to jest?

Aga:
Fajnie, fajnie. Zapisujemy na listę. Słuchaj, dzięki Sylwana za rekomendację książkową. Zgromadziłyśmy się dzisiaj tutaj, żeby porozmawiać na bardzo poważne tematy. Hahaha! No właśnie Sylwana, Ty się zajmujesz data science i bardzo jestem ciekawa, jak Ty tłumaczysz swojej babci, co Ty robisz w życiu zawodowym?

Sylwana:
Właśnie zastanawiałam się nad tym ostatnio i analogie, które mi wpadły do głowy są takie typowo babciowo-dziadkowe i to jak tłumaczę, jakbym wytłumaczyła w tym momencie babci, to tak najpierw powiem taką bardzo wysoko-poziomową rzecz, a później jakby ktoś dopytał: „No dobra, ale jak konkretnie to się dzieje?”, to później powiem drugą rzecz, ale ta druga nadal będzie zjadliwa, obiecuję. Więc tak, to pierwsze, no to tak wysoko-poziomowo. Jeśli byśmy sobie wyobrazili, że kupujemy pomidory, nie? Idziemy do sklepu i są te pomidory, jest jakaś cena, one jakoś wyglądają. No to prawdopodobnie mamy już jakieś pojęcie na temat tego, ile powinny kosztować mniej więcej, jak powinny wyglądać, jaki powinny mieć kolor. No a ta wiedza nie wzięła się znikąd. Wzięła się stąd, że kiedyś już setki razy szliśmy do sklepu albo widzieliśmy gdziekolwiek, jak ktoś kupował te pomidory, widzieliśmy te ceny, obyliśmy się z tym i każdy ten moment, kiedy byliśmy w sklepie, to był taki mały data point, który gdzieś tam się schował, odchował w tym mózgu. My trochę nie mamy świadomości tego, ale to gdzieś tam jest ta wiedza, nie? Taka cicha wiedza nieuświadomiona. I z biegiem czasu im dłużej żyjemy, tym bardziej już nam się w głowie układają zasady, że jeśli jest zima, to te pomidory mogą być trochę droższe albo trochę mniej smaczne. Kraj pochodzenia pewnie gdzieś tam ma znaczenie, np. jeśli są z Polski, no to coś tam, latem, no to warto kupić na przykład, nie? I tak naprawdę to co ja robię w pracy, to mam te data pointy wszystkie, ileś tam ich, na tyle dużo, że liczę, że to już sprawi, że pozwoli to zgeneralizować tą wiedzę, czyli też gdzieś tam te zgeneralizowane zasady sobie wymyślić co do właśnie kraju pochodzenia, co do pory roku, co do wyglądu i tak jak nasz mózg już ma tą zgeneralizowaną wiedzę na koniec, tak liczymy, że sieć ta neuronowa, sztuczna, która pozna te informacje, troszkę tak się zachowa jak mózg, czyli też na tyle dużo tych informacji zdobędzie, że będzie potrafiła sobie z zgeneralizować tą wiedzę, jakieś takie generalne zasady poznać bez zupełnie naszego udziału. Nasz udział się skończy w momencie kiedy tam wepchniemy te dane, a na koniec dostaniemy wyniki bez tego całego naszego procesu uczenia. Ten proces uczenia przejdzie gdzieś tam właśnie w tych sieciach, tak? Więc możemy zapytać: „No okej, ale po co to w sumie sieć ma robić, skoro my możemy?”, no po to, że czasami tych danych jest o wiele, wiele więcej na przykład. Czyli to są jakieś dane finansowe, biznesowe, takie, że jest ich tak dużo, że nasz mózg już nie ogarnia tego, a sieć np. jeszcze mogłaby. Albo chcemy coś zautomatyzować. To jest trochę temat teraz na czasie, gdzie AI zabiera nam pracę, bo sieć neuronowa będzie tańsza, będzie zawsze dostępna. Więc to jest taki wysoko-poziomowy. Jak tam? Jak tam u Was? Jak się czujecie z tym porównaniem?

📊 O pierwszych krokach w analityce danych dowiesz się z odcinka #7 – Jak zabrać się za analitykę danych.

Aga:
Dobrze, wspaniale. Jeśli chodzi o pomidory, jak powiedziałaś, to pierwsze co „Ooo zimą niedobre, niesmaczne”.

Sylwana:
Widzisz? Hahaha.

Aga:
To jest mój data point. No zdecydowanie hahaha.

Sylwana:
Dokładnie. To jest Twoja świetna generalizacja mózgu, więc tutaj wszystko zadziałało świetnie. A co do teraz tego szczebelka niżej, to tutaj znowu będzie porównanie. Tym razem nie babciowe tylko dziadkowie w sensie tego, jak konkretnie to się liczy. I na to wpadłam wczoraj w nocy, tuż przed zaśnięciem. Bo mój dziadek jest krawcem i jak załóżmy, idę do niego, nie wiem, ze spodniami z lumpeksu i chciałabym je np. zwęzić, no to on mi gdzieś tam zmierzy, później coś tam zrobi, jakąś magię z tym paskiem, nie? O ileś przesunie, ściągnie i zepnie. Ja je przymierzam i wtedy jest jakaś informacja zwrotna do dziadka: „Dziadek, one są teraz za ciasne”, nie? Nie, załóżmy na razie prosty przypadek: „Jest już lepiej, jest lepiej. Są węższe, ale nadal to nie jest to”. No to dziadek, po pierwsze wie co zrobił - zwęził w tym konkretnym miejscu. To trochę tam zadziałało. Zadziałało w dobrym kierunku, bo się poprawiło, ale np. niewystarczająco dobrze, więc musimy powtórzyć tą czynność. I tak do skutku, aż może się okaże się przebije i wtedy wie, że poszedł w dobrym kierunku, ale w złym zwrocie tak jakby. W sensie, że poszedł jakby dobra oś, ale za dużo mocy, więc wie, że musi się cofnąć. I wierzcie mi lub nie, ale to jest dokładnie to, co się dzieje tak naprawdę matematycznie w sieciach neuronowych. To znaczy przekręcamy jakieś pokrętełko i patrzymy, czy efekt jest już dobry, bo wiemy, co powinno wyjść na koniec, bo w procesie uczenia zazwyczaj w tym takim uczeniu nadzorowanym tak zwanym, czyli takim, w którym wiemy, co jest efektem końcowym, to wiemy, co jest celem. Więc wiemy, czy to co... tą malutką rzecz, którą zmieniliśmy w sieci, czy ona nas doprowadziła ciut bliżej do celu. Jak nie, no to wracamy i wiemy czy przesadziliśmy, czy może może tą złą oś dobraliśmy tych zmian na tyle, że zazwyczaj jest więcej tych parametrów niż jeden. To nie jest jedno zwężenie paska, tylko jest ich tam np. 100 albo 1000, więc to się już naprawdę robi skomplikowane dla naszego mózgu, ale sieci jakoś tam to ogarniają.

Aga:
To od razu może zapytam się, czym jest sieć neuronowa? Pewnie wiele osób widzi to jako taką magiczną rzecz. Kojarzy mi się dużo takich stockowych zdjęć z takimi cyborgami, którzy dotykają jakąś przestrzeń oddaloną. Więc jakbyś mogła właśnie jeszcze w babciowym stylu wytłumaczyć, na czym polega sieć neuronowa i do czego się ona sprowadza w praktyce.

Sylwana:
No to jeśli w babciowym zostajemy, to w takim razie ja bym jeszcze... teraz już na bieżąco pewnie będę rzeźbić, tego nie wymyśliłam wcześniej. Siedzimy sobie w kuchni i tam np. mamy takie garnki, które stoją na kuchence. Tylko załóżmy, że ta kuchenka jest bardzo duża, w sensie, że tam może być, nie wiem, 30 garnków stojących i one są w takim rządku. Więc tak naprawdę sieć neuronowa to jest prosto rządek liczb, w sensie rząd warstw liczb, trochę jak taka tabela i one... jakby te liczby po prostu się dodają, mnożą tam itd. Jakby obliczenia są proste. W sensie wiemy, że chcemy dobrać taką wagę, że np. do tego pomidora, wiemy, że dużą wagę ma właśnie kraj pochodzenia, no to dajemy np. wagę 2 na Hiszpanię, a półtora na Portugalię, nie? Więc tam trochę więcej przelewamy do kolejnego garnka. Później w tym garnku wiemy, że tam np. jest zasada taka, że okej, no to jeśli tam właśnie jest, nie wiem, wrzesień, to coś tam, to waga jest razy 1.1, a jeśli tam listopad, to razy 0.8. I tak naprawdę to tam są dokładnie tylko takie proste liczby w tych sieciach neuronowych i one się po prostu wymnażają i szukamy tego odpowiedniego stosunku tych wag, tych parametrów. Więc tam nie ma jakby takiej turbo skomplikowanej matematyki w tym. Tam jest ona prosta. Całe skomplikowanie polega na rozmiarze tych sieci. W sensie, że jeśli tych garnków już byłoby 10 tysięcy, to to jest dla nas nie do ogarnięcia, ta skala, ale nie sam proces tego, że tam jest waga 1.1, bo ona jest, w sensie jeden kropka jeden. Ona jest tak prosta właśnie. Więc to tyle.

Aga:
Myślę, że ta analogia jest bardzo trafna, bo często się mówi o karmieniu sieci neuronowych, nie? Hahaha! Więc te garnki gdzieś tam fajnie zatrybiły.

Sylwana:
Garnki, pomidory, poszerzanie paska w spodniach - wszystko o tym samym temacie.

Praca data scientist

Paulina:
Hahaha super! No to mamy takie pojęcie właśnie takim prostym językiem, jak to działa. A jakbyś mogła podać taki przykład, bo pracujesz w firmie, która działa na zasadzie agencji, czyli przychodzą do Was klienci i proszą was o... yyy o co? No właśnie, o co Was proszą? Podaj jakiś przykład, może jakiegoś projektu.

Sylwana:
Jasne. Właśnie to, o co nas proszą, to jest tak szeroki zakres rzeczy, że czuję, że naprawdę znalazłam się w fajnym miejscem. Bo tam naprawdę codziennie się okaże, że coś zupełnie od czapy nowego wleciało. Jeden z takich przyjemniejszych do wytłumaczenia takich medialnych tematów, o których lubię wspominać, to jest przewidywanie inwazji szczurów. Bo może się zdarzyć, że np. firma ma bardzo dużo danych właśnie do wykarmienia sieci, ponieważ zajmuje się tym od lat. Na przykład wie, gdzie, kiedy, co zaatakowało, jaki typ szkodnika np. zaatakował pole. No to można już zacząć karmić sieć, która właśnie znajdzie te generalizacje. Okej, a czemu to się znalazło tutaj w tym momencie? Może bylibyśmy w stanie temu zapobiec? No bo jeśli wiemy, że wydarzy się to przy tych warunkach, no to jeśli już mamy prognozę pogody, wiemy, że np. pole jest przy jeziorze, a jezioro jest ważnym czynnikiem itd., no to możemy to przewidzieć. Więc use case biznesowo jest taki, że jeśli mamy sieć, która wie, skąd się wzięły konkretne szkodniki w konkretnym miejscu... znaczy w sumie nie chcemy mieć szkodników, no bo w sumie są to zwierzęta po prostu, nie? No ale załóżmy, że chcemy też, żeby też one jakby nie ucierpiały na tym, że później np. duże ilości będą ginąć, niestety. No to możemy pójść wcześniej do tego właściciela upraw i powiedzieć: „Słuchaj, tutaj się wydarzy to i to, możemy wcześniej zareagować” na przykład, nie? To, to jest taki jeden z use case'ów. I ja np. wtedy dostaje takie zadanie i mam, nie wiem, tydzień na przeczytanie całej literatury o tym, skąd się biorą takie szkodniki, takiej niezwiązanej z data science, tylko takiej branżowej u nich, o co tam chodzi. Tak, żeby po prostu skumać, bo dostajemy te dane i tak naprawdę trochę, no muszę troszkę wiedzieć o tym. Tak samo jakbym miała przewidywanie plonów. No muszę troszkę wiedzieć, kiedy jest ta faza wyjścia, tego.. nie pamiętam, jak to się nazywało, ale załóżmy, że kłos wychodzi z ziemi, no to powinnam troszkę się douczyć. Ale przyznam się, że nie narzekam, bo to mnie akurat najbardziej jara, że można się trochę tam douczyć jakiś śmiesznych rzeczy.

Aga:
Ale to jest bardzo rozwojowe. Słuchaj Sylwana, Ty musisz do Milionerów teraz pójść. Hahaha! Będziesz znała odpowiedzi na wszystkie podchwytliwe pytania, o szczurach i nie tylko!

Sylwana:
No serio. Ta wiedza plus wiedza właśnie z tych książek o fizyce sprawia, że aż już totalnie wiem wszystko.

Aga:
Mocna zawodniczka!

Sylwana:
Tak!

Paulina:
Czy faktycznie udało Wam się przewidzieć właśnie jakąś wzmożoną obecność szczurów gdzieś? I czy macie takie dane, że udało Wam się coś przewidzieć i coś zmienić np. w firmie tego klienta?

Sylwana:
W tamtym momencie, znaczy w tamtym akurat case'ie, niestety nie wiem. Ponieważ często jest tak, że my dajemy jakieś rekomendacje albo dajemy jakiś taki silnik, właśnie dajemy taką sieć neuronową, która wskazuje np. jakieś różne parametry, które sprawiają, że oni mają jakieś wskazówki, ale my niestety później często już nie mamy udziału w tym, co się dzieje dalej. Na przykład teraz mieliśmy klienta, dla którego przewidywaliśmy jakieś takie rzeczy finansowe na zasadzie, w co ma zainwestować i też później się już nigdy do nas nie odezwał i nie wiemy, czy teraz nie leży po prostu brzuchem do góry na plaży, i po prostu już tyle zarabia w tym modelu.

Aga:
A może przymiera głodem? Hahaha!

Paulina:
Hahaha!

Sylwana:
Może, też jest takie ryzyko.

Aga:
Ja bym chętnie skorzystała z takiej usługi. Dlatego Sylwana później po wyłączeniu nagrywania taką sieć dla mnie to bardzo chętnie.

Sylwana:
Spoko, dogadamy się jakoś.

Aga:
No super! A powiedziałaś o tych danych, że klienci przychodzą do Was z danymi. No właśnie, jakiego rodzaju to są dane? I czy były takie sytuacje, kiedy klient np. przyszedł z danymi, które nie nadawały się w ogóle do obróbki?

Sylwana:
Tak, zdarza się to. Chociaż z biegiem czasu... im dłużej pracujemy w tej branży, tym bardziej już mamy takie systemy w głowie tych czerwonych lampek, że np. zanim podpiszemy umowę, to chcemy tę próbkę danych dostać, bo może się okazać, że w głowie klienta to wygląda jak „Wszystko tutaj macie, no to po prostu już coś z tym zróbcie”, a później się okazuje, że np. te dane są, no nie wiem, np. wszystkie w innych formatach. Takie, że np. są tabele, nie wiem, jedna to są użytkownicy, druga to są, nie wiem, historia zakupów, ale się okazuje, że nie mamy jak połączyć tych tabel, bo np. są zanonimizowane ze względów bezpieczeństwa. Albo ich lokacja też jest zanonimizowana i nic z tym nie zrobimy itd. Generalnie, teoretycznie powinno być tak, że takie dane są potrzebne, które normalnie byłyby też nam potrzebne do wyciągnięcia wniosków. To znaczy jeśli one są w jakiś sposób sensownie ułożone i da się na ich podstawie zgeneralizować jakąś wiedzę, no to to już jest wystarczające. To teoretycznie brzmi dobrze, a w praktyce to właśnie jednak najwięcej czasu chyba zajmuje nam zrozumienie danych, właśnie ułożenie ich w jakiś sensowny zbiór - taki czysty, taki właśnie wypełniony w pełni, bez pustych miejsc, to jest coś, co naprawdę masę czasu nam pożera i tego się często nie docenia, nie wycenia też, przynajmniej jak się jest na początku tej drogi. Wydaje mi się, że też dlatego, że jak się uczysz data science, robisz jakieś kursy online na przykład, jak korzystasz z jakiś takich baz gotowych, które są tam np. na bazie danych Kaggle. To jest takie zbiorowisko różnych ciekawych data setów, gdzie można się pobawić itd. No to one już są czyste zazwyczaj, a tak naprawdę ten cały kawałek, który my mamy do zrobienia, jego tam nie ma, tego use case'u w ogóle. Więc myślę, że to też tutaj jest takie spore zdziwienie dla osób, które przychodzą do tej firmy czy jakiejkolwiek innej i się okazuje, że na początku trzeba naprawdę sporo poczyścić.

Kto korzysta z usług data scientist?

Paulina:
A jak duże to są firmy, które do Was przychodzą? Czy to są właśnie jakieś mega korporacje, które mają ogrom danych? Czy to są też np. mniejsze firmy, jakieś nie wiem, sklepy internetowe, które chcą coś przeanalizować?

Sylwana:
Wszystko, cały cały przekrój. Na przykład ten case, o którym wspominałam, inwestycyjny, to był w ogóle podmiot prywatny. Po prostu facet, który dorobił się na czymś innym i leżał na pieniądzach, więc miał kasę na inwestycje. A mogą być też ogromne korporacje, jakieś tam, nie wiem, związane z pojazdami autonomicznymi i to też takie firmy do nas przychodzą. Więc pod tym względem też jest ciekawie, że faktycznie mogą być to bardzo różne typy podmiotów, a to też później wpływa na współpracę i na to, jak ta kultura w ogóle się dzieje i wygląda.

Paulina:
A mogłabyś jeszcze podać, nie wiem czy możesz, ale może mogłabyś podać więcej przykładów? Właśnie co to są za klienci i czego oni oczekiwali od Was w ogóle?

Sylwana:
To mamy taką umowę, że albo mówimy jaki to jest klient, albo mówimy czego oczekiwał, żeby nie było tak idealnie. Wiecie. Więc powiedzcie mi, co wolicie, żebym powiedziała?

Paulina:
No to raz tak, raz tak hehehe!

Sylwana:
To już mówiłam trochę o tym, jakie były projekty, to mogę powiedzieć teraz trochę o klientach tak zupełnie bez mówienia kontekstu. Na przykład T-Mobile albo Lego, albo TomTom, też Brytyjska Służba Zdrowia na przykład, z którą nasza firma wygrała przetarg, w którym startował Google. To my wygraliśmy, jakby przejęliśmy południową część Wielkiej Brytanii, bo Wielka Brytania na pół się wtedy podzieliła w tym, co mieliśmy zrobić i my wzięliśmy drugą połówkę Wielkiej Brytanii, więc też tak śmiesznie.

Aga:
Super! To może to jest najwyższa pora, żeby powiedzieć nazwę tej firmy. Hahaha!

Sylwana:
Okej, ale żeby nie było, bo ja nie przyszłam tutaj reklamować tej firmy, ale nazywa się Digica. Jesteśmy w Łodzi. Mamy około stu osób w tym momencie i tak to wygląda.

Aga:
Super, super! To można sprawdzić, oczywiście tak sterowane dzisiaj prywatnie jakby co - views are my own! Hehehe!

Sylwana:
Hehe!

Aga:
A powiedz jeszcze Sylwana a propos tych klientów, czy Wy jako firma musicie ich w jakiś sposób edukować? No bo oni pewnie mają jakieś wyobrażenie i przychodzą z jakimiś tam założeniami, no ale też w procesie tam różnie bywa. I pytanie, czy Wy też tak jak designerzy często tam narzekają na klientów, że trzeba im tłumaczyć, argumentować te swoje decyzje projektowe, to zastanawiam się, czy też u Was jest tak w świecie data science, że musicie tych klientów tak trochę naprowadzać na prawidłowe tory w ogóle czego oni się mogą spodziewać z tej Waszej pracy?

Sylwana:
Myślę, że bardzo. To jest właśnie ciekawy kawałek w tej pracy, że niby to jest IT cały czas, więc są to ludzie, którzy gdyby to było zamawianie strony internetowej czy cokolwiek, no to wtedy to jest oczywiste, co biorą, za co płacą. A rzeczywiście data science jest takie o tyle specyficzne, że to jest jeszcze taki nowy kierunek. Nie ma tu jeszcze takich narzędzi, które byłyby na tyle ustandaryzowane, że powiemy „Okej, robimy to” i oni wiedzą dokładnie, czego się spodziewać. Więc już na tym wczesnym etapie tu jest sporo takiego niezrozumienia i potencjalnej edukacji, też takiej dwustronnej, że oni edukują nas o swoim biznesie, a my edukujemy ich „Okej, to co możemy z tym zrobić?”. Tak naprawdę za każdym razem to jest rzeźbienie od zera i wymyślanie. Ale tak, załóżmy, że coś im zrobiliśmy, to może być tak, że się super cieszymy z tego, co my zrobiliśmy, bo to super np. przewiduje coś, ale klient może w ogóle nie skumać tego sukcesu, no bo też nie zrozumie np. miar, którymi się posługujemy. To jest kolejny taki właśnie potencjalnie element edukacji, ale też właśnie takiego trochę wyzwania po naszej stronie, generalnie jako naszego zawodu, że nie tylko siedzimy w liczbach, jesteśmy takimi ścisłymi umysłami, ale też potrafimy wyjść do człowieka i mu tak właśnie ludzkim językiem to przetłumaczyć, nie? No bo bez tego, jak oni mają zauważyć, że coś fajnego im zrobiliśmy. Zwłaszcza, że to czasami gdzieś tam jest jeszcze w takiej fazie researchowej, więc to nie jest jeszcze tak, że oni widzą namacalnie efekt jakiś finansowy na przykład, tylko na razie operujemy na zwykłych miarach, np. kakieś tam, nie wiem, accuracy, precision, recall. To są wszystko miary, które konkretnie coś mówią, ale jeśli nie potrafimy tego sprzedać, nie potrafimy tego wytłumaczyć, no to co my właściwie robiliśmy przez te 3 miesiące? Z czego my się tak właściwie cieszymy? Co my się tak jaramy?

Aga:
Excelki jakieś dziwne.

Sylwana:
Tak, tak.

Paulina:
Nerdy jakieś. Hahaha!

Sylwana:
No. Haha!

Ścieżka kariery data scientist

Paulina:
No dobrze, to wiemy mniej więcej, co robi Twoja firma. I teraz przejdźmy do Ciebie, Sylwana. Powiedz, jak to się w ogóle stało, że zostałaś data scientist? Jaka jest ścieżka do tego miejsca, w którym jesteś?

Sylwana:
No ogólnie mój background taki edukacyjny to jest bardziej ekonometria i statystyka, bardziej matematyka generalnie niż programowanie. Ale dla takiej osoby tak jak ja też to jest miejsce, bo wiem, że data science się bardziej jednak kojarzy z mimo wszystko takim klasycznym programowaniem i większość takich osób jest też u nas. Natomiast takie osoby jak ja również są i ja też właśnie przyszłam z tego miejsca. Na początku jeszcze trochę nie miałam pomysłu na siebie. Wiedziałam, że chcę robić coś związanego z danymi, z takimi ścisłymi rzeczami, z szukaniem wzorców itd. Później te 5, 6 lat temu, kiedy bardziej zaczęłam się uczyć Pythona, który jest takim językiem właśnie typowo pod data science, no to gdzieś tam usłyszałam właśnie na jakimś jednym z kursów, że no to jest teraz fajny trend na data science właśnie. 6 lat temu ja pierwszy raz usłyszałam wtedy to sformułowanie, ale mi gdzieś już utkwiło, siedziało i tak później gdzieś tam mój mózg wyłapywał tylko co, gdzie, jak i gdzie mogłabym się zaczepić, żeby to robić. W międzyczasie robiłam sobie kursy online jakieś tam właśnie na Cooursera rzeczy gdzieś, bo trochę nie było alternatyw jeszcze w tamtym momencie. Teraz już różne bootcampy są, nie wiem, data science'owe, bo to już jest totalnie trend, ale wtedy jeszcze tego nie było. Wtedy po prostu były kursy online po angielsku. Jeszcze trochę, no pod względem takim... user experience powiedzmy to jeszcze nie było takie super, trzeba było się trochę przebić przez tą ścianę. No i co? Po jakiś trzech, czterech miesiącach dłubania sobie tak prywatnie w tym, ale też no wykorzystywanie mojej wiedzy z ekonometrii przy okazji, bo też tam właściwie sporo jest jakichś tam analiz dotyczących trendów itd., jakieś tam klastrowanie, no to to wszystko jest właściwie matematyczne. To się trochę, to się to przepływa między sobą. No to wtedy dostałam się po tych czterech, pięciu miesiącach, wracając z tego off-topu do pierwszej pracy, w której stricte robiłam data science i to była firma, która się później przetworzyła w Digicę właśnie, więc już tam jestem od tamtego czasu. Już tam się właściwie uczę całego fachu, można powiedzieć.

Paulina:
Czyli kiedy to było? Ile lat temu?

Sylwana:
To było w 2018, czyli 5 lat temu.

Paulina:
Super, czyli w zasadzie też gdzieś tam rozwijałaś się w tej firmie i uczyłaś się. I z tego co pamiętam, mówiłaś nam chyba na naszym spotkaniu przed nagraniem, że byłaś czwartą osobą w tej firmie, tak?

Sylwana:
Dokładnie tak.

Paulina:
A teraz macie 100 osób.

Aga:
Poza podium! Hahaha! Ale jak zawędrowała pięknie.

Sylwana:
Tak, ale dwie osoby z tamtych co były wkurzyłam, więc teraz jestem na podium.

Paulina:
Hahaha!

Aga:
Oh yeah! Tak to się robi!

Paulina:
Więc ta firma bardzo się rozwinęła w te 5 lat, więc zapewne Twoje stanowisko też się mocno zmieniało. Jakbyś mogła opowiedzieć w ogóle, co robiłaś na początku i co robisz teraz? Jak to się zmieniało? Jaka jest Twoja rola w zespole? Bo też no podejrzewam, że jesteście podzieleni gdzieś na jakieś zespoły, jak pracujecie z klientami, prawda? Powiedz, jak to się zmieniło?

Sylwana:
Jasne! To tutaj Cię zaskoczę, ale właśnie moje ostatnie naprawdę mocne wysiłki polegają na tym, żeby nic się nie zmieniło i póki co się tego trzymam, co nie jest łatwe. Bo właśnie faktycznie na początku, jak możecie się domyślać, robiłam właściwie wszystko od początku do końca, czyli od tej pierwszej analizy danych, przez faktyczne zrobienie projektu, po raportowanie itd. Do tego rekrutacje, wszystkie takie rzeczy. A później, no to jest takie coś w IT, że jak pewnie w każdej innej branży, że im bardziej jesteś doświadczona, tym bardziej szefowie są skłonni Cię awansować na stanowisko liderskie, menedżerskie. No i faktycznie tutaj też to wszystko do tego prowadziło, ale ja w pewnym momencie zdecydowałam, że w sumie to chyba najbardziej jednak wolę siedzieć w tych danych i nie zabierajcie mi tego, bo później się okazuje, że ja zarządzam ludźmi, którzy robią to, co mnie tak naprawdę jara. Ja im zazdroszczę wszystkim wokół. I mówię: „Nieee, trochę zdegradujcie mnie jednak!” i w tym momencie... no jakby nie czuję, żebym była gdzieś tam nisko w tej hierarchii czy coś. Ona jest zresztą w miarę płaska, ale cały czas staram się być jednak blisko tego, po co tam przyszłam, bo tak naprawdę to mnie najbardziej w tym jara. Nie to, żeby właśnie gdzieś tam być menedżerką jakiegoś średniego szczebla itd. czy coś. Tylko właśnie data science po prostu głęboko w serduszko.

Aga:
Ooo cute.

Sylwana:
Ale tak, firm no musiała się oczywiście trochę pozmieniać i to każdy, kto przechodzi przez ten moment, a to jest bardzo ciekawy moment w ogóle być w takiej tranzycji firmy, no to wie, że to duże złości przy okazji może się pojawić w niektórych, że już nie jest tak jak było, że muszą się procedury nagle pojawić, że już trzeba gdzieś tam coś dokumentować, a nie że wszystko jest na gębę. Czy gdzieś tam, to porównam do tego jak taki pies, który jak był mały szczeniaczek to miał taki mały kojec i sam sobie wchodził, zakręcał się w kuleczkę i sobie spał w rogalika, a teraz jest takim dużym psem, ale ciągle chce tam wejść do tego małego kojca, nie? I się nie mieści, ale stara się, więc tak na siłę się wpycha, więc czuję, że mamy taki albo mieliśmy taki moment w firmie, gdzie jeszcze chcieliśmy poczuć ten vibe takiej małej, małego start-upu powiedzmy. A no już nie da się w pewnym momencie jak jest nas 100 osób i już przestajemy siebie wszyscy znać tak z twarzy i z imienia powolutku, nie?

Digica i początki data science w Polsce

Aga:
To jeszcze jakbyś mogła opowiedzieć o kontekście w ogóle założenia firmy, tzn. nie Ty zakładałaś, ale jakby byłaś bardzo wczesną pracowniczą, więc gdybyś mogła powiedzieć, kto stoi za firmą i jak to się stało w ogóle, bo te powiedzmy 5, 6 lat temu, nie wiem dokładnie kiedy powstała firma, ale mimo wszystko to są takie czasy, kiedy jeszcze o data science za dużo się nie mówiło w Polsce przynajmniej. Więc jestem ciekawa tych początków.

Sylwana:
Generalnie początek się wywodzi z Łodzi, więc fajnie, bo generalnie z Polski. To w tamtym momencie pomysłodawcą, jeśli dobrze pamiętam, był Rafał Jańczyk, który do tej pory jest naszym szefem i z tego co pamiętam, to on trochę też ten trend wyczuł siedząc w Stanach Zjednoczonych, gdzie pracował w innej firmie, ale już widział, że ten rynek się tworzy, że zapotrzebowanie jest i rośnie, więc szukał miejsca gdzieś w Polsce, gdzie mógłby stworzyć firmę. Widząc, że te zasoby ludzkie, że tak powiem, są tutaj u nas, więc czemu by z nich nie skorzystać. Więc później sobie dobrał odpowiednie osoby, inwestora i też osobę, która będzie bardziej od data science typowo tak zarządzać merytorycznie. No i ta ekipa do dzisiaj jest. Tutaj na szczęście to wszystko zostało tak bardzo lokalnie. Cały czas jesteśmy głównie w Polsce i to też jest w sumie fajne.

Aga:
A jak wypadacie na arenie takiej międzynarodowej w obszarze data science?

Sylwana:
Ja osobiście badań nie robiłam, więc mam nadzieję, że tu nie nakłamię. Ale z tego co kojarzę, to jesteśmy jednym z większych właśnie takich zagłębi data science'owych w Europie, przynajmniej w tej części Europy. Ponieważ często firmy, np. banki chwalą się oddziałami data science. Ale później, jak się zapyta, ilu macie tych data scientistów? No to jest tam ich 5, 10. U nas w tym momencie chyba jest ich około 60 w jednym miejscu, więc to jest fajna taka masa krytyczna. Już taka, że naprawdę można po prostu jakby rosnąć samym byciem w tej firmie, nie? Po prostu dowiadujesz się, jakby przez osmozę chłoniesz, to co inni robią. Każdy gdzieś tam ma zajawkę na coś innego, jakiś inny poddział, więc to jest fajne i też to jest elastyczne, nie? Bo jak firma do nas przyjdzie, to jesteśmy w stanie zrobić dla niej praktycznie wszystko z tego data science, a nie tylko np. specjalizację w NLP czyli modelach językowych, załóżmy.

Paulina:
Czyli to jest tak, że w zasadzie właśnie ci założyciele mając wiedzę z zagranicy, wiedzieli, że w Polsce są już specjaliści w tym temacie, czy dopiero właśnie byli, nie wiem, matematycy czy programiści, których trzeba było jakby poprowadzić w odpowiednią stronę, żeby użyć tej ich wiedzy w data science? Jak to było?

Sylwana:
Chyba to drugie. Chyba to drugie jednak, nie? Bo teraz już mamy osoby, które są po studiach albo chociaż po specjalizacjach z data science. W tamtym momencie tego jeszcze nie było, więc wszystko to co wiedzieliśmy, to wiedzieliśmy z jakiś kursów online. Przynajmniej ja tak miałam i to było całkiem w porządku, że ja tak miałam, więc zakładam, że sporo osób tak miało, więc chyba tak. Chyba to było właśnie tak, jak mówisz, że to było założenie, że te osoby po prostu będą musiały się douczyć odpowiednich tematów, ale mają już podbudowania jakieś teoretyczne plus taką zajawkę. To też było chyba takim dość dużym czynnikiem przyjmowania do firmy, że jeśli masz zajawkę na ten temat, no to prędzej czy później się tego douczysz po prostu, bo Cię to kręci i to jest ważniejsze niż np. skończenie studiów, ale bycie takim trochę znudzonym tym albo takim, że bardziej jednak wolisz, żeby to się aż tak nie zmieniało z dnia na dzień, bo jednak dużo się zmienia z miesiąca na miesiąc. Zresztą same pewnie słyszycie, nie będąc tej branży, jak dużo się zmienia, więc trzeba mieć tą wkrętarkę, żeby nadążać. Chociaż jest już coraz ciężej.

Paulina:
To w ogóle bardzo takie odważne bym powiedziała pod kątem biznesowym, żeby założyć firmę i zatrudnić ludzi, którzy jeszcze nie wiedzą, jak to się robi, ale chcą się dowiedzieć. Więc chodźcie i uczmy się razem!

Aga:
To taki trochę enthusiasm driven hehehe.

Sylwana:
Żebyś wiedziała! Ale to jest równie ciekawe np. w kwestii project managerów, bo to nie jest takie oczywiste jak zarządzać projektem data science'owym. No bo generalnie, jak zarządzasz projektem, to wiesz jaki jest cel, wiesz jakie są tam KPI, wiesz jakie są po kolei stopnie dochodzenia do celu, nie? A w data science często jest tak, że my dopiero szukamy tego celu, bo klient przychodzi z danymi z pieniędzmi i mówi: „No, wymyślcie mi coś fajnego”. I teraz, jak zarządzić takim projektem? Jak zarządzić ryzykiem, jeśli my zaczynając projekt nie wiemy w ogóle, jakich narzędzi użyjemy, bo musimy dopiero się tego nauczyć. Więc tutaj wiele specjalizacji, wiele różnych typów stanowisk u nas uczy się tego, jak to swoje stanowisko przełożyć na świat data science, nie? To jest w ogóle ciekawe.‍

Wyzwania w data science

Aga:
Super, super! Wspomniałaś już Sylwana o projektach różnych, w których brałaś udział, to pytanie, jakie w ogóle są obecnie najciekawsze wyzwania w data science Twoim zdaniem?

Sylwana:
To jest ciekawe, bo rozmawiamy w momencie, kiedy naprawdę dużo rzeczy się obraca do góry nogami. Mam na myśli zwłaszcza Chat GPT oczywiście i wielkie modele językowe. Tutaj mam wrażenie, że ta zmiana jest tak duża, że jakbyśmy porozmawiały za miesiąc, to bardzo możliwe, że tutaj zupełnie moja odpowiedź będzie inna, bo wszystko jest teraz takie totalnie na bieżąco, więc teraz możliwe, że palnę jakąś totalną głupotę, bo zaraz się zaktualizuje. Już tak miewałam wcześniej, ale ok. No jest, jak dla mnie spore wyzwanie i tutaj Chat GPT, i powiedzmy Midjourney, i tych wszystkich narzędzi do generowania obrazu, I faktycznie jest nie tylko przeze mnie wskazywane, dotyczące właśnie fake newsów. I fake newsów obrazowych i wideo, bo ta jakość się tak polepsza, że już niedługo człowiek nie będzie faktycznie w stanie odróżnić tych treści, czy one są prawdziwe czy nie. Więc to będzie w ogóle ciekawa, wydaje mi się, taka poddziedzina, czyli taka, no nie wiem. Do tej pory to trochę myślałam, że takie forensics, że takie trochę sądowe jakby analizy czy np. to może być dowód w sprawie czy to nie zostało wygenerowane np. że ktoś niby coś tam zrobił, nie? Wydaje mi się, że to się może spopularyzować trochę, taka taka działka. Bo właśnie takie ryzyko tutaj może wystąpić. Co jeszcze? Dla mnie takim ryzykiem, ale takim bardziej związanym ze społeczeństwem jako takim jest to, że faktycznie AI coraz więcej rzeczy robi, które do tej pory mogli zrobić tylko ludzie, przez co coraz więcej zawodów prostych, które mimo wszystko umożliwiały ludziom zarabianie, teraz im odbierzemy. Więc jakby coraz mniej ludzi będzie mogło... nie wiem, jak to ująć. Chodzi o to, że do tej pory mimo wszystko było tak, że dosyć łatwo było nawet tym osobom, które powiedzmy nie były jakoś turbo, nie wiem, zaawansowane w wiedzy właśnie z fizyki, z matematyki, to one były też w stanie znaleźć pracę. Jeśli ona teraz zostanie zautomatyzowana, to wyobrażam sobie, że cały wielki ogon tego rozkładu tych osób, powiedzmy pod jakim względem można by je tam analizować, może IQ na przykład. No to ogromne jakby, ogromne rzesze osób, które do tej pory były uważane za mimo wszystko niezbędne i na tyle inteligentne, że coś robiły lepszego niż AI, nagle się może okazać, że będą niepotrzebne w tym momencie i czy my będziemy w stanie na tyle szybko zareagować, nie wiem, jakimś dochodem minimalnym i jednak jakimś może upublicznieniem zarobków z AI? Żeby zdążyć przed tym, zanim te wszystkie osoby pójdą na bruk i nagle jeszcze bardziej się jakby tak wykrzywi ta krzywa Giniego, czyli dysproporcji w zarobkach na przykład.

🤖 O projektowaniu UX dla AI dowiesz się z odcinka #76 – Jak projektować UX dla AI?.

Paulina:
Krótki przerywnik. Od niedawna w aplikacji Spotify możecie brać udział w naszych quizach i ankietach, więc zapraszamy Was serdecznie. Możecie wziąć w nich udział, śmiało do nich wskakujcie. Czekamy też na Waszą ocenę.

Bias danych

Aga:
Pamiętam Sylwana, że gadałyśmy o case'ie kasyna. Czy mógłbys trochę więcej o tym opowiedzieć? Bo to jakaś ciekawa historia.

Sylwana:
No tak, bo o kasynie mówiłam chyba, że możemy...

Aga:
Rozpoznawanie twarzy.

Sylwana:
Tak, bo możemy robić algorytmy, które rozpoznają wiek twarzy. Teoretycznie. To jest w ogóle ciekawe. Nie wiem, czy mówiłam Wam wtedy, ale wspominałam, że co jest ciekawe, że algorytmy takie... no bo one oczywiście potrzebują dużo zdjęć i dużo danych o tym, w jakim wieku jest ta osoba na tym zdjęciu, żeby się nauczyły. No i teraz ciekawe było to, skąd się biorą takie dane. Zazwyczaj popularnymi data setami są dane z Wikipedii i z IMDb, czyli tego portalu filmowego. Ponieważ tam masz zazwyczaj zdjęcie gwiazdy i zawsze masz tam informację o tym, w którym roku się urodziła, więc to taki piękny, idealny, wypieszczony data set do po prostu brania i korzystania. No bo on już został gdzieś tam przygotowany, żeby sobie po prostu go pobrać i wykorzystać. I faktycznie takie dane można wykorzystać do chociażby nauczenia algorytmu rozpoznawania wieku, bo wtedy możesz troszeczkę znowu zautomatyzować pracę kierowników kasyn na przykład albo pracowników, że np. nie zawsze muszą podchodzić i weryfikować, jeśli ktoś chce zagrać w jakąś grę, nie zawsze muszą podchodzić, weryfikować dowód. No bo jeśli już algorytm powie z całą pewnością, że ta osoba jest starsza, to już nie musi i np. podejdzie tylko w przypadku jakiś takich spornych kwestii, jakiś takich na granicy. No bo tu jest jakby dużo wątków, które można poruszyć. Chociażby taki, że bywa często tak, że w tych danych, na których uczymy sieci jest nadreprezentacja osób określonej rasy, np. białej, bo np. my głównie stoimy za Hollywood i głównie białe osoby grają w filmach itd. i są piosenkarzami, nie? Więc może się okazać, że ta sieć głównie się nauczy dobrze na osobach białych, bo na nich się nauczy tych wszystkich krzywizn twarzy itd. Więc to jest jeden z case'ów. Inny jest taki, że na dorosły generalnie się lepiej nauczy, bo więcej jest dorosłych, którzy są znani niż dzieci. Dzieci tam czasami, nie wiem, czy wizerunek mają chroniony czy coś, więc to jest inny z takich case'ów. Nie wiem, czy coś pominęłam. Coś tam pamiętasz z takich jeszcze ciekawszych wątków w tym kontekście?

Aga:
W kontekście o kasynach chyba nie. Ale właśnie pamiętam, że to hasło, że uczenie z tym uprzedzeniem, że biased, nie? Że to jest. Jakby, że czasem ciężko tego też uniknąć.

Sylwana:
Tak, to jest w ogóle mega ciekawy temat, ogromny. Dlatego często o tym piszę na Instagramie, bo to jest... to nie jest tak, że sieci są jakieś uprzedzone, tylko prostu dane, na których trenujemy są już jakoś zbiasowane, czyli mają jakieś tam nachylenie np. proporcji jednych osób nad drugimi albo np. nie wiem, te zdjęcia osób czarnych są już gorsze, już mają gorsze np. kontury, bo wcześniej już chyba Fuji czy jakieś inna firma, która robi chyba film do aparatów, to już wcześniej one były nastawione na bardziej wyłapywanie krzywizn twarzy białych osób niż czarnych. Więc już te zdjęcia były gorszej jakości w przypadku osób czarnych. Więc to się w ogóle zapętla. I teraz jeszcze w dodatku wkładamy to w modele i tam już się w ogóle zautomatyzuje. No generalnie jesteśmy czasami...

Aga:
No tak, nawarstwia się, nie? To uprzedzenie jakby, ten biased się nawarstwia i ciężko już to potem rozwikłać.

Sylwana:
Tak! Więc czuję jakbym była na takiej krawędzi, takiej, że jeszcze ja mogę zablokować coś, nie? Jeszcze powiedzieć: „Ej, słuchajcie, jeszcze się upewnijmy, czy na pewno to, co wpuszczamy w świat, to na pewno nie jest zbiasowane”. No, ale co ja mogę wiedzieć. Ja też mogę mieć swój bias, bo w ogóle nie pomyślę o tym. To trochę tak, jak, nie wiem, jeśliby mężczyźni sami robili aplikacje zdrowotne, to być może w ogóle by nie wpadli na pomysł, żeby zawrzeć cykl miesiączkowy w analizach np. temperatury ciała. I to nie jest ich zła wola. Po prostu na to nie wpadną. Ja tak samo się boję, że mogę nie wpaść na coś, że ja gdzieś jestem w jakiś sposób uprzedzona albo w ogóle o czymś nie pomyślę, jeśli chodzi o osoby innych ras. Jeszcze jest taki ostry temat na koniec.

Aga:
Ostry temat? Nooo. Ale jest jeszcze jeden case, o którym nam wspominałaś - odwróconej funkcji celu i białku. Jakbyś mogła jeszcze przytoczyć.

Sylwana:
Tak. Chociaż przyznam szczerze, że nie przypomniałam sobie tego totalnie, więc będę mówiła totalnie z głowy. Ale ogólnie, znowu mogę wrócić np. do tej analogii z pomidorami, że jeśli np. jeśli pamiętamy, jak wyglądają mniej więcej dobre pomidory, to znaczy, że mam super mózg nastawiony na to, żeby analizować, co jest dobrym pomidorem np. ładny kształt, ładny kolor, faktura itd. No to, jest to sieć neuronowa i w niej rzeczywiście na koniec jest taki dzyndzelek, który mówi, czy funkcja celu została spełniona, czy pomidor jest najlepszy możliwie. I to jest trywialne, żeby ją odwrócić o 180 stopni i powiedzieć, co jest najprostszym pomidorem. I teraz dokładnie to samo mogłoby być i dzieje się chyba w przypadku wymyślania różnych jakiś tam cząsteczek chemicznych, jakiś takich białek itd. Że w tym momencie można np. wymyślić, jak może wyglądać lek, ale wydaje mi się, że można też zrobić coś w stylu, chyba ktoś to zrobił, jak można wymyślić, żeby coś było najbardziej szkodliwe, jak się da. Po prostu odwracając tą funkcję cel, czyli np. nie musi trenować nic od początku. Po prostu ktoś kto miał te dobre intencje i wrzucił ten pierwotny model do leczenia, wrzucił go, a ten ktoś inny później tylko zmienił tą końcówka i np. dostał na dzień dobry coś bardzo szkodliwego. Więc myślę, że możemy gdzieś tam później podlinkować w opisie konkretnie ten artykuł albo badania, albo właśnie ten case, bo myślę, że warto doczytać go po prostu. Ale tak w dużym skrócie no to na tym to polega. I właśnie to jest trochę taki case jak z Chatem GPT, który dzisiaj może służyć do robienia fake newsów czy podszywania się pod kogoś albo militarnie - że jest super narzędzie, ale ono jest tak super, że może służyć jakby obu stronom.

Aga:
Tak, tak, dokładnie, super!

O AI, zagrożeniach i Chacie GPT

Paulina:
Ale żeby może jeszcze tak trochę uporządkować pojęcia, bo jakbyś mogła połączyć te dwie rzeczy, mianowicie data science i AI - czy to jest tak, że jedno zawiera się w drugim?

Sylwana:
Tak. AI zawiera się w data science w dużym skrócie. AI to też jest takie bardzo ogólnikowe, stwierdzenie takie bardziej medialne, ale mówię tu stricte o uczeniu maszynowym. Tak już mówiąc moim branżowym językiem i uczenie maszynowe zawiera się w data science, które jest generalnie analizą danych. Analizować dane możesz przy użyciu właśnie sieci neuronowych, czyli tego, co powstaje w wyniku uczenia maszynowego. To tak w dużym skrócie.

🗣️ O praktycznym wykorzystaniu AI w komunikacji dowiesz się z odcinka #72 – AI w praktyce – komunikacja.

Paulina:
Okej. No faktycznie jest... mówi się o wielu bardzo zagrożeniach, które niesie ze sobą AI, ale też bardzo wiele osób porównuje to do rewolucji, takich typu wymyślenie komputera i gdzieś tam też wiele osób, wiele zawodów stało się niepotrzebnych, prawda? Tylko, że podejrzewam, że to się działo troszeczkę wolniej wtedy. Teraz wszystko się dzieje w takim galopującym tempie i to może gdzieś tam pewnie nas zaskoczyć.

Sylwana:
Też słyszałam takie opinie. Akurat aż tak właśnie też nie chcę tutaj się na specjalistkę w tych tematach i też historycznych tutaj... wiesz, jakby tak siebie udawać, że jestem taką osobą. Ale tak, też słyszałam takie opinie, że czy to komputer, czy powstanie Internetu, to wszystko trwało jednak ciut dłużej niż teraz, kiedy są nawet takie profile na Instagramie, które co tydzień publikują listę nowości ze świata AI. W pewnym momencie już musieli to codziennie zamieszczać, bo już im się nie mieściły po prostu te rzędy tam, nie wiem, 60, 80 podpunktów tego, co nowego powstało w ciągu tygodnia. A to takich rzeczy, które do tej pory każda jedna byłaby newsem wartym jakiegoś miesięcznika powiedzmy, nie? Na przykład narzędzie, które pozwala Ci praktycznie przestać kodować jakieś tam fragmenty kodu, bo już się algorytm nauczył, że napiszesz mu, że potrzebujesz taki fragment kodu i on Ci napisze sam. Teraz to się dzieje i aha okej, dobra, kolejna rzecz, która powstała. Aha, dobra, lecimy dalej! Nie? Teraz to już nic nas nie dziwi praktycznie, nie?

Aga:
No właśnie, to jeszcze Sylwana, skoro jesteśmy przy tym temacie Chat GPT. Sylwana o Chacie GPT. Co powiesz nam? Hahaha.

Sylwana:
Wiem, że teraz strasznie pesymistycznie mówiłam, więc to może wszystkich zdziwić, ale powiem, że uwielbiam go i uwielbiam z niego korzystać.

Aga:
A czy dziękujesz zawsze za każdym razem? Bo słyszałam, że są tacy ludzie, też zawsze piszą „dziękuję”. Hahaha.

Sylwana:
Wiesz co? Czasami tak. Jak mi bardzo pomoże, to tak.

Aga:
Oooo!

Sylwana:
Bo nie mogę się powstrzymać. Moja mama też mu dziękuje. No tak, też to jest bardzo śmieszny właśnie żarcik. A może już nie żarcik, że właśnie faktycznie na wszelki wypadek lepiej być miłym, bo nigdy nie wiemy kiedy to zaplusuje. Moja mama zawsze dziękuje, więc widocznie ona wie o tym lepiej niż my. Tak, każdy, mam wrażenie, używa trochę po swojemu tego Chata. Ja np. go bardzo lubiędo właśnie tego trybu „wytłumacz mi, jakbym była pięcioletnim dzieckiem coś tam” i wtedy podaje właśnie jakieś tam zagadnienie, czy to z fizyki, czy to z matematyki, czy z czegokolwiek. To jest świetne. To jest dla mnie game changer totalny. Albo czasami też proszę go, żeby szukał metafor za mnie, bo ogólnie to jest mój jakaby, nie wiem czy konik, ale bardzo lubię tłumaczyć właśnie ludziom rzeczy, korzystając właśnie z analogii do, nie wiem, tak jak tych pomidorów, nie? Ale tutaj czuję, że Chat jeszcze nie jest lepszy ode mnie. Jeszcze mnie tu nie zastąpi do końca, bo czasami one są słabe zazwyczaj. Ale go tak testuję trochę. No do programowania ludzie go też używają. Nawet w moim środowisku i czasami nie chce im się tłumaczyć juniorowi czego potrzebują, tylko napiszą chatowi i po chwili to mają. I to jest z jednej strony piękne, a z drugiej straszne. To co właśnie wcześniej mówiłam o tym zagrożeniu, że część ludzi zmiecie z rynku. Takich, którzy do tej pory byli uważani za jakby inteligentnych ludzi, których nikt nie zastąpi, nie? Więc to jest to.

Paulina:
A sama używasz też w pracy właśnie narzędzi AI tych, które się pojawiają albo no właśnie np. Chata?

Sylwana:
Właśnie to jest śmieszne, że tak nie jakoś bardzo. Nie? Jesteśmy firmą AI, a jakoś tak to gdzieś tam każdy coś tam po troszku, ale nie oficjalnie.

Aga:
Czyli tradycja, tradycja.

Sylwana:
A Wy, dziewczyny? Korzystacie z Chata?

Aga:
Zdarza się, chociaż...

Paulina:
Tak, ja w ogóle uważam, że ja jestem do tyłu mocno w tym i że powinnam dużo więcej korzystać z tych narzędzi, i w ogóle znać więcej narzędzi, więc to jest mój plan na wakacje. Ale czasami używamy.

Aga:
Ja mam takie, wiecie, obawy a propos praw własności intelektualnej itd. W sensie mam taką rozkminę gdzieś z tyłu głowy ciągle, czy to jest ok, nie? W sensie gdzieś tam zastanawia mnie to mocno, więc na razie tak podchodzę z dużą rezerwą. W sensie fajnie jest się pobawić, ale jeszcze mam takie jakieś. Pochodzę tak powolutku, pozaznajamiam się z tematem. No ale jest to coś na pewno dużego, co w ogóle ciekawie się obserwuje. Myślę, że to jest fascynujące nawet dla osób, które nie siedzą w IT. Na przykład jak pokazałam tacie - ten Chat wygenerował jakiś wierszyk o naszej rodzinie i mówi: „Co? Jak to działa? Pokaż mi! A gdzie ja się mogę zarejestrować?”. Haha, więc to jest fajne, że elektryzuje wszystkich, że nie tylko takich geeków, nie? Tylko ten Chat GPT jest na ustach całego świata.

Sylwana:
To prawda. Zapomniałam rzeczywiście o tym use case'ie, że można poprosić Chata o wytłumaczenie Ci czegoś przy pomocy piosenki „Parostatek” Krzysztofa Krawczyka i on to robi dokładnie, jakby można to włożyć w tą muzykę i ten tekst. I to jest to!

Aga:
Hahaha! To wspaniałe, wspaniałe! To już chyba wiemy, jak napiszemy zapowiedź do tego odcinka z Tobą Sylwana.

Sylwana:
Hahaha!

Narzędzia, z których korzysta data scientist

Paulina:
No dobrze, czyli nie korzystasz zbyt często z Chata GPT w swojej pracy, to z czego korzystasz? Jakich narzędzi używasz tak na co dzień w projektach?

Sylwana:
Znaczy tak, jeśli chodzi o język programowania, tak jak wcześniej wspomniałam, to jest Python. Tutaj on się dosyć mocno trzyma w czołówce. Jednak jest jakby najpopularniejszym językiem w data science. Nie da się tego zakwestionować. A jeśli chodzi już o jakieś takie konkretne biblioteki i narzędzia, to jest NumPy, Pandas, Matplotlib. To są takie główne biblioteki, które służą czy to do analizy danych, jakiejś tam pracy na danych tabelarycznych na przykład albo do wizualizacji, albo do liczenia jakiś takich prostych algorytmów np. SciPy jest bardzo dobry do tego, do takich prostych algorytmów data science'owych. A do już takich bardziej zaawansowanych rzeczy to jest PyTorch w tym momencie najbardziej chyba na topie do takich sieci neuronowych. Ale tutaj też to się. To są ciekawe czasy, bo jak zaczynałam, to faktycznie czasami wręcz z palca się tak jakby programowało sieć neuronową. To znaczy faktycznie się programował te oczka, te garnki, jak tutaj wspominałam wcześniej, a teraz coraz więcej rzeczy schodzi gdzieś tam pod maskę, jest zautomatyzowanych i być może się okaże, że faktycznie za parę lat ktoś wchodzący do branży nawet nie będzie musiał znać teorii za bardzo stojącej za tym, bo gdzieś tam dużo rzeczy już będzie zaszytych.

Aga:
Drag and drop będzie. Hahaha.

Sylwana:
Trochę tak.

Aga:
Czyli aktualnie korzystasz po prostu z edytora kodu, tak? I rozumiem, że korzystasz różnych bibliotek, ale po prostu piszesz kod i bawisz się danymi?

Sylwana:
Tak! Tak, no bo właściwie cały czas większość mojej pracy to jest zrozumienie danych. Załóżmy, że np. ktoś przychodzi do mnie i chciałby mieć algorytm do analizy anomalii, że np. ktoś upadł, a on ma te dane z żyroskopu i akcelerometru. No to zanim wrzucę to do jakiejś sieci neuronowej, to chciałabym najpierw sama zrozumieć co tam właściwie z tych danych, co świadczy o upadku. Więc po pierwsze oczywiście muszę poprosić klienta, żeby mi pokazał gdzie był upadek. A to też nie jest czasami oczywiste. Czasami prosi, żebyśmy my sami poszukali. Ale jak już znajdziemy, to zanim zacznę oczekiwać od sieci neuronowej, że znajdzie mi ten upadek, to muszę sama mózgiem jakby organoleptycznie go znaleźć, bo inaczej to byłoby ciężko oczekiwać czegoś od sieci, jeśli ja sama tego nie widzę. To cały czas jesteśmy trochę na tym etapie, że jednak jak mózg zobaczy, to wtedy dopiero wiemy, jak przetłumaczyć to sieci, w jaki sposób, na jakie liczby to ubrać. Więc cały czas tak naprawdę większość mojej pracy to jest siedzenie w tych danych, wizualizowanie ich na różny sposób, wyciąganie różnych statystyk itd., żebym najpierw to ja znalazła ten wzorzec. Jak już go znajdę, to już jest troszeczkę z górki. Albo jeszcze odszumianie danych to też jest ciekawe, no bo załóżmy, że to jest właśnie ten case osoby, która nie wiemy, czy upadła. No to jeśli np. się potknie albo np. się zatrzyma, bo jest, nie wiem, usiądzie na ławce, albo się zatrzyma, bo jest czerwone światło, no to to są takie rzeczy, które też algorytm mógłby uznać, że coś jest nietypowego, ale no jednak jest typowe. Więc to jest taki bardzo życiowy problem właściwie, na zasadzie musimy jakby dużo odrobić pracy samej, domowej w tym zanim w ogóle cokolwiek z takich bardziej fancy metod tam zastosujemy.

Paulina:
A czy możesz zdradzić, dlaczego firma chce wiedzieć, kiedy ktoś upadł? W sensie po co? Po co komuś takie dane?

Sylwana:
Można chociażby wziąć pod uwagę case Appla i iWatcha. Nie wiem, czy kojarzycie, tam jest taki algorytm, który sprawdza czy ktoś nie upadł, bo od razu dzwoni na pogotowie, automatycznie. Więc może być tak, że np. chcesz wykupić tą usługę swoim dziadkom, bo chcesz czuć, że troszeczkę o nich lepiej zadbałaś i że jak coś się stanie, to i pogotowie, i Ty zostaniesz powiadomiona. Więc np. taki może use case. Albo np. ktoś, kto jest rekonwalescentem po operacji i chcemy sprawdzić czy to się przyjęło, czy już coraz mniej kuleje. No to to też mogłoby być, potencjalnie wyobrażam sobie. Może nie w Polsce na NFZ póki co, ale może kiedyś.

Aga:
Hahaha! Super.

Sylwana:
Chociaż to też, by the way, jest ciekawy wątek, że właściwie potencjalnie AI mogłoby troszeczkę odciążyć lekarzy. I słyszałam, że np. amerykańscy lekarze nie są aż tacy wszyscy przeciwko właśnie tym algorytmom, bo mówią, że są już tak obłożeni pracą, że tak właściwie to chcieliby, żeby gdzieś tam coś tam zautomatyzować, bo i tak będą mieli od cholery, a przynajmniej ktoś tam trochę coś uprości.

NLP czyli analiza tekstu

Aga:
Tak, no jakieś stawianie diagnoz na podstawie takich naprawdę, że tak powiem regularnych case'ów, nie jakiś tam anomalii. tak jak mówisz, no to myślę, że faktycznie może sporo ułatwić i przyspieszyć im pracę. A Sylwana powiedz, bo wspominałaś o tych wyzwaniach, a jestem ciekawa, jakie są Twoje takie ulubione wątki w Twojej pracy? Takie jakieś tematy, które Ty najbardziej lubisz? Czy to obszary, czy to jak już mówiłaś poddziedziny z data science, które sprawiają Ci najwięcej frajdy?

Sylwana:
Na ten moment cały czas, już od jakiegoś czasu najbardziej lubię algorytmy związane z NLP, czyli analizą tekstu.

Aga:
Jakbyś mogła jeszcze rozwinąć skrót.

Sylwana:
Neuro-linguistic programming, chyba. Ale czekajcie właśnie to wygooglam, bo ja nigdy nie wiem. Ja zawsze mówię tym skrótem. Słuchajcie...

Aga:
Hahaha spoko!

Sylwana:
What is NLP machine learning? Okej...

Aga:
To jest Natural Processing Language może?

Sylwana:
Tak, bo chodzi o to, że są dwa NLP. Jedno to jest to takie bardziej psychologiczne.

Aga:
Poczekaj. NLP to będzie Natural Language Processing.

Sylwana:
Natural Language Processing. Okej. Dobra, czyli przed chwilą właśnie zmyślałam jakiś inny skrót. Byłam totalnie Chatem GPT przez moment.

Paulina:
Ale fajny był, fajny.

Sylwana:
Dziękuję. Więc to jest działka, które zajmuje się oczywiście analizą tekstu. Tworzy tzw. korpusy językowe, które są jakby takim przepisem na język, czyli to są takie wielkie macierze, gdzie każde słowo dostaje swój zespół, zestaw liczb, które go opisują. Tak jakby przepis na słowo. I te liczby są skorelowane ze sobą mocno wtedy, kiedy słowa są blisko siebie tak znaczeniowo. No i w sumie no tak jakby w takim bardzo, bardzo dużym uproszczeniu, na tym też bazują dzisiejsze modele GPT. Tworzą te wielkie korpusy, gdzie bardzo inteligentnie dopasowujesz, co jest blisko czego. I to co mnie najbardziej w tym jara to to, że te modele są odwzorowaniem nas jako ludzi, jako naszego zbioru całej wiedzy, naszego myślenia o świecie. No bo one się uczą na np. forach internetowych, na wszystkim, co piszemy w sieci. Więc te korpusy są jakby esencją tego, kim my jesteśmy, jak myślimy, jakie mamy uprzedzenia nawet. Wszystkim takim, więc dla mnie to jest fajne, bo to jest połączenie ścisłej dziedziny z jakąś taką totalnie socjologiczną odmianą tego i takim ujęciem. Bardzo mnie to jara. Akurat aż tak dużo nie pracuję w dziale takim językowym w tym momencie, tym NLP, ale za każdym razem jak mam okazję, to się staram, bo to jest dla mnie zawsze takie bardzo... że nie tylko siedzę w tych liczbach, ale też to jest cały czas ten ludzki wątek w tym wszystkim.

Aga:
Tak, to prawda. To jest fascynujące, bo jak sobie pomyślę o chociażby naszej bańce i naszej grupie znajomych, no to a propos korpusów językowych, to jest coś takiego, że ludzie używają słowa wakajki, nie? I jakby jest to już jakieś nacechowanie. Po prostu, jak ktoś mówi wakajki, to ja już wiem, jaka to jest osoba, w co się ubiera. Proste przełożenie między słownictwem, którego używamy, a tym, nie wiem, jakby jaki mamy styl, co lubimy, jak spędzamy czas i kim się otaczamy. Więc myślę, że to jest fascynujące.

Sylwana:
Tak! I myślę, że właśnie wakajki słowo też totalnie, jestem prawie pewna, że w tym modelu korpusu tego największego GPT obecnie, gdzieś tam jest ten czynnik, który to łączy właśnie z tym stylem całym. Tak samo jak, no nie wiem, ktoś tam wpisał, że się zjarał do Chata GPT, żeby się wyluzował ten Chat. No to ten Chat też zaczął od razu w ogóle mylić słowa i być taki właśnie ciapkowaty. Napisał słowo komputer przez n.

Aga:
Hahaha!

Paulina:
Hahaha! Konkuter.

Aga:
Konputer.

Sylwana:
To brzmi naprawdę jak... te wakajki gdzieś tam na pewno siedzą, wiesz.

Aga:
Tak siedzą, no super! Super, super!

Dzień z życia data scientist

Paulina:
A powiedz jeszcze, wracając też do Twoich projektów, jeszcze chciałam trochę podrążyć, jak wygląda Twoja praca w praktyce? To znaczy siadasz do komputera, do biurka i co robisz?

Sylwana:
Na początku otwieram dane i pytam, w czym to jest zaszyfrowane, bo np. nie mogę tego tworzyć, nie? Okazało się ostatnio, że to było 5 różnych typów szyfrów, więc się czułam jak w pokoju zagadek tylko dla programistów jakiegoś kodowania w sensie danych, że tam są różne typy kodowania, jakeś tam dwójkowe itd. To jest takie śmieszne, bo to akurat faktycznie było ostatnio naszym pierwszym krokiem - po prostu zrozumieć, jak w ogóle otworzyć dane i przeczytać. I później wiesz, czekanie 8 godzin jak nasz klient wstanie, bo jest w Stanach i odpowie. Później, no po prostu patrzę w te dane, czyli używam tych np. bibliotek, które wcześniej wymieniłam, żeby je jakoś tam wyplotować, wyprintować, wizualnie pokazać jakieś tam wykresy, z czego się składają te dane. Jeśli to są dane obrazowe, no to też przeglądam po prostu tą galerię tych zdjęć. Później, no to jak to są big data, jest ich tak dużo, że nie dam rady tego przejrzeć wszystkiego, no to już np. jakieś statystyki z tego zbieram po to, żeby móc zobaczyć np. załóżmy to są dane z jakimiś łodziami pływającymi, no to mogłabym szybko zrobić jakąś sieć, która sprawdza, na ilu z tych obrazów są te łodzie, albo jak dużo tych obrazów jest podobnych. Więc to już się trochę robi z tego czasami challenge, jak zrozumieć dane, które są w tak ogromnej ilości, że nie jesteś ich obejrzeć fizycznie, więc musisz je przetłumaczyć na coś maszynowego, żeby poniekąd jakby pośrednio w ten sposób zrozumieć, co masz z tych danych. No a później to już zależy trochę od celu, nie? Co klient by chciał zrobić, to wtedy zaczyna się trochę taka burza mózgów, np. z osobami z projektu. Jakieś takie pierwsze wstępne podziały, np. ty zrób research na temat tego, jak się teraz podchodzi do tego problemu, ty zrób nam bazę danych na te dane. Więc ktoś tam będzie bardziej siedział tak inżyniersko, a ktoś bardziej będzie siedział w artykułach naukowych i zobaczy to, jak się teraz czy mamy jakieś nowinki np. z ostatniego pół roku, jak się do tego podchodzi.

Paulina:
A czy zdarza Ci się pracować też z kimś w duecie albo w jakimś większym zespole, na zasadzie też takiej burzy mózgów trochę, że gdzieś tam wspólnie szukacie pomysłu, jak ugryźć te dane?

Sylwana:
Tak, tak! I to praktycznie zawsze się dzieje u nas w projekcie. Czasami też z tym wychodzimy, gdzieś tak trochę zagarniając sobie z innych projektów, bo może ktoś tam to robił. Zresztą z grubsza wiemy, kto co robi, więc wiemy do kogo podejść, kogo podpytać. Rozrysowujemy to czasami na takich ścianach, które mamy tak specjalnie zrobione, żeby po nich móc malować. Później to fajnie na callach z klientami wygląda, bo tam właśnie rozpisujemy jakieś rzeczy i to wygląda bardzo fancy.

Aga:
Aa! Szyba, flamaster i zastanawiająca się mina.

Sylwana:
Tak! Tak, tak.

Aga:
Jak ze stocka.

Sylwana:
Tak, tak. Tylko czasami jakoś tak losowo jakąś całkę dopiszemy, żeby to jeszcze mądrzej wyglądało.

Aga:
Ooo dobre!

Paulina:
Czyli pracujecie stacjonarnie, czy zdalnie Też się zdarza?

Sylwana:
Zdalnie też, ale pierwotnie większość osób była z Łodzi zatrudniona, więc też sporo osób siłą rzeczy jest w biurze. Ale tak zdalnie, zdalnie oczywiście też. Chociaż rzeczywiście nic chyba nie zastąpi takiego efektu kuchennego, że rozmawiasz z kimś w kuchni, jak ktoś inny podsłucha i Ci podrzuci inny pomysł. To to jest rzeczywiście nieocenione. Jeszcze nie udało nam się tego odtworzyć w zdalnej pracy. Chociaż mamy taki event w kalendarzu - virtual coffee i tam faktycznie można sobie wbić na calla, i po prostu pogadać o pierdołach. Ale mimo wszystko gdzieś tam efektywniej to idzie, jak się jest na miejscu.

O pewnym chirurgu

Aga:
A taka najdziwniejsza rzecz, która kiedyś wyszła z Twoich analiz czy raportów, którą możesz się podzielić, która Ciebie zaskoczyła albo w ogóle była taka od czapy?

Sylwana:
Nie wiem czy od czapy. Może dobra, jest jedna rzecz od czapy, ale nie mogę się nią podzielić chyba. Nie wiem, czy mogę tak do końca.

Aga:
To nie.

Sylwana:
Ale jest jedna rzecz, która była ciekawa tak na zasadzie takiej logistyki zbierania danych. Prosiliśmy klienta, żeby nam zrobił zdjęcie takiego zestawu chirurgicznego, takich narzędzi chirurgicznych, żeby to zrobił tak z góry na dół to zdjęcie po prostu w sali operacyjnej. Robiliśmy aplikację, która miała rozpoznawać, czy wszystkie narzędzia są w skrzyneczce odłożone na miejsce, czy przypadkiem ktoreś nie zostało zaszyte w pacjencie.

Aga:
O Boże! Hahaha!

Sylwana:
Hahaha tak! Albo czy gdzieś tam się nie wala po podłodze, bo te narzędzia są ogólnie drogie, więc bardziej im się opłacało zrobić aplikację z AI, która rozpoznaje. I co się okazało? Bo ogólnie mieliśmy taki problem, że ten klient był bardzo taki nieposłuszny, w sensie nie wysyłał nam danych prosto z góry, tylko zawsze gdzieś tak pod kątem. I co się okazało później, po czasie, że nie mógł zrobić z góry. Bo my go poprosiliśmy o zdjęcie z góry, z sali operacyjnej, a on mówi, że nie może, bo pyłek mógłby zlecić z telefonu i ubrudzić te narzędzia, a przecież one już były wyczyszczone do operacji, nie? Więc to jest ciekawe, że takie nie siedzisz w tym świecie i nie wiesz o tym, w ogóle nie pomyślisz o tym.

Aga:
Tak, no to jest właśnie to poznanie domeny. Przez to musisz przejść, żeby... albo właśnie dowiesz się w trakcie, bo skąd masz wiedzieć, jak nie jesteś chirurgiem.

Sylwana:
Tak.

Paulina:
A wydaje się, że krnąbrny klient.

Sylwana:
No właśnie, więc zwracam mu honor. Chociaż pewnie tego nie słucha, bo siedzi i operuje. Dlatego to się w ogóle fajnie przydaje, jak mamy osoby, które są np. po inżynierii biomedycznej u nas w firmie.

Paulina:
Jak Aga na przykład.

Aga:
Mogłabym do Was przyjść. Także jakiś stażyk czy coś, chętna jestem!

Sylwana:
Zapraszamy serdecznie.

Aga:
Haha super!

Paulina:
A to jeszcze pociągnę w takim razie ten wątek, bo powiedziałaś, że zaprojektowaliście im aplikację, czy to znaczy, że Wy działacie też trochę jak software house, że robicie produkty i macie developerów, i projektantów u siebie w firmie?

Sylwana:
Tak!

Paulina:
Aaa.

Sylwana:
Tak jest, tak robimy, właśnie tak mamy. No!

Aga:
Fajnie, fajnie, fajnie.

Paulina:
Czyli można się do Was zgłosić jako np. product designerzy?

Sylwana:
Myślę, że jak najbardziej.

Aga:
Ooo!

Paulina:
No to słuchajcie.

Aga:
No to słuchajcie!

Paulina:
Jest okazja na ciekawą pracę.

Instagram Sylwany

Aga:
Albo jako osoby zaintrygowane data science. No i właśnie Sylwana, super opowiadasz w ogóle o tym, co robisz. To jest mega fascynujące i założę się, że po wysłuchaniu tego podcastu wiele osób będzie googlować, jak zostać data scientist. W takim razie taka pigułka od Sylwany, co zrobić, żeby być data scientistem.

Sylwana:
Ja kiedyś takiej rady udzieliłam na Instagramie u siebie i myślę, że jest w miarę aktualna.

Aga:
To odsyłamy. Sylwana, opowiedz, gdzie Cię znaleźć.

Sylwana:
A, gdzie mnie znaleźć? Możecie mnie znaleźć na Instagramie przede wszystkim - @programistka_AI. Pewnie gdzieś tam będzie w opisie.

Aga:
Będzie, zalinkujemy oczywiście.

Sylwana:
Dziękuję serdecznie. Tak, także tam myślę, że możecie znaleźć... posty to bardziej piszę takie merytoryczne, ale stories to już są zazwyczaj takie bardziej albo backstage mojej pracy, albo w ogóle mojego życia, więc uprzedzam, że tam dużo off-topów będzie. To jest głównie to miejsce. Myślę nad blogiem ogólnie, ale nie chcę jeszcze się zobowiązywać, bo później już będę miała w głowie cały czas, że już obiecałam, to muszę zrobić, więc na razie nic nie ten, ale na pewno na Instagramie dam znać.

Aga:
To w skrócie jeszcze powiedz to, co jest na Instagramie. Takie highlighty główne, tak żeby zostawić słuchaczy i słuchaczki z jakimiś takimi highlightami.

Sylwana:
Ogólnie moje nachylenie jest takie, że chciałabym po pierwsze, żeby ludzie rozumieli troszkę co się dzieje w AI tak bardziej w sposób popularno-naukowy, ale jednak z perspektywy osoby, która to faktycznie programuje. Więc tego mogą się spodziewać, jakby połączenie trochę tych dwóch światów. No i jak mogliście pewnie trochę wyczuć, kręcą mnie trochę takie rzeczy bardziej społeczniackie w kontekście AI. Więc też tam bardziej czasami staram się przemycić wątki odpowiedzialności społecznej AI, a już tak stricte na case'ach takich z życia czy te z mojego, czy takiego właśnie, co się słyszy w mediach czasem.

Cyberbezpieczeńtwo - cel Sylwany na najbliższy czas

Paulina:
A powiedz Sylwana, w czym chciałabyś się teraz rozwijać? Jakby na rozwoju jakich umiejętności chcesz się skupić w najbliższym czasie, czy to w obszarze właśnie AI, czy data science, czy może coś innego?

Sylwana:
Taka moja najbardziej aktualna podjarka jest związana z cyberbezpieczeństwem. I mam taki pomysł, że gdyby miała tak ekstra dwie godziny dziennie, to bym na to poświęciła, żeby troszeczkę się w to wgłębić, żeby połączyć to z moją obecną wiedzą i jakby połączyć siły tutaj, i na przykład pójść tą branżę, ale już z wiedzą taką związaną z machine learningiem, żeby np. trochę bardziej inteligentnie wykrywać anomalie czy coś w tym stylu. To jest na ten moment taka trochę moja wkrętka osobista.

Aga:
A coś więcej opowiesz o tym cyberbezpieczeństwie? Jakieś takie wątki? Ważne hasło, ale dla wielu osób może się kojarzyć dosyć tak nerdowsko.

Sylwana:
Wiesz co, póki co dla mnie ten moment też. Ja też jestem na tym etapie, na razie wczesnym. Więc jeszcze nie będę się wygłupiać, mówiąc więcej. Może umówmy się, że po prostu następnym razem jak pogadamy, to już wtedy opowiem trochę więcej.

Aga:
Ekstra, super! To w takim razie Sylwana, mocno trzymamy kciuki, żebyś miała te dwie godziny dziennie więcej w życiu, na naukę. No i oczywiście kibicujemy mega! Zapraszam wszystkich na Twój Instagram - @programistka_AI. No i mamy nadzieję, że do zobaczenia przy kolejnych okazjach. Wielkie dzięki za te wszystkie pomidory i garnki. Mam nadzieję, że teraz już jest jasne czym jest, gdzie leży AI, gdzie jest uczenie maszynowe i czym jest sieć neuronowa.

Sylwana:
Super, cieszę się. Dzięki serdeczne!

Paulina:
Dzięki wielkie!

Aga:
Dzięki!

Paulina:
Bardzo dziękujemy Wam za wysłuchanie tego odcinka. Notatki i linki do niego znajdziecie na naszej stronie: designpractice.pl/029.

Aga:
Jeśli podoba Wam się nasz podcast, koniecznie subskrybujcie go w swojej ulubionej platformie podcastowej lub na YouTube. Śmiało zostawcie też swoje wrażenia w komentarzach czy to na Spotify, czy na Apple Podcasts, czy na YouTube. Możecie dodać opinię do całego podcastu. Będziemy Wam za to na maksa wdzięczne!

Paulina:
A na nowe odcinki możecie liczyć w każdy pierwszy i 15. dzień miesiąca. Pamiętajcie też o zapisaniu się do newslettera, żeby nie przegapić żadnego nowego odcinka. Wejdźcie na designpractice.pl i do usłyszenia za dwa tygodnie!

👂

Posłuchaj innych odcinków podcastu

098

Augustynka

⏰

50:37

Frajda z eksplorowania i tworzenie dla dużych marek

W tym odcinku rozmawiamy:

o eksploracji swojego stylu i rzucaniu się na głęboką wodę
o uwalnianiu czasu kreatywnego dzięki agencji
oo budowaniu Instagrama na miarę ponad 100 000 followersów

Partnerem dzisiejszego odcinka jest palarnia kawy specialty COFFEE PLANT.

🎧

Posłuchaj

097

Beata Kurek

⏰

1:14:38

Jak kształtować swoją ścieżkę i edukację projektową

W tym odcinku rozmawiamy:

o wyzwaniach w edukacji projektowej
o tym, dlaczego warto uczyć się kaligrafii
o tym, na jakie umiejętności stawiać w wymagającej branży projektowej

Partnerem dzisiejszego odcinka jest palarnia kawy specialty COFFEE PLANT.

🎧

Posłuchaj

ZGarnij materiały

Dołącz do społeczności 20 tysięcy designerek i designerów 🤯 i otrzymaj „Finansownik freelancera” i nasz super „Ćwiczeniownik UX’’, zupełnie za fri! 🎉 Co 2 tygodnie wyślemy Ci też newsletter pełen konkretów z obszaru product designu! 😍

Zapisując się, akceptujesz politykę prywatności.

Praca data scientist

📔 Książki:

🔗 Linki:

👤 Osoby:

💻 Firmy:

🧠 Pojęcia:

💡 Wskazówki i rady:

🔧 Narzędzia:

Data science, sieć neuronowa - co to jest?

Praca data scientist

Kto korzysta z usług data scientist?

Ścieżka kariery data scientist

Digica i początki data science w Polsce

Wyzwania w data science

Bias danych

O AI, zagrożeniach i Chacie GPT

Narzędzia, z których korzysta data scientist

NLP czyli analiza tekstu

Dzień z życia data scientist

O pewnym chirurgu

Instagram Sylwany

Cyberbezpieczeńtwo - cel Sylwany na najbliższy czas

Frajda z eksplorowania i tworzenie dla dużych marek

Jak kształtować swoją ścieżkę i edukację projektową

ZGarnij materiały

Już prawie!

Frajda z eksplorowania i tworzenie dla dużych marek