SKN Data Science: spotkanie inauguracyjne 2024/2025
Na początku spotkania dr hab. Agata Filipowska, prof. UEP, przedstawiła rolę współczesnego analityka biznesowego, który łączy wiedzę biznesową z umiejętnościami IT, aby tworzyć wartościowe rozwiązania dla organizacji. Współczesny analityk powinien rozumieć dane, prognozować trendy i rekomendować działania. Umiejętność programowania pozwala na analizę dużych zbiorów danych, automatyzację procesów oraz integrację danych z różnych źródeł. Wzrost znaczenia danych w biznesie sprawia, że pracodawcy coraz częściej poszukują analityków biznesowych z umiejętnościami programistycznymi.
Następnie dr hab. Krzysztof Węcel, prof. UEP, przedstawił zagadnienia związane z przetwarzaniem języka naturalnego. Szczególną uwagę w prezentacji poświęcono reprezentacji wektorowej słów, która pozwala na matematyczne odwzorowanie ich znaczenia. Ta metoda polega na przedstawieniu słów jako punktów w przestrzeni wielowymiarowej, gdzie każda współrzędna reprezentuje pewną cechę słowa. Popularne algorytmy, takie jak Word2Vec, GloVe czy FastText, uczą się tych reprezentacji na podstawie dużych korpusów tekstowych, wychwytując semantyczne i syntaktyczne zależności między słowami. W efekcie słowa o podobnym znaczeniu znajdują się blisko siebie w tej przestrzeni wektorowej.
Praktyczne wykorzystanie technik NLP przedstawiła mgr Izabela Czumałowska na przykładzie systemu rekomendacyjnego książek oraz analizy wydźwięku z wykorzystaniem języka programowania Python. Te systemy zostały opracowane i opisane w ramach prac dyplomowych (licencjackiej oraz magisterskiej) obronionych na Uniwersytecie Ekonomicznym w Poznaniu. Systemy rekomendacji książek analizują preferencje użytkowników, aby sugerować im nowe tytuły. Analiza wydźwięku pozwala zrozumieć emocjonalny ton recenzji oraz opinii czytelników. Znajomość analizy danych oraz programowania mogą umożliwić tworzenie coraz lepszych algorytmów rekomendacji oraz narzędzi do analizy wydźwięku, które mogą się przyczynić do podniesienia jakości towarów oraz świadczonych usług.
Możliwości otwartych danych oraz ograniczenia generatywnej sztucznej inteligencji (GenAI) omówił dr Włodzimierz Lewoniewski. W ramach prezentacji zostały przedstawione przykłady wykorzystania popularnych otwartych źródeł informacyjnych, które dają niemal nieograniczone możliwości dla badań i innowacji. Korzyści z ich wykorzystania obejmują dostęp do aktualnych informacji oraz przyspieszenie procesów decyzyjnych. Przygotowanie i analiza wielkiej ilości danych często wymaga umiejętności programowania. Ogólnodostępne narzędzia GenAI (takie jak ChatGPT, Gemini, Copilot, Claude) mogą ułatwić ten proces. Warto jednak pamiętać, że te narzędzia opierają się na danych, na których zostały wytrenowane oraz działają w ramach zdefiniowanych algorytmów. Programiści natomiast muszą tworzyć rozwiązania dla unikalnych problemów, które nie zawsze mają standardowe odpowiedzi. Dodatkowo analityka danych często wymaga głębokiego zrozumienia kontekstu biznesowego i kulturowego, interpretacji niejednoznacznych wyników, podejmowania decyzji w oparciu o niepewne dane. Ludzka kreatywność i zdolność do myślenia nieszablonowego są kluczowe w tych rolach i nie mogą być w pełni zastąpione przez GenAI.
Założenia aktywności studenckiego koła naukowego oraz propozycje obszarów działań na najbliższy rok akademicki przedstawił Patryk Danielewicz, przedstawiciel zarządu SKN Data Scienice. Planowane są m.in. warsztaty z podstaw programowania w języku Python, podstaw analizy danych, wizualizacji danych z wykorzystaniem dedykowanych bibliotek oraz przegląd algorytmów uczenia maszynowego wraz z ich praktycznym wykorzystaniem. W ramach zaplanowanych zajęć każdy uczestnik będzie miał możliwość realizacji własnych projektów związanych z analizą i przetwarzaniem danych.
Spotkanie inauguracyjne odbyło się w dniu 24 października 2024 roku. Celem koła naukowego jest propagowanie wśród studentów wiedzy na temat Data Science i analizy danych przy pomocy technologii informacyjnych, nauczanie i doskonalenie umiejętności studentów w zakresie programowania komputerów poprzez realizację projektów badawczych, podejmowanie współpracy z innymi organizacjami studenckimi w celu realizacji przedsięwzięć oraz wzajemnej wymiany doświadczeń.
Strona SKN Data Science na Facebooku: facebook.com/SKNDataScienceUEP