Czy opisy firm w Wikipedii są neutralne? Narzędzia do analizy wydźwięku w praktyce

Wikipedia stanowi jedno z popularnych źródeł informacji na różne tematy. Ze względu na swoją otwartą strukturę edycyjną, zapewnienie neutralnego punktu widzenia (ang. Neutral Point of View, NPOV) w artykułach może stanowić istotne wyzwanie. Jedną z metod oceny neutralności artykułów jest analiza wydźwięku, czyli analiza nacechowania emocjonalnego treści.
W ramach publikacji pt. „Sentiment Analysis of Wikipedia Articles About Companies: A Comparison of Different Models” została przeprowadzona analiza porównawcza różnych modeli analizy wydźwięku – zarówno tych opartych na słownikach (TextBlob, VADER), jak i bardziej zaawansowanych modeli opartych na transformerach (RoBERTa, DistilBERT oraz PySentimiento). Autorzy publikacji: dr Milena Stróżyna, dr Włodzimierz Lewoniewski, mgr Izabela Czumałowska, mgr inż. Aleksandra Wojewoda.
W ramach badania przeprowadzono szczegółowy proces selekcji artykułów, ich wstępnego przetwarzania oraz zaproponowano trzy różne metody agregacji wyników analizy wydźwięku. Wyniki pokazały, że ocena w dużym stopniu zależy zarówno od zastosowanego modelu, jak i specyfiki branży, do której należy opisywana firma. Uzyskane wyniki mogą dostarczyć praktyczne wskazówki dla badaczy oraz praktyków zainteresowanych analizą wydźwięku, szczególnie w odniesieniu do długich tekstów, takich jak artykuły Wikipedii. Badanie to stanowi wkład w lepsze zrozumienie możliwości i ograniczeń różnych modeli do analizy wydźwięku.