Prace dyplomowe

Proponowane tematy prac dyplomowych.

[inż.] Aktywne uczenie modeli klasyfikacji dźwięku

Zarys problemu

Uczenie aktywne (active learning) jest formą uczenia maszynowego, w którym algorytm uczący może interaktywnie pytać użytkownika o etykiety dla wybranych przykładów. Ta forma jest szczególnie użyteczna, gdy dysponujemy zbiorem danych bez adnotacji, a koszt ręcznego etykietowania całego zbioru danych jest zbyt duży.

Cel i etapy pracy

Celem pracy jest stworzenie prostej aplikacji webowej, która umożliwiałaby interaktywne uczenie modelu sztucznej sieci neuronowej, implementacja wybranego modelu klasyfikatora dźwiękowego oraz porównanie technik dobierania przykładów do interaktywnej adnotacji pod kątem uzyskiwanej oszczędności (liczby etykietowanych przykładów koniecznych do uzyskania oczekiwanej dokładności na zbiorze walidacyjnym).

Wykorzystywane narzędzia

  • Języki programowania: Python 3.7+, JavaScript/TypeScript

  • Biblioteki ML: Pytorch lub TensorFlow

  • Frameworki: Flask lub Django (ewentualnie Dash)

  • Repozytorium kodu: GitHub.com lub zakładowy GitLab

  • Edycja pracy: LaTeX (np. przez Overleaf.com)

  • Sprzęt: W ramach zasobów Zakładu Sztucznej Inteligencji dostęp do systemu z GPU GeForce RTX 2080 Super (Ubuntu)

[inż.] Klasyfikacja nagrań dźwiękowych ptaków za pomocą modeli ze skupianiem uwagi

Zarys problemu

Charakterystyczną cechą problemu klasyfikacji gatunków ptaków w nagraniach dźwiękowych jest niewielki udział użytecznego sygnału uczącego (poszczególnych wokalizacji) w stosunku do całości nagrania (zarówno w dziedzinie czasu, jak i częstotliwości). W takiej sytuacji jednym ze sposobów poprawy efektów uczenia sztucznych sieci neuronowych jest mechanizm skupiania uwagi (attention mechanism), który koncentruje sieć na najważniejszych fragmentach nagrania.

Cel i etapy pracy

Celem pracy jest stworzenie systemu rozpoznawania gatunków ptaków w nagraniach dźwiękowych wykorzystującego sieci neuronowe z mechanizmem skupiania uwagi oraz zweryfikowanie działania systemu na przykładowych nagraniach. Potencjalnym rozszerzeniem pracy może być zgłoszenie systemu w cyklicznym konkursie BirdCLEF.

Wykorzystywane narzędzia

  • Języki programowania: Python 3.7+

  • Biblioteki ML: Pytorch lub TensorFlow

  • Repozytorium kodu: GitHub.com lub zakładowy GitLab

  • Edycja pracy: LaTeX (np. przez Overleaf.com)

  • Sprzęt: W ramach zasobów Zakładu Sztucznej Inteligencji dostęp do systemu z GPU GeForce RTX 2080 Super (Ubuntu)