Karol J. Piczak
Search
K

Prace dyplomowe

Proponowane i realizowane tematy prac dyplomowych.

Tematyka prac

  • sztuczne sieci neuronowe, uczenie maszynowe,
  • klasyfikacja dźwięku,
  • biologiczne inspiracje w sieciach neuronowych.

Tematy obecnie realizowane przez dyplomantów

[MGR] Continual learning in audio classification tasks

[MGR] Plastyczność modeli sztucznych sieci neuronowych w uczeniu ciągłym

[MGR] Kompresja modeli klasyfikacji dźwięku

[INŻ] Aplikacja internetowa do rozpoznawania progresji akordów za pomocą metod sztucznej inteligencji

[INŻ] Aktywne uczenie modeli klasyfikacji dźwięku

Zarys problemu
Cel i etapy pracy
Wykorzystywane narzędzia
Uczenie aktywne (active learning) jest formą uczenia maszynowego, w którym algorytm uczący może interaktywnie pytać użytkownika o etykiety dla wybranych przykładów. Ta forma jest szczególnie użyteczna, gdy dysponujemy zbiorem danych bez adnotacji, a koszt ręcznego etykietowania całego zbioru danych jest zbyt duży.
Celem pracy jest stworzenie prostej aplikacji webowej, która umożliwiałaby interaktywne uczenie modelu sztucznej sieci neuronowej, implementacja wybranego modelu klasyfikatora dźwiękowego oraz porównanie technik dobierania przykładów do interaktywnej adnotacji pod kątem uzyskiwanej oszczędności (liczby etykietowanych przykładów koniecznych do uzyskania oczekiwanej dokładności na zbiorze walidacyjnym).
  • Języki programowania: Python 3.7+, JavaScript/TypeScript
  • Biblioteki ML: Pytorch lub TensorFlow
  • Frameworki: Flask lub Django (ewentualnie Dash)
  • Repozytorium kodu: GitHub.com lub zakładowy GitLab
  • Edycja pracy: LaTeX (np. przez Overleaf.com)
  • Sprzęt: W ramach zasobów Zakładu Sztucznej Inteligencji dostęp do systemu z GPU GeForce RTX 2080 Super (Ubuntu)

[INŻ] Klasyfikacja nagrań dźwiękowych ptaków za pomocą modeli ze skupianiem uwagi

Zarys problemu
Cel i etapy pracy
Wykorzystywane narzędzia
Charakterystyczną cechą problemu klasyfikacji gatunków ptaków w nagraniach dźwiękowych jest niewielki udział użytecznego sygnału uczącego (poszczególnych wokalizacji) w stosunku do całości nagrania (zarówno w dziedzinie czasu, jak i częstotliwości). W takiej sytuacji jednym ze sposobów poprawy efektów uczenia sztucznych sieci neuronowych jest mechanizm skupiania uwagi (attention mechanism), który koncentruje sieć na najważniejszych fragmentach nagrania.
Celem pracy jest stworzenie systemu rozpoznawania gatunków ptaków w nagraniach dźwiękowych wykorzystującego sieci neuronowe z mechanizmem skupiania uwagi oraz zweryfikowanie działania systemu na przykładowych nagraniach. Potencjalnym rozszerzeniem pracy może być zgłoszenie systemu w cyklicznym konkursie BirdCLEF.
  • Języki programowania: Python 3.7+
  • Biblioteki ML: Pytorch lub TensorFlow
  • Repozytorium kodu: GitHub.com lub zakładowy GitLab
  • Edycja pracy: LaTeX (np. przez Overleaf.com)
  • Sprzęt: W ramach zasobów Zakładu Sztucznej Inteligencji dostęp do systemu z GPU GeForce RTX 2080 Super (Ubuntu)