Prace dyplomowe
Proponowane i realizowane tematy prac dyplomowych.
- sztuczne sieci neuronowe, uczenie maszynowe,
- klasyfikacja dźwięku,
- biologiczne inspiracje w sieciach neuronowych.
Zarys problemu
Cel i etapy pracy
Wykorzystywane narzędzia
Uczenie aktywne (active learning) jest formą uczenia maszynowego, w którym algorytm uczący może interaktywnie pytać użytkownika o etykiety dla wybranych przykładów. Ta forma jest szczególnie użyteczna, gdy dysponujemy zbiorem danych bez adnotacji, a koszt ręcznego etykietowania całego zbioru danych jest zbyt duży.
Celem pracy jest stworzenie prostej aplikacji webowej, która umożliwiałaby interaktywne uczenie modelu sztucznej sieci neuronowej, implementacja wybranego modelu klasyfikatora dźwiękowego oraz porównanie technik dobierania przykładów do interaktywnej adnotacji pod kątem uzyskiwanej oszczędności (liczby etykietowanych przykładów koniecznych do uzyskania oczekiwanej dokładności na zbiorze walidacyjnym).
- Języki programowania: Python 3.7+, JavaScript/TypeScript
- Biblioteki ML: Pytorch lub TensorFlow
- Repozytorium kodu: GitHub.com lub zakładowy GitLab
- Sprzęt: W ramach zasobów Zakładu Sztucznej Inteligencji dostęp do systemu z GPU GeForce RTX 2080 Super (Ubuntu)
Zarys problemu
Cel i etapy pracy
Wykorzystywane narzędzia
Charakterystyczną cechą problemu klasyfikacji gatunków ptaków w nagraniach dźwiękowych jest niewielki udział użytecznego sygnału uczącego (poszczególnych wokalizacji) w stosunku do całości nagrania (zarówno w dziedzinie czasu, jak i częstotliwości). W takiej sytuacji jednym ze sposobów poprawy efektów uczenia sztucznych sieci neuronowych jest mechanizm skupiania uwagi (attention mechanism), który koncentruje sieć na najważniejszych fragmentach nagrania.
Celem pracy jest stworzenie systemu rozpoznawania gatunków ptaków w nagraniach dźwiękowych wykorzystującego sieci neuronowe z mechanizmem skupiania uwagi oraz zweryfikowanie działania systemu na przykładowych nagraniach. Potencjalnym rozszerzeniem pracy może być zgłoszenie systemu w cyklicznym konkursie BirdCLEF.
- Języki programowania: Python 3.7+
- Biblioteki ML: Pytorch lub TensorFlow
- Repozytorium kodu: GitHub.com lub zakładowy GitLab
- Sprzęt: W ramach zasobów Zakładu Sztucznej Inteligencji dostęp do systemu z GPU GeForce RTX 2080 Super (Ubuntu)
Last modified 2yr ago