Active learning with imbalanced data and uncertain annotations
- Speaker(s)
- Daniel Kałuża
- Affiliation
- MIMUW
- Date
- Jan. 26, 2024, 4:15 p.m.
- Room
- room 4060
- Seminar
- Seminar Intelligent Systems
Celem aktywnego uczenia jest uzyskanie jak najlepszego modelu uczenia maszynowego w przypadkach ograniczonego budżetu na etykietowanie danych, przy założeniu możliwości iteracyjnego proszenia ekspertów etykietujących dane o oetykietowanie wybranych obiektów. Podczas seminarium przedstawię podstawowe pojęcia z dziedziny aktywnego uczenia, wraz z głównymi wynikami mojej rozprawy doktorskiej. Opiszę teorię stojącą za opracowanymi metodami wyboru obiektów, ze szczególnym uwzględnieniem metod biorących pod uwagę niezbalansowanie danych. Przedstawię wytworzone algorytmy przydzielania etykiet dla zbiorów z rzadkimi i niepewnymi anotacjami od wielu ekspertów. Opracowane metody zostaną zaprezentowane na tle metod referencyjnych pokazując porównania ich jakości na przykładowych ogólnie dostępnych zbiorach.