English

Optimizing Deep Learning in Marine Entities Classification

Norges teknisk-naturvitenskapelige universitet ()

https://hdl.handle.net/11250/3191247

Forfatter (1)
  1. Katja Sivertsen
Bidragsyter (1)
  1. Keith Downing

Abstract

Zooplankton spiller en sentral rolle i marine økosystemer. Studier av deres atferdsmønstre kan gi verdifull innsikt i større økologiske prosesser. Spesialiserte bildesystemer har gjort det mulig å samle inn store datasett av zooplankton og andre marine organismer. Analysen av disse datasettene og klassifisering av marine arter er derfor en viktig og krevende oppgave. Dyplæringsmetoder er et naturlig valg for å møte denne utfordringen. Datasettet som benyttes i denne oppgaven, innhentet gjennom bildeinnsamlingssystemet ZooScan, byr på flere betydelige utfordringer. Mens noen arter er hyppig representert, noe som reflekterer deres naturlige overflod, er andre sparsommelig samplet, noe som resulterer i en betydelig ubalanse i datasettet. Videre viser enkelte zooplanktonkategorier stor variasjon innenfor sin egen kategori, noe som gjør det utfordrende for et dyplæringssystem å identifisere klare særtrekk. Høye likheter mellom enkelte kategorier gjør dem vanskelige å skille, selv for en menneskelig observatør. I tillegg er en stor andel av bildene i dataset av sværtdårlig kvalitet, noe som ytterligere øker kompleksiteten i klassifiseringsoppgaven. Selv om datasyn er et felt i rask utvikling, med avanserte arkitekturer og teknikker som viser utmerket ytelse på referansedatasett, skiller disse referansedatasetene seg ofte vesentlig fra egenskapene til marine bilder. Denne oppgaven fokuserer på å identifisere dyplæringsmetoder som er egnet for å møte de unike utfordringene med dyreplanktonklassifisering. I tillegg til standard veiledede dyplæringsmetoder, utforsker denne oppgaven potensialet til selvveiledede metoder i dyreplanktondomenet. Storskala selvveiledet forhåndstrening har vist betydelig suksess i datasynsoppgaver. Ved å lære direkte fra dataene kan modeller trekke ut meningsfull innsikt og overføre denne kunnskapen til andre oppgaver, og krever kun en brøkdel av manuelt merkede data for å oppnå topp ytelse. Å redusere avhengigheten av omfattende manuell datamerking er spesielt verdifull i domener som krever ekspertkunnskap. Offentlig tilgjengelige dyreplanktondatasett, kombinert med det store datasettet som brukes i denne oppgaven, gir en mulighet til å utforske denne tilnærmingen. Med erkjennelse av domenegapet, undersøker denne oppgaven om selvveiledet forhåndstrening innen domene på dyreplanktonbilder kan gi ytelsesgevinster sammenlignet med generisk forhåndstrening.

Fra , siste endring

Registrert i Nasjonalt vitenarkiv