Classifying the behavior of wild red deer using accelerometers and machine learning methods
Abstract
Effektiv artsfredning krever at man forstår artens atferd og bevegelser. Noen arter, som for eksempel hjort (Cervus elaphus), kan være vanskelige å observere i naturen. Ved å gi informasjon om dyrenes bevegelser i tid og rom er telemetriutstyr som GPS-halsbånd et effektivt alternativ til direkte visuell observasjon. Det er imidlertid vanskelig å utlede et dyrs faktiske atferd utelukkende basert på GPS-data. Derfor har akselerometre blitt et vanlig tillegg i telemetrihalsbånd. De måler halsbåndets, og dermed dyrets, bevegelsesintensitet og gir dermed informasjon om dyrets aktivitet. I kombinasjon med en egnet klassifiseringsmodell kan akselerometre bidra til å bestemme faktisk atferd. Opplæring av en slik modell krever imidlertid at man observerer dyr med halsbånd som utøver denne atferden. Mens noen studier har generert binære modeller (aktiv vs. inaktiv) for ville hjortedyr, er det ennå ikke generert noen modeller for ville hjortedyr som kan skille mellom mer enn to atferder.
For å fylle dette tomrommet har jeg gjort omfattende observasjoner av hjortedyr med halsbånd i den Sveitsiske nasjonalparken (SNP), der de ofte er synlige på dagtid over tregrensen. Totalt 4 individer med halsbånd ga meg 160 timer med observasjoner, som jeg brukte til å trene ulike klassifiseringsmodeller. Dyrene bar GPS-halsbånd med akselerometre som gir en gjennomsnittlig akselerasjonsverdi over 5 minutters intervaller mellom 0 og 255. Jeg genererte 329 modeller ved hjelp av en kombinasjon av ulike inndata variabler (akselerasjonsverdier) og maskinlæringsalgoritmer, slik at jeg kunne sammenligne klassifiseringsnøyaktigheten. I tillegg evaluerte jeg om det er mulig å klassifisere om et dyr drøvtygger eller bestemme hodeposisjonen på vertikalaksen.
Den mest nøyaktige modellen jeg klarte å trene opp, hadde en total nøyaktighet på 95 %, og en atferdsspesifikk nøyaktighet på 95 % (beite), 95 % (ligge), 100 % (løpe), 100 % (gå) og 75 % (stå). Da jeg sammenlignet de ulike modellene, fant jeg at ingen algoritme eller kombinasjon av inndata variabler genererte en modell som var bedre enn alle andre kombinasjoner. Jeg klarte heller ikke å klassifisere drøvtygging eller vertikal hodeposisjon. Som et alternativ til den generelle nøyaktigheten som vanligvis brukes, har jeg laget en nøyaktighetsberegning kalt "makrobalansert nøyaktighet" for å håndtere den atferdsmessige ubalansen i datasettet vårt. Til slutt foreslo og brukte jeg en ny måte å håndtere det faktum at dyrets atferd sjelden samsvarer med varigheten av et akselerasjonsintervall på 5 minutter.
Den genererte klassifiseringsmodellen kan brukes i fremtidige studier for å generere aktivitetsbudsjetter for hjort og for å evaluere hvordan ulike faktorer, som menneskelig aktivitet eller klima, påvirker hjortens atferd. Effective conservation of a species requires understanding its behaviors and movements. Some species, such as the red deer (Cervus elaphus) can be difficult to observe in the wild. By providing information regarding the animals’ spatiotemporal movements, telemetry devices such as GPS collars are an effective alternative to direct visual observation. However, it is difficult to infer an animal’s actual behavior based purely on GPS data. As a result, accelerometers have become a common addition in telemetry collars. They measure the collar’s, and therefore, the animal’s intensity of movement and thus provide information regarding the animal’s activity. When combined with a suitable classification model, accelerometers can help determine actual behaviors. However, training such a model requires observing collared animals engaging in these behaviors. While some studies have generated binary models (active vs. inactive) for wild cervids, no models have yet been generated for wild cervids that can differentiate between more than two behaviors.
To fill this gap, I extensively observed collared wild red deer in the Swiss National Park (SNP), where they are often visible at daytime above the treeline. In total, 4 collared individuals provided 160 h of recorded observations, which I used to train various classification models. The animals wore GPS collars including accelerometers that provide an acceleration value averaged over 5 min intervals between 0 – 255. I generated 329 models using a combination of different input variables (acceleration values) and machine learning algorithms, which allowed me to compare their classification accuracy. In addition, I evaluated whether it is possible to classify an animal as ruminating or to determine its vertical head position.
The most accurate model that I was able to train had an overall accuracy of 95%, and behavior-specific balanced accuracies of 95% (feed), 95% (lie), 100% (run), 100% (walk), and 75% (stand). When comparing the different models, I found that no algorithm or combination of input variables generated a superior model to all other combinations. Further, I was unable to classify rumination or vertical head position. As an alternative to the commonly used overall accuracy, I provided an accuracy metric called the “macro balanced accuracy” to deal with the behavioral imbalance of our dataset. Finally, I proposed and used a novel way to deal with the fact that the animal’s behaviors rarely match-up with the duration of a 5 min acceleration interval.
The generated classification model may be used in future studies to generate activity budgets of wild red deer and to evaluate how different factors, such as human activity or climate, affect their behavior.