Título
Real time multiple camera person detection and tracking
Autor
Baikova, Dária
Resumo
pt
À medida que a quantidade de dados de vídeo cresce, os esforços para criar sistemas
inteligentes capazes de observar, entender e extrapolar informação útil destes dados
intensifcam-se. Nomeadamente, sistemas de detecção e tracking de objectos têm
sido uma àrea amplamente investigada nos últimos anos. No presente trabalho,
desenvolvemos um protótipo de tracking multi-câmara, multi-objecto que corre em
tempo real, e que usa várias câmaras fish-eye estáticas de topo, com sobreposição
entre elas. O objetivo é criar um sistema capaz de extrapolar de modo inteligente
e automático as trajetórias de pessoas a partir de imagens de vigilância. Para
resolver estes problemas, utilizamos diferentes tipos de técnicas, nomeadamente,
uma combinação do poder representacional das redes neurais, que têm produzido
excelentes resultados em problemas de visão computacional nos últimos anos, e
algoritmos de tracking mais clássicos e já estabelecidos, para representar e seguir o
percurso dos objectos de interesse. Em particular, dividimos o problema maior em
dois sub-problemas: tracking de objetos de uma única câmera e tracking de objetos
de múltiplas câmeras, que abordamos de modo modular. A nossa motivação a
longo prazo é implmentar este tipo de sistema em aplicações comerciais, como
áreas comerciais ou aeroportos, para que possamos dar mais um passo em direcção
a sistemas de vigilância visual inteligentes.
en
As the amount of video data grows larger every day, the efforts to create intelligent
systems able to perceive, understand and extrapolate useful information from this
data grow larger, namely object detection and tracking systems have been a widely
researched area in the past few years. In the present work we develop a real time,
multiple camera, multiple person detection and tracking system prototype, using
static, overlapped, sh-eye top view cameras. The goal is to create a system able
to intelligently and automatically extrapolate object trajectories from surveillance
footage. To solve these problems we employ different types of techniques, namely
a combination of the representational power of deep neural networks, which have
been yielding outstanding results in computer vision problems over the last few
years, and more classical, already established object tracking algorithms in order
to represent and track the target objects. In particular, we split the problem in
two sub-problems: single camera multiple object tracking and multiple camera
multiple object tracking, which we tackle in a modular manner. Our long-term
motivation is to deploy this system in a commercial application, such as commercial
areas or airports, so that we can build upon intelligent visual surveillance systems.