Un-ViTAStereo: cientistas planeiam criar uma rede neural autoaprendente capaz de se adaptar a diferentes ambientes
Investigadores do MFTI e de centros de investigação internacionais desenvolveram uma nova tecnologia de visão estereoscópica, a Un-ViTAStereo, que permite a robots e carros autónomos perceber o mundo em 3D e sem zonas cegas. Segundo a assessoria de imprensa do MFTI, o algoritmo calcula a distância aos objetos sem recorrer a lidar caros nem a rotulagem manual, tornando a solução mais acessível e versátil.
A Un-ViTAStereo é treinada com o modelo Depth Anything V2, que estima a profundidade relativa dos objetos a partir de uma única imagem, identificando sombras, perspetiva e sobreposições. Desta forma, o algoritmo seleciona apenas as previsões que estão em linha com as pistas do “professor”, o que melhora a precisão do sistema.
O sistema funciona em três fases: verificação de cada pixel quanto à correspondência com as pistas, procura de vizinhos verdes para os pontos vermelhos e construção de contornos com recurso a uma função de suavização da disparidade. Como resultado, a proporção de erros grosseiros no teste de veículos autónomos KITTI 2015 desceu para 5%, menos 23% do que os erros perigosos na determinação das distâncias aos objetos.
No MFTI salientam que a versão atual da Un-ViTAStereo é apenas o ponto de partida. Os cientistas planeiam criar uma rede neural autoaprendente, capaz de se adaptar a diferentes ambientes, e utilizar medições precisas de lidar para aumentar a exatidão. A nova tecnologia abre amplas perspetivas para reforçar a segurança e a funcionalidade dos sistemas autónomos. O estudo foi publicado em IEEE Transactions on Circuits and Systems for Video Technology.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário