VISTA: Enhancing Long-Duration and High-Resolution Video Understanding by Video Spatiotemporal Augmentation

Guardado en:
Bibliografiske detaljer
Udgivet i:arXiv.org (Dec 1, 2024), p. n/a
Hovedforfatter: Ren, Weiming
Andre forfattere: Yang, Huan, Min, Jie, Cong, Wei, Chen, Wenhu
Udgivet:
Cornell University Library, arXiv.org
Fag:
Online adgang:Citation/Abstract
Full text outside of ProQuest
Tags: Tilføj Tag
Ingen Tags, Vær først til at tagge denne postø!