VISTA: Enhancing Long-Duration and High-Resolution Video Understanding by Video Spatiotemporal Augmentation

Gorde:
Xehetasun bibliografikoak
Argitaratua izan da:arXiv.org (Dec 1, 2024), p. n/a
Egile nagusia: Ren, Weiming
Beste egile batzuk: Yang, Huan, Min, Jie, Cong, Wei, Chen, Wenhu
Argitaratua:
Cornell University Library, arXiv.org
Gaiak:
Sarrera elektronikoa:Citation/Abstract
Full text outside of ProQuest
Etiketak: Etiketa erantsi
Etiketarik gabe, Izan zaitez lehena erregistro honi etiketa jartzen!