Enhancing Temporal Understanding in Audio Question Answering for Large Audio Language Models

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:arXiv.org (Dec 13, 2024), p. n/a
1. Verfasser: Sridhar, Arvind Krishna
Weitere Verfasser: Guo, Yinyi, Visser, Erik
Veröffentlicht:
Cornell University Library, arXiv.org
Schlagworte:
Online-Zugang:Citation/Abstract
Full text outside of ProQuest
Tags: Tag hinzufügen
Keine Tags, Fügen Sie das erste Tag hinzu!