OmDet: Large-scale vision-language multi-dataset pre-training with multimodal detection network

Guardat en:

Dades bibliogràfiques
Publicat a:	arXiv.org (Feb 25, 2024), p. n/a
Autor principal:	Zhao, Tiancheng
Altres autors:	Liu, Peng, Lee, Kyusong
Publicat:	Cornell University Library, arXiv.org
Matèries:	Language Taxonomy Datasets Computer vision Object recognition Natural language (computers) Pascal (programming language) Knowledge representation Training
Accés en línia:	Citation/Abstract Full text outside of ProQuest
Etiquetes:	Afegir etiqueta Sense etiquetes, Sigues el primer a etiquetar aquest registre!

Sigues el primer a deixar un comentari!