Multimodal Learning from Videos: Self-Supervised Pre-Training, Post-Training Alignment, and Benchmarks

Shranjeno v:

Bibliografske podrobnosti
izdano v:	ProQuest Dissertations and Theses (2025)
Glavni avtor:	Sarkar, Pritam
Drugi avtorji:	Posen, Aaron, Beirami, Ahmad, Ebrahimi, Sayna, Arık, Sercan, Pfister, Tomas
Izdano:	ProQuest Dissertations & Theses
Teme:	Behavior Datasets Video recordings Optimization Work at home Cognitive load Cognition & reasoning Robotics COVID-19 Experiments Knowledge Neural networks Pandemics Multiple choice Benchmarks Preferences Supervision Design Methods Linguistics Mental health Annotations Large language models Learning Artificial intelligence Cognitive psychology Epidemiology Film studies Management
Online dostop:	Citation/Abstract Full Text - PDF
Oznake:	Označite Brez oznak, prvi označite!

Komentirajte kot prvi!