أرسل هذا في رسالة قصيرة: SyncFlow: Toward Temporally Aligned Joint Audio-Video Generation from Text