Unleashing the Unseen: Harnessing Benign Datasets for Jailbreaking Large Language Models

Guardat en:

Dades bibliogràfiques
Publicat a:	arXiv.org (Dec 19, 2024), p. n/a
Autor principal:	Zhao, Wei
Altres autors:	Li, Zhe, Li, Yige, Sun, Jun
Publicat:	Cornell University Library, arXiv.org
Matèries:	Feature extraction Datasets Alignment Large language models
Accés en línia:	Citation/Abstract Full text outside of ProQuest
Etiquetes:	Afegir etiqueta Sense etiquetes, Sigues el primer a etiquetar aquest registre!

Sigues el primer a deixar un comentari!