Unleashing the Unseen: Harnessing Benign Datasets for Jailbreaking Large Language Models

Wedi'i Gadw mewn:

Manylion Llyfryddiaeth
Cyhoeddwyd yn:	arXiv.org (Dec 19, 2024), p. n/a
Prif Awdur:	Zhao, Wei
Awduron Eraill:	Li, Zhe, Li, Yige, Sun, Jun
Cyhoeddwyd:	Cornell University Library, arXiv.org
Pynciau:	Feature extraction Datasets Alignment Large language models
Mynediad Ar-lein:	Citation/Abstract Full text outside of ProQuest
Tagiau:	Ychwanegu Tag Dim Tagiau, Byddwch y cyntaf i dagio'r cofnod hwn!

Byddwch y cyntaf i adael sylw!