JailBench

Extensive Dataset: Contains 10,800 test questions specifically designed to evaluate the jailbreak capabilities of large language models.
Multi-Domain Coverage: The dataset encompasses five primary domains and 40 subdomains, ensuring comprehensive evaluation across various fields.
Security Assessment: Provides a robust framework for assessing the security performance of large language models against jailbreak attacks.
Research Contribution: Open-source access to the dataset encourages further research and development in AI security.

JailBench is a comprehensive Chinese dataset for assessing jailbreak attack risks in large language models.