Tag

Explore by tags

All

Academic Research

Access Control

Adversarial Examples

Agents

AI Alignment

AI Augmentation

AI Browser

AI Communities

AI Conferences

AI Education

AI Ethics

AI Funding

AI Hardware

AI Jobs

AI Reasoning

AI Regulations

AI SDKs

AI Standards

API Integration

API Security

Application Security

Authentication

Authorization

Autonomous Systems

Backdoor Detection

Bias Mitigation

Bug Bounty

CCPA

Certifications

Claude

Cloud Security

Code Assistants

Compliance

Confidential Computing

Consent Management

Container Security

Content Creation

Content Moderation

DALL-E

Dark Web Monitoring

Data Anonymization

Data Minimization

Data Poisoning

Data Privacy

De-identification

DevSecOps

Differential Privacy

Digital Forensics

Document Processing

Edge AI

Embeddings

Encryption

Endpoint Security

Explainability

Exploit Development

Federated Learning

Fine-tuning

Foundation Models

GDPR

Gemini

Generative AI

Governance

GPT Models

Homomorphic Encryption

Human Oversight

Incident Response

Industry Reports

Infrastructure Security

Input Validation

Jailbreak Detection

Kubernetes Security

Llama Models

LLM

LLM Security

Local Models

Low-code AI

Market Analysis

Midjourney

Mixtral

ML Ops

Model Evaluation

Model Isolation

Model Obfuscation

Model Robustness

Model Watermarking

Monitoring

Multi-agent Systems

Multimodal AI

Multimodal LLMs

Multimodal Security

Neuro-symbolic AI

Observable AI

Open Source

Output Safety

Penetration Testing

Physical Security

Privacy by Design

Privacy Engineering

Privacy Preserving ML

Prompt Engineering

Prompt Injection

Quantum Machine Learning

RAG

Recon

Red Team Operations

Red Team Testing

Reinforcement Learning

Reporting

Research Papers

Responsible AI

Reverse Engineering

Risk Assessment

Safety Alignments

Safety Guardrails

Secure APIs

Secure Deployment

Secure Infrastructure

Secure MLOps

Secure MPC

Security Auditing

Security Benchmarks

Security Best Practices

Security Firms

Security Frameworks

Security Testing

Security Visualization

Self-hosted

Self-supervised Learning

SIEM Tools

Social Engineering

Speech-to-Text

Stable Diffusion

Summarization

Synthetic Data

Text-to-Audio

Text-to-Code

Text-to-Image

Text-to-Video

Threat Intelligence

Threat Modeling

Training

Vector Database

Voice Assistants

Vulnerability Disclosure

Vulnerability Scanning

Wireless Security

Zero Trust

image of Universal and Transferable Adversarial Attacks on Aligned Language Models

AI Research PapersAI Security MonitoringAdversarial Example Detection

Visit Website

Universal and Transferable Adversarial Attacks on Aligned Language Models

Details

This paper discusses new methods for generating transferable adversarial attacks on aligned language models, improving LLM security.

AI Ethics Model Robustness Jailbreak Detection Security Auditing LLM+1

Security ResearchData Privacy ProtectionAI Security Monitoring

Visit Website

JailBench

Details

JailBench is a comprehensive Chinese dataset for assessing jailbreak attack risks in large language models.

Model Robustness Jailbreak Detection Risk Assessment Open Source Security Benchmarks

AI Research PapersAI Security MonitoringPrompt Injection Defense

Visit Website

AIPromptJailbreakPractice

Details

AIPromptJailbreakPractice is a GitHub repository documenting AI prompt jailbreak practices.

Prompt Engineering AI Ethics Jailbreak Detection Security Auditing Open Source

AI ModelsAI Application Platforms

Visit Website

Awesome_GPT_Super_Prompting

Details

A GitHub repository focused on ChatGPT jailbreaks, prompt leaks, and prompt security techniques.

Prompt Engineering Jailbreak Detection

AI Application PlatformsAI Research Papers

Visit Website

prompt-hacker-collections

Details

A GitHub repository for prompt attack-defense, prompt injection, and reverse engineering notes and examples.

Prompt Injection Model Robustness Jailbreak Detection Reverse Engineering Security Best Practices

AI ModelsAI Application PlatformsAI Productivity Tools

Visit Website

The Big Prompt Library

Details

A collection of prompts, system prompts, and LLM instructions for various AI models.

Prompt Engineering AI Ethics Jailbreak Detection LLM Generative AI

AI ModelsAI Security MonitoringPrompt Injection Defense

Visit Website

vigil-jailbreak-ada-002

Details

A dataset containing embeddings for jailbreak prompts used to assess LLM vulnerabilities.

Prompt Injection Model Robustness Compliance Jailbreak Detection Risk Assessment+1

image of rubend18/ChatGPT-Jailbreak-Prompts

AI ModelsAI Application PlatformsAI Security Monitoring

Visit Website

rubend18/ChatGPT-Jailbreak-Prompts

Details

A dataset of jailbreak-related prompts for ChatGPT, aiding in understanding and generating text in this context.

AI Ethics Prompt Injection Model Robustness Jailbreak Detection Security Auditing+2

image of jackhhao/jailbreak-classification

AI ModelsAI Application PlatformsJailbreak Prevention

Visit Website

jackhhao/jailbreak-classification

Details

Dataset for classifying prompts as jailbreak or benign to enhance LLM safety.

AI Ethics Prompt Injection Model Robustness Jailbreak Detection Security Auditing+1

AI ModelsAI Application PlatformsAI Ethics Resources

Visit Website

gpt_jailbreak_status

Details

This repository provides updates on the status of jailbreaking the OpenAI GPT language model.

AI Ethics Jailbreak Detection Open Source

AI ModelsAI Application PlatformsAI Ethics Resources

Visit Website

ChatGPT_DAN

Details

ChatGPT DAN is a GitHub repository for jailbreak prompts that allow ChatGPT to bypass restrictions.

Prompt Engineering AI Ethics Jailbreak Detection

Model Backdoor DefenseAI Security MonitoringJailbreak Prevention

Visit Website

Awesome-Jailbreak-on-LLMs

Details

A collection of state-of-the-art jailbreak methods for LLMs, including papers, codes, datasets, and analyses.

Model Robustness Jailbreak Detection Exploit Development Security Auditing Open Source+1