The Best Your Ultimate AI Security Toolkit

Curated AI security tools & LLM safety resources for cybersecurity professionals

AI ModelsAI Application PlatformsAI Security Monitoring

Visit Website

PromptCARE

Details

Implementation of the PromptCARE framework for watermark injection and verification for copyright protection.

Prompt Engineering Open Source Model Watermarking

AI ModelsInput Validation & FilteringPrompt Injection Defense

Visit Website

StruQ

Details

Official implementation of StruQ, which defends against prompt injection attacks using structured queries.

Fine-tuning Prompt Injection Model Robustness Security Auditing Open Source+1

AI Research PapersModel Robustness EnhancementPrompt Injection Defense

Visit Website

InjecGuard

Details

The official implementation of InjecGuard, a tool for benchmarking and mitigating over-defense in prompt injection guardrail models.

Prompt Injection Model Robustness Compliance Safety Alignments Security Auditing+2

image of gandalf-prompt-injection-writeup

AI ModelsAI Application PlatformsPrompt Injection Defense

Visit Website

gandalf-prompt-injection-writeup

Details

A writeup for the Gandalf prompt injection game.

Prompt Injection Model Robustness

Security ResearchAI Security MonitoringPrompt Injection Defense

Visit Website

llm-security-prompt-injection

Details

This project investigates the security of large language models by classifying prompts to discover malicious injections.

Prompt Injection Model Robustness Risk Assessment LLM Adversarial Examples

AI Research PapersModel Robustness EnhancementPrompt Injection Defense

Visit Website

SecAlign

Details

Repo for the research paper "SecAlign: Defending Against Prompt Injection with Preference Optimization"

Prompt Injection Model Robustness Security Auditing Adversarial Examples LLM Security

AI ModelsAI Security MonitoringModel Robustness Enhancement

Visit Website

Universal-Prompt-Injection

Details

The official implementation of a pre-print paper on prompt injection attacks against large language models.

Prompt Injection Model Robustness LLM Research Papers

AI Application PlatformsInput Validation & FilteringPrompt Injection Defense

Visit Website

llm-prompt-injection-filtering

Details

Uses the ChatGPT model to filter out potentially dangerous user-supplied questions.

AI Ethics Prompt Injection Model Robustness Input Validation API Security

Input Validation & FilteringAI Research PapersAdversarial Example Detection

Visit Website

Tensor Trust

Details

A prompt injection game to collect data for robust ML research.

Prompt Injection Model Robustness

Security Research

Visit Website

arc_pi_taxonomy

Details

The Arcanum Prompt Injection Taxonomy provides a structured taxonomy of prompt injection attacks.

AI Ethics Prompt Injection Security Auditing Incident Response Red Team Testing+1

AI ModelsSecurity ResearchModel Robustness Enhancement

Visit Website

BIPIA

Details

A benchmark for evaluating the robustness of LLMs and defenses to indirect prompt injection attacks.

AI Ethics Prompt Injection Model Robustness Responsible AI LLM

Incident Response ToolsPenetration TestingPrompt Injection Defense

Visit Website

Project Mantis

Details

Project Mantis is a tool designed to counter LLM-driven cyberattacks using prompt injection techniques.

Prompt Injection Open Source Threat Intelligence

The Best Your Ultimate AI Security Toolkit

All Categories

No Filter

Sort by Time (dsc)

All Categories

No Filter

Sort by Time (dsc)

PromptCARE

StruQ

InjecGuard

gandalf-prompt-injection-writeup

llm-security-prompt-injection

SecAlign

Universal-Prompt-Injection

llm-prompt-injection-filtering

Tensor Trust

arc_pi_taxonomy

BIPIA

Project Mantis

PromptCARE

StruQ

InjecGuard

gandalf-prompt-injection-writeup

llm-security-prompt-injection

SecAlign

Universal-Prompt-Injection

llm-prompt-injection-filtering

Tensor Trust

arc_pi_taxonomy

BIPIA

Project Mantis

The Best Your Ultimate AI Security Toolkit

All Categories

No Filter

Sort by Time (dsc)

All Categories

No Filter

Sort by Time (dsc)

PromptCARE

StruQ

InjecGuard

gandalf-prompt-injection-writeup

llm-security-prompt-injection

SecAlign

Universal-Prompt-Injection

llm-prompt-injection-filtering

Tensor Trust

arc_pi_taxonomy

BIPIA

Project Mantis

Newsletter

Join the Community

PromptCARE

StruQ

InjecGuard

gandalf-prompt-injection-writeup

llm-security-prompt-injection

SecAlign

Universal-Prompt-Injection

llm-prompt-injection-filtering

Tensor Trust

arc_pi_taxonomy

BIPIA

Project Mantis