Tag

Explore by tags

All

Academic Research

Access Control

Adversarial Examples

Agents

AI Alignment

AI Augmentation

AI Browser

AI Communities

AI Conferences

AI Education

AI Ethics

AI Funding

AI Hardware

AI Jobs

AI Reasoning

AI Regulations

AI SDKs

AI Standards

API Integration

API Security

Application Security

Authentication

Authorization

Autonomous Systems

Backdoor Detection

Bias Mitigation

Bug Bounty

CCPA

Certifications

Claude

Cloud Security

Code Assistants

Compliance

Confidential Computing

Consent Management

Container Security

Content Creation

Content Moderation

DALL-E

Dark Web Monitoring

Data Anonymization

Data Minimization

Data Poisoning

Data Privacy

De-identification

DevSecOps

Differential Privacy

Digital Forensics

Document Processing

Edge AI

Embeddings

Encryption

Endpoint Security

Explainability

Exploit Development

Federated Learning

Fine-tuning

Foundation Models

GDPR

Gemini

Generative AI

Governance

GPT Models

Homomorphic Encryption

Human Oversight

Incident Response

Industry Reports

Infrastructure Security

Input Validation

Jailbreak Detection

Kubernetes Security

Llama Models

LLM

LLM Security

Local Models

Low-code AI

Market Analysis

Midjourney

Mixtral

ML Ops

Model Evaluation

Model Isolation

Model Obfuscation

Model Robustness

Model Watermarking

Monitoring

Multi-agent Systems

Multimodal AI

Multimodal LLMs

Multimodal Security

Neuro-symbolic AI

Observable AI

Open Source

Output Safety

Penetration Testing

Physical Security

Privacy by Design

Privacy Engineering

Privacy Preserving ML

Prompt Engineering

Prompt Injection

Quantum Machine Learning

RAG

Recon

Red Team Operations

Red Team Testing

Reinforcement Learning

Reporting

Research Papers

Responsible AI

Reverse Engineering

Risk Assessment

Safety Alignments

Safety Guardrails

Secure APIs

Secure Deployment

Secure Infrastructure

Secure MLOps

Secure MPC

Security Auditing

Security Benchmarks

Security Best Practices

Security Firms

Security Frameworks

Security Testing

Security Visualization

Self-hosted

Self-supervised Learning

SIEM Tools

Social Engineering

Speech-to-Text

Stable Diffusion

Summarization

Synthetic Data

Text-to-Audio

Text-to-Code

Text-to-Image

Text-to-Video

Threat Intelligence

Threat Modeling

Training

Vector Database

Voice Assistants

Vulnerability Disclosure

Vulnerability Scanning

Wireless Security

Zero Trust

Security ResearchAI Security MonitoringPrompt Injection Defense

Visit Website

llm-security-prompt-injection

Details

This project investigates the security of large language models by classifying prompts to discover malicious injections.

Prompt Injection Model Robustness Risk Assessment LLM Adversarial Examples

AI Research PapersModel Robustness EnhancementPrompt Injection Defense

Visit Website

SecAlign

Details

Repo for the research paper "SecAlign: Defending Against Prompt Injection with Preference Optimization"

Prompt Injection Model Robustness Security Auditing Adversarial Examples LLM Security

AI ModelsAI Security MonitoringModel Robustness Enhancement

Visit Website

Universal-Prompt-Injection

Details

The official implementation of a pre-print paper on prompt injection attacks against large language models.

Prompt Injection Model Robustness LLM Research Papers

AI Application PlatformsInput Validation & FilteringPrompt Injection Defense

Visit Website

llm-prompt-injection-filtering

Details

Uses the ChatGPT model to filter out potentially dangerous user-supplied questions.

AI Ethics Prompt Injection Model Robustness Input Validation API Security

Input Validation & FilteringAI Research PapersAdversarial Example Detection

Visit Website

Tensor Trust

Details

A prompt injection game to collect data for robust ML research.

Prompt Injection Model Robustness

Security Research

Visit Website

arc_pi_taxonomy

Details

The Arcanum Prompt Injection Taxonomy provides a structured taxonomy of prompt injection attacks.

AI Ethics Prompt Injection Security Auditing Incident Response Red Team Testing+1

AI ModelsSecurity ResearchModel Robustness Enhancement

Visit Website

BIPIA

Details

A benchmark for evaluating the robustness of LLMs and defenses to indirect prompt injection attacks.

AI Ethics Prompt Injection Model Robustness Responsible AI LLM

Incident Response ToolsPenetration TestingPrompt Injection Defense

Visit Website

Project Mantis

Details

Project Mantis is a tool designed to counter LLM-driven cyberattacks using prompt injection techniques.

Prompt Injection Open Source Threat Intelligence

Data Privacy ProtectionAI Security MonitoringPrompt Injection Defense

Visit Website

STEGOSAURUS-WRECKS

Details

A steganography tool for encoding images as prompt injections for AIs with vision capabilities.

Prompt Injection Open Source Data Privacy

AI Application PlatformsAI Image ToolsAI Development Frameworks

Visit Website

prompt_injection

Details

Custom node for ComfyUI enabling specific prompt injections within Stable Diffusion UNet blocks.

Fine-tuning Prompt Injection Stable Diffusion Generative AI

AI Security MonitoringPrompt Injection Defense

Visit Website

PINT Benchmark

Details

A benchmark for evaluating prompt injection detection systems.

Prompt Injection Model Robustness Compliance Security Auditing Generative AI+1

Security Research

Visit Website

Prompt-Hacking-Resources

Details

A curated list of resources for AI Red Teaming, Jailbreaking, and Prompt Injection.

Prompt Injection Model Robustness Safety Alignments Adversarial Examples