Search
Collection
Category
Tag
Blog
Pricing
Submit

Newsletter

Join the Community

Subscribe to our newsletter for the latest news and updates

Email

AISecKit

Curated AI security tools & LLM safety resources for cybersecurity professionals

Product

Search
Collection
Category
Tag

Resources

Blog
Pricing
Submit

Tools

🔥Marathons Tools

Company

About Us
Privacy Policy
Terms of Service
Sitemap

Copyright © 2025 All Rights Reserved.

Home
Category
EuroBERT

EuroBERT

EuroBERT is a multilingual encoder model designed for European languages, trained using the Optimus training library.

image for EuroBERT

Introduction

Information

Publisher
AISecKit
Websitegithub.com
Published date2025/04/28

Categories

AI Models
AI Research Papers
AI Development Frameworks

Tags

Fine-tuning
Open Source
AI Standards
AI Hardware
Multimodal AI
Model Evaluation

More Products

prompt.fail

Explore prompt injection techniques in large language models (LLMs), providing examples to improve LLM security and robustness.

Prompt Injection Model Robustness Compliance Risk Assessment Security Frameworks+1

Learn Prompt Hacking

The most comprehensive prompt hacking course available, focusing on prompt engineering and security.

Prompt Engineering AI Ethics Generative AI Security Best Practices LLM Security

LangKit

An open-source toolkit for monitoring Large Language Models (LLMs) with features like text quality and sentiment analysis.

Prompt Injection Model Robustness Security Auditing Open Source LLM

EuroBERT: Scaling Multilingual Encoders for European Languages

EuroBERT is a multilingual encoder model specifically designed for European languages, leveraging the Optimus training library for efficient training across various hardware configurations, including CPU, AMD, and NVIDIA GPUs.

Key Features:

Hardware Agnostic: Seamlessly train on CPU, AMD, or NVIDIA hardware.
Resumable Training: Continue training regardless of hardware or environment changes.
Scalable Distributed Training: Supports Fully Sharded Data Parallel (FSDP), Distributed Data Parallel (DDP), and other parallelism strategies.
Comprehensive Data Processing: Includes utilities for tokenization, packing, subsampling, and dataset inspection.
Highly Customizable: Fine-tune model architecture, training, and data processing with extensive configuration options.
Performance Optimizations: Implements advanced techniques like mixed precision training, fused operations, and optimizations such as Liger Kernel and Flash Attention.

Benefits:

Efficiently process and train multilingual datasets.
Flexible installation options for developers.
Extensive documentation and tutorials available for users.

Highlights:

Supports a wide range of configurations for different training scenarios.
Provides a fair and consistent framework for evaluating and comparing encoder models.