Posts tagged "Adversarial attacks"

August 1, 2025arxiv.org

Cats Confuse Reasoning LLM: Query Agnostic Adversarial Triggers for Reasoning Models↗

The original "cat attack" paper, showing that out of distribution terms in the prompt massively degrade LLM performance including guardian LLMs used for defensive purposes, opening advesarial attack opportunities.

AI security Artificial Intelligence Adversarial attacks

Georg's Blog

Tagged: Adversarial attacks

Cats Confuse Reasoning LLM: Query Agnostic Adversarial Triggers for Reasoning Models↗