Get our free extension to see links to code for papers anywhere online!Free add-on: code for papers everywhere!Free add-on: See code for papers anywhere!

Add to Chrome

Add to Firefox

Add to Edge

Title:Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models

Mar 17, 2025

Xiaojun Jia, Sensen Gao, Simeng Qin, Ke Ma, Xinfeng Li, Yihao Huang, Wei Dong, Yang Liu, Xiaochun Cao

Figure 1 for Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models

Figure 2 for Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models

Figure 3 for Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models

Figure 4 for Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models

Share this with someone who'll enjoy it:

Abstract:Large pre-trained vision-language models (VLMs), such as CLIP, demonstrate impressive generalization but remain highly vulnerable to adversarial examples (AEs). Previous work has explored robust text prompts through adversarial training, achieving some improvement in both robustness and generalization. However, they primarily rely on singlegradient direction perturbations (e.g., PGD) to generate AEs, which lack diversity, resulting in limited improvement in adversarial robustness. To address these limitations, we propose an evolution-based region adversarial prompt tuning method called ER-APT, which combines gradient methods with genetic evolution to generate more diverse and challenging AEs. In each training iteration, we first generate AEs using traditional gradient-based methods. Subsequently, a genetic evolution mechanism incorporating selection, mutation, and crossover is applied to optimize the AEs, ensuring a broader and more aggressive perturbation distribution.The final evolved AEs are used for prompt tuning, achieving region-based adversarial optimization instead of conventional single-point adversarial prompt tuning. We also propose a dynamic loss weighting method to adjust prompt learning efficiency for accuracy and robustness. Experimental evaluations on various benchmark datasets demonstrate the superiority of our proposed method, outperforming stateof-the-art APT methods. The code is released at https://github.com/jiaxiaojunQAQ/ER-APT.

View paper on

Share this with someone who'll enjoy it:

Title:Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models

Paper and Code