Get our free extension to see links to code for papers anywhere online!Free add-on: code for papers everywhere!Free add-on: See code for papers anywhere!

Add to Chrome

Add to Firefox

Add to Edge

Title:PluralLLM: Pluralistic Alignment in LLMs via Federated Learning

Mar 13, 2025

Mahmoud Srewa, Tianyu Zhao, Salma Elmalaki

Figure 1 for PluralLLM: Pluralistic Alignment in LLMs via Federated Learning

Figure 2 for PluralLLM: Pluralistic Alignment in LLMs via Federated Learning

Figure 3 for PluralLLM: Pluralistic Alignment in LLMs via Federated Learning

Figure 4 for PluralLLM: Pluralistic Alignment in LLMs via Federated Learning

Share this with someone who'll enjoy it:

Abstract:Ensuring Large Language Models (LLMs) align with diverse human preferences while preserving privacy and fairness remains a challenge. Existing methods, such as Reinforcement Learning from Human Feedback (RLHF), rely on centralized data collection, making them computationally expensive and privacy-invasive. We introduce PluralLLM a federated learning-based approach that enables multiple user groups to collaboratively train a transformer-based preference predictor without sharing sensitive data, which can also serve as a reward model for aligning LLMs. Our method leverages Federated Averaging (FedAvg) to aggregate preference updates efficiently, achieving 46% faster convergence, a 4% improvement in alignment scores, and nearly the same group fairness measure as in centralized training. Evaluated on a Q/A preference alignment task, PluralLLM demonstrates that federated preference learning offers a scalable and privacy-preserving alternative for aligning LLMs with diverse human values.

View paper on

Share this with someone who'll enjoy it:

Title:PluralLLM: Pluralistic Alignment in LLMs via Federated Learning

Paper and Code