Get our free extension to see links to code for papers anywhere online!Free add-on: code for papers everywhere!Free add-on: See code for papers anywhere!

Add to Chrome

Add to Firefox

Add to Edge

Title:Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

Oct 18, 2024

Jiacheng Ye, Jiahui Gao, Shansan Gong, Lin Zheng, Xin Jiang, Zhenguo Li, Lingpeng Kong

Figure 1 for Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

Figure 2 for Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

Figure 3 for Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

Figure 4 for Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

Share this with someone who'll enjoy it:

Abstract:Autoregressive language models, despite their impressive capabilities, struggle with complex reasoning and long-term planning tasks. We introduce discrete diffusion models as a novel solution to these challenges. Through the lens of subgoal imbalance, we demonstrate how diffusion models effectively learn difficult subgoals that elude autoregressive approaches. We propose Multi-granularity Diffusion Modeling (MDM), which prioritizes subgoals based on difficulty during learning. On complex tasks like Countdown, Sudoku, and Boolean Satisfiability Problems, MDM significantly outperforms autoregressive models without using search techniques. For instance, MDM achieves 91.5\% and 100\% accuracy on Countdown and Sudoku, respectively, compared to 45.8\% and 20.7\% for autoregressive models. Our work highlights the potential of diffusion-based approaches in advancing AI capabilities for sophisticated language understanding and problem-solving tasks.

View paper on

Share this with someone who'll enjoy it:

Title:Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

Paper and Code