Get our free extension to see links to code for papers anywhere online!Free add-on: code for papers everywhere!Free add-on: See code for papers anywhere!

Add to Chrome

Add to Firefox

Add to Edge

Title:Towards Learning Universal Hyperparameter Optimizers with Transformers

May 26, 2022

Yutian Chen, Xingyou Song, Chansoo Lee, Zi Wang, Qiuyi Zhang, David Dohan, Kazuya Kawakami, Greg Kochanski, Arnaud Doucet, Marc'aurelio Ranzato(+2 more)

Figure 1 for Towards Learning Universal Hyperparameter Optimizers with Transformers

Figure 2 for Towards Learning Universal Hyperparameter Optimizers with Transformers

Figure 3 for Towards Learning Universal Hyperparameter Optimizers with Transformers

Figure 4 for Towards Learning Universal Hyperparameter Optimizers with Transformers

Share this with someone who'll enjoy it:

Abstract:Meta-learning hyperparameter optimization (HPO) algorithms from prior experiments is a promising approach to improve optimization efficiency over objective functions from a similar distribution. However, existing methods are restricted to learning from experiments sharing the same set of hyperparameters. In this paper, we introduce the OptFormer, the first text-based Transformer HPO framework that provides a universal end-to-end interface for jointly learning policy and function prediction when trained on vast tuning data from the wild. Our extensive experiments demonstrate that the OptFormer can imitate at least 7 different HPO algorithms, which can be further improved via its function uncertainty estimates. Compared to a Gaussian Process, the OptFormer also learns a robust prior distribution for hyperparameter response functions, and can thereby provide more accurate and better calibrated predictions. This work paves the path to future extensions for training a Transformer-based model as a general HPO optimizer.

View paper on

OpenReview

Share this with someone who'll enjoy it:

Title:Towards Learning Universal Hyperparameter Optimizers with Transformers

Paper and Code