multi-task learning – Optimization Online

Alternate Training of Shared and Task-Specific Parameters for Multi-Task Neural Networks

Published: 2024/01/08

Stefania Bellavia

Nonlinear Optimization, Stochastic Programming multi-task learning, neural networks, stochastic gradient

This paper introduces novel alternate training procedures for hard-parameter sharing Multi-Task Neural Networks (MTNNs). Traditional MTNN training faces challenges in managing conflicting loss gradients, often yielding sub-optimal performance. The proposed alternate training method updates shared and task-specific weights alternately, exploiting the multi-head architecture of the model. This approach reduces computational costs, enhances training regularization, and … Read more

Trace Norm Regularization: Reformulations, Algorithms, and Multi-task Learning

Published: 2009/06/26, Updated: 2010/03/21

Convex Optimization, Data-Mining, Semi-definite Programming convex optimization, duality, gene expression pattern analysis, multi-task learning, proximal gradient method, semidefinite programming, trace norm regularization

We consider a recently proposed optimization formulation of multi-task learning based on trace norm regularized least squares. While this problem may be formulated as a semidefinite program (SDP), its size is beyond general SDP solvers. Previous solution approaches apply proximal gradient methods to solve the primal problem. We derive new primal and dual reformulations of … Read more