AIうぉ--!(ai-wo-katsuyo-shitai !)

AIを上手く使ってみせたい!!自分なりに。

2Transformerでなく、Transformer2乗。論文『TRANSFORMER2: SELF-ADAPTIVE LLMS』を読む。

[:contents]

論文『TRANSFORMER2: SELF-ADAPTIVE LLMS』

https://arxiv.org/pdf/2501.06252v2

概要

Self-adaptive large language models (LLMs) aim to solve the challenges posed by traditional fine-tuning methods, which are often computationally intensive and static in their ability to handle diverse tasks. We introduce Transformer2 , a novel self-adaptation framework that adapts LLMs for unseen tasks in real-time by selectively adjusting only the singular components of their weight matrices. During inference, Transformer2 employs a two-pass mechanism: first, a dispatch system identifies the task properties, and then task-specific “expert” vectors, trained using reinforcement learning, are dynamically mixed to obtain targeted behavior for the incoming prompt. Our method outperforms ubiquitous approaches such as LoRA, with fewer parameters and greater efficiency. Transformer2 demonstrates versatility across different LLM architectures and modalities, including vision-language tasks. Transformer2 represents a significant leap forward, offering a scalable, efficient solution for enhancing the adaptability and task-specific performance of LLMs, paving the way for truly dynamic, self-organizing AI systems. Our code is available at https://github.com/SakanaAI/self-adaptive-llms

ChatGPT訳:

自己適応型の大規模言語モデル(LLM)は、計算負荷が高く、様々なタスクに対応する能力が固定的であるという従来のファインチューニング手法が抱える課題を解決することを目指しています。ここでは、新しい自己適応フレームワークである Transformer2 を紹介します。このフレームワークは、重み行列の特異成分だけを選択的に調整することで、未見のタスクにリアルタイムで適応します。

推論時に Transformer2 は2段階のメカニズムを採用します。最初にディスパッチシステムがタスクの特性を特定し、その後、強化学習によって訓練されたタスク特化型の「エキスパート」ベクトルを動的に組み合わせることで、入力プロンプトに対して目的に応じた振る舞いを実現します。この方法は、LoRA のような一般的なアプローチを上回る性能を発揮し、使用するパラメータが少なく、効率も向上しています。

Transformer2 は、異なるLLMアーキテクチャや視覚と言語のタスクを含む複数のモダリティにおいて、その多用途性を示しています。この技術は、適応性とタスク特化型性能を向上させるスケーラブルかつ効率的なソリューションを提供し、真に動的で自己組織的なAIシステムへの道を切り開くものです。コードは以下で公開されています: https://github.com/SakanaAI/self-adaptive-llms

コメント

なるほどなーーーー。Transformer2乗は、キャッチーですね。
2Transformerでなく、Transformer2乗。どっちを名乗るかは、基準はないと思いますが。。。。
コツコツ読んでいきたいと思います。