https://arxiv.org/abs/2503.09516
[2503.09516] Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
この論文では、大規模言語モデル(LLM)が検索エンジンを効果的に利用できるようにするSearch-R1という手法を紹介しています。
Search-R1は、強化学習(RL)を通じて、LLMが自律的に検索クエリを生成する方法を学習します。
実験結果から、Search-R1は既存のベースラインモデルよりも大幅に性能が向上することが示されています。