ChatGPTのような「AI言語モデル」の数学能力を向上させる方法が発見されました。その方法とはAIモデルに人間的なアドバイスをするというものです。
「AI」と「人間的アドバイス」との関係について、海外メディア「arstechnica」が解説しています。
*Category:テクノロジー Technology *Source:arstechnica,wikipedia
AI言語モデルを賢くする「人間的アドバイス」とは?
ディープマインドの科学者たちは、OpenAIのChatGPTやグーグルのPaLM 2のような大規模言語モデル(LLM)のパフォーマンスを向上させるOptimization by PROmpting(OPRO)という手法を開発しました。
この新しいアプローチは、LLMを問題解決に導くために自然言語(日常的な人間の会話を言い換えたもの)を使用することで、従来の数学ベースのオプティマイザーの限界を突破するというものです。
使用方法は簡単で、数学の問題をAIに出題する場合、最初に「Let’s think step by step(ステップ・バイ・ステップで考えよう)」というプロンプト(指示)をするだけです。すると、AIモデルの結果の精度はほぼ常に向上するとのことです。
そして、科学者達はプロンプトを変えることによってAIの能力が変化することを発見します。研究の結果「深呼吸をして、一歩一歩この問題に取り組んでください」が最も効果的なプロンプトのようです。
小学校の算数で実験をしたところ、特別なプロンプトを使用しない場合は34%の精度、「ステップ・バイ・ステップで考えよう」とプロンプトした場合は71.8%、そして「深呼吸をして、一歩一歩この問題に取り組んでください」とプロンプトした場合は80.2%でした。
なぜAIに人間のようなアドバイスをすると成績が良くなるのでしょうか?AIが行う「推論」は、書籍やウェブからかき集めた言語フレーズの膨大なデータを使用しています。そして、そのデータのより慎重に推論された解決策の前には「深呼吸しましょう」といった言葉が多く使用されています。
つまりAIに「深呼吸しましょう」というプロンプトを与えることで、より良い解決策を見つけやすくしているということです。
OPROの最大の利点は、可能性のある多くのプロンプトをふるいにかけて、特定の問題に対して最良の結果をもたらすプロンプトを見つけ出せることです。これによって将来LLMは、より正確な結果を出すことができるようになるかもしれません。
Source: app