**アメリカのIT大手Metaが新しい言語モデル「LLaMA」を公開**
概要
アメリカのIT大手Metaは、最新の言語モデル「LLaMA」を公開しました。このモデルは、オープンソースであり、幅広いユースケースをサポートすることができます。LLaMAは、事前学習済みでインストラクションファインチューニングされた言語モデルであり、8Bと70Bのパラメータを持つモデルが提供されています。
背景
Metaは、2023年2月に初のLLaMAを発表し、7月にはLlama2をリリースしました。Llama2は、オープンソースかつ無料で利用できるようになり、研究や商用目的で広く活用されています。この流れを受け、Metaは最新のLlama3を発表し、さらにその性能を向上させたLlama 3.1をリリースしました。
Metaの新しい言語モデルLLaMA
Llama 3.1は、4050億のパラメータを持つ大規模言語モデルで、8つの言語をサポートし、128,000トークンの長大なコンテキストを処理できます。このモデルは、複雑な翻訳タスクや長文の要約、さらには高度な推論を必要とする課題にも対応可能です。また、Metaはマルチモダリティの実験も行っており、画像やビデオを認識し、音声を理解(生成)できるLlamaモデルを開発しています。
LLaMAの特徴と性能
LLaMAの特徴として、自然言語処理の精度が高いことが挙げられます。また、Llama 3.1は、GPT-4やClaude 3.5 Sonnetなどの商用AIモデルと肩を並べる性能を誇り、広範な業界ベンチマークで最先端の性能を実証しています。このモデルは、コミュニティメンバーが合成データの生成やモデルの蒸留など、新たなワークフローを実現することを可能にします。
LLaMAの将来的な展開
Metaは、Llama 3.1の開発に巨額の投資を行っており、16,000台以上のNVIDIA H100 GPUを使用して15兆以上のトークンでモデルを訓練しました。このモデルは、ビジネスや研究分野での応用範囲が大きく広がることが期待されています。また、Metaはマルチモダリティの実験も行っており、将来的には画像やビデオを認識し、音声を理解(生成)できるLlamaモデルを開発する予定です。
関連するその他のニュース
- Metaが新しいAIアシスタントを発表し、無料で使用できるようになったこと。
- Llama 3.1の公開に伴うコミュニティの反応や、試験的な使用例についての報道。
リンク
-
-
-
-
-