アメリカのIT大手Metaが新しい言語モデル「LLaMA」を公開。
概要
アメリカのIT大手Metaは、最新の言語モデル「LLaMA 3.1」を公開しました。このモデルは、8言語に対応し、128Kトークンの長文脈処理能力を持ち、GPT-4やClaude 3.5 Sonnetなどの主要な基盤モデルと同等の性能を発揮します。LLaMA 3.1は、オープンソース化されており、開発者はモデルを直接ダウンロードし、カスタマイズや再学習が可能です。これにより、合成データ生成やモデル蒸留など、新たなワークフローが期待されます。
背景
Metaは、AIの民主化を目指し、世界最大かつ最も高性能なオープンソース基盤モデルを目指しています。LLaMAシリーズは、2023年2月に初めて発表され、以来、性能が向上し、オープンソース化が進められてきました。LLaMA 3.1は、最新のモデルであり、8B、70B、405Bの3つのパラメータサイズで提供されています。
Metaの新しい言語モデル「LLaMA」
LLaMA 3.1は、膨大な量のテキストデータから学習し、人間のような自然言語処理能力を持つAIモデルです。特徴として、以下のような点が挙げられます。
- 8言語対応
- 128Kトークンの長文脈処理能力
- オープンソース化
- カスタマイズや再学習が可能
- FP16、FP8、INT4などの量子化モデルが提供されており、メモリ使用量を削減することができます。
オープンソースの利点
LLaMA 3.1のオープンソース化は、AIの発展と応用を加速させることが期待されます。以下のような利点があります。
- 誰でも自由にモデルを利用、改変、再配布することが可能
- 世界中の開発者が研究開発に貢献できる
- 新たなワークフローが期待される
競合他社との比較
LLaMA 3.1は、GPT-4やClaude 3.5 Sonnetなどの主要な基盤モデルと同等の性能を発揮します。以下のような特徴で競合他社との差別化が図られています。
- オープンソース化
- 8言語対応
- 128Kトークンの長文脈処理能力
関連するその他のニュース
- Metaは、LLaMA 3.1を活用した最新のAIアシスタントを提供しています。このアシスタントは、無料で使用でき、画像生成や自然言語処理など、多様なタスクに対応しています。
- LLaMAシリーズは、2023年2月に初めて発表され、以来、性能が向上し、オープンソース化が進められてきました。
リンク
-
-
-
-
-