Blogブログ

株式会社ELYZAが「GPT-4」を上回る性能の日本語LLMを開発・公開

2024.06.26

株式会社ELYZAは26日、同社が提供する大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、700億パラメータの「Llama-3-ELYZA-JP-70B」と80億パラメータの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。

「Llama-3-ELYZA-JP-70B」は、チャット形式のデモサイトを用意しており、同社によると「GPT-4」や「Claude 3 Sonnet」などの商用グローバルモデルを上回る性能を実現したという。高性能な国内製モデルとして、企業向けに提供を予定している。

一方、「Llama-3-ELYZA-JP-8B」は、モデル自体を一般公開し、LLAMA 3 COMMUNITY LICENSEに準拠しており、Acceptable Use Policyに従う限りにおいては、研究および商業目的での利用が可能だ。同社によると「GPT-3.5 turbo」を上回る性能を達成し、オープンなモデルのなかでは最高水準の性能を達成したという。

ELYZAはこれらのモデルの公開・提供を通じて、国内におけるLLMの社会実装の推進、並びにLLMの研究開発の発展を支援していくとしている。

「Llama-3-ELYZA-JP-70B」チャット形式のデモサイト
ELYZA LLM for JP|デモ版( https://elyza.ai/lp/elyza-llm-for-jp )

個人的な感想

実際に上記のデモ版を使ってみましたが、スピードも速いですし、感覚的なところですが、日本語LLMということもあり、日本語の理解もスムーズにできているように感じました。

日本語は英語とことなります。英語は単語で区切れています。その区切りごとに意味があり、それを組み合わせて文章を作っているということです。

一方、日本語は区切るところが難しいということです。それはひらがながあり、どこで区切るかによって単語のいみが変わってくるためです。

昔、「ぱんつくったことある?」と聞いて、ハイとイイエの場合で返す言葉を変えるという遊び?いたずら?をしたことはありませんか?(ちょっと良いたとえではないかもしれませんがww)

そのため日本語のLLMが実装できているというのは、日本国内での生成AI活用が進むのではと考えます。

それにともない、われわれの働き方や役割も変えていく必要があると思います。

今後の生成AIの成長と活用方法の進化に期待したいと思います。

なお、プレスリリースには、ベンチマークの結果も掲載されています。

ELYZA会社概要

”株式会社ELYZAは、「未踏の領域で、あたりまえを創る」という理念のもと、日本語の大規模言語モデルに焦点を当て、企業との共同研究やクラウドサービスの開発を行なっております。先端技術の研究開発とコンサルティングによって、企業成長に貢献する形で大規模言語モデルの導入実装を推進します。”

プレスリリースの記事は下記をご参照ください。

https://prtimes.jp/main/html/rd/p/000000046.000047565.html

この記事を書いた人

研究所所長

ページTOPへ