「Claude 3.5 Sonnet」＋新機能「Artifacts」使ってみたまとめ

2024年6月21日

Claude 3.5 Sonnetが発表されました。

ベンチマーク結果はOpenAIのGPT-4oに匹敵するとのことで話題を集めています。

本記事では、比較や活用方法についてまとめました。

Claude 3.5 Sonnetとは
1. 性能比較
Artifactsとは
使ってみた
補足
まとめ

Claude 3.5 Sonnetとは

チャットボットAI「Claude」を開発するAnthropicが新モデルです。

Introducing Claude 3.5 Sonnet \ Anthropic
https://www.anthropic.com/news/claude-3-5-sonnet

Anthropicによると、Claude 3.5 Sonnetは大学院レベルの推論力、大学学部レベルの知識とコーディング能力を持つとのこと。Claude 3 Opusなど従来のClaudeモデルと比較し、ニュアンスやユーモア、複雑な指示を理解する能力が著しく向上し、自然で親しみやすい口調で高品質のコンテンツを書く能力に優れているとAnthropicはアピールしています。

Claude 3.5 SonnetはClaude 3 Opusと比較してパフォーマンスとコスト効率が向上しており、Claude 3.5 Sonnetの動作速度はClaude 3 Opusの2倍に匹敵するとのこと。また、エージェントコーディング評価では、Claude 3.5 Sonnetは問題の64％を解決し、38％を解決したClaude 3 Opusを上回ったそうです。

性能比較

Anthropicの公開したベンチマーク結果を見ると、Claude 3.5 Sonnetは8項目のうち、「推論(GPQA)」「知識(MMLU)」「コーディング(HumanEval)」「数学問題の翻訳(MGSM)」「テキスト推論(DROP)」の5項目で、GPT-4oと同等かそれ以上の結果を出しています。

Artifactsとは

追加の新機能「Artifacts」は、チャットしながら成果物を改良するワークスペースです。

使ってみた

フィボナッチ数列アニメーション

フィボナッチ数列アニメーション pic.twitter.com/viz7Bq1GEh
— Jin Sugimoto / 杉本迅 (@Jin__Sugimoto) June 20, 2024

ブロック崩し

ブロック崩し pic.twitter.com/oUBjXfHjnU
— Jin Sugimoto / 杉本迅 (@Jin__Sugimoto) June 20, 2024

シューティング

シューティング pic.twitter.com/HbsynhbkJY
— Jin Sugimoto / 杉本迅 (@Jin__Sugimoto) June 20, 2024

RAGシステム

RAGシステム pic.twitter.com/0jiawl09uX
— Jin Sugimoto / 杉本迅 (@Jin__Sugimoto) June 21, 2024

マーケティングインターフェース

マーケティングインターフェース pic.twitter.com/Ta5nhw8Zjr
— Jin Sugimoto / 杉本迅 (@Jin__Sugimoto) June 21, 2024

量子回路シミュレータ

簡易量子回路シミュレータ pic.twitter.com/Xo6i9K97KH
— Jin Sugimoto / 杉本迅 (@Jin__Sugimoto) June 21, 2024

企業分析

Claude 3.5 Sonnetでタイミーの企業分析やってみた

1. 財務分析：… https://t.co/f7gXTpw7hy pic.twitter.com/k38wmFtqsF
— Jin Sugimoto / 杉本迅 (@Jin__Sugimoto) June 21, 2024

補足

Anthropicは、「Claude 3.5 Haiku」と「Claude 3.5 Opus」については「今年（2024年）中に」リリースの予定だと、ブログ記事の中で述べています。

まとめ

・シミュレーション

・ゲーム

・アプリ

・マーケティング

・ファイナンス

幅広く活用可能です。