https://pc.watch.impress.co.jp/docs/news/2001630.html
https://pc.watch.impress.co.jp/docs/news/2001630.html
DeepSeekは25日、推論性能の大幅向上や、フロントエンド開発スキルの向上、よりスマートになったツール使用能力などを備えた「DeepSeek-V3-0324」を発表した。
同社が公開したベンチマークデータによれば、「MMLU-Pro」および「GPQA Diamond」ではGPT-4.5よりやや劣るがClaude-Sonnet-3.7に比肩、「MATH-500」、「AIME 2024」、「LiveCodeBench」で競合を上回る性能を実現したという。
なお、複雑ではないタスクの場合は「DeepThink」をオフにし、V3の使用を推奨している。APIの使用に変更はない。モデルはDeepSeek-R1と同様にMITライセンスとなっており、重みデータについてはオープンソースで公開している。
0 コメント:
コメントを投稿