Anthropic, базираният в Сан Франциско стартъп за изкуствен интелект, представи Claude 3.5 Sonnet – своя първи голям езиков модел от фамилията Claude 3.5, който според компанията „поставя нови стандарти по отношение на производителност, скорост и рентабилност“. Следващите модели от серията, включително Opus и Haiku, ще бъдат налични по-късно през годината, поясниха от Anthropic.
Днешният анонс идва само месец след като подкрепената с милиарди долари от технологични гиганти като Google и Amazon компания дебютира със своя чатбот Claude на европейския пазар.
От Anthropic твърдят, че Claude 3.5 Sonnet е най-способният и най-интелигентният модел на пазара днес, който освен, че превъзхожда конкурентни модели като GPT-4o на OpenAI и Gemini 1.5 Pro на Google в редица тестове, се представя и по-добре от своя предшественик от по-висок клас – Claude 3 Opus.
Introducing Claude 3.5 Sonnet—our most intelligent model yet.
— Anthropic (@AnthropicAI) June 20, 2024
This is the first release in our 3.5 model family.
Sonnet now outperforms competitor models on key evaluations, at twice the speed of Claude 3 Opus and one-fifth the cost.
Try it for free: https://t.co/uLbS2JMEK9 pic.twitter.com/qz569rES18
Интересно е, че при вътрешни тестове на Anthropic, насочени към кодирането, Claude 3.5 Sonnet е успял да реши 64% от проблемите, докато Claude 3 Opus – само 38%. Алекс Алберт, учен на Anthropic, заяви: „Claude започва да се справя много добре с кодирането“ и добави, че „до една година голям процент от програмния код ще бъде написан от големи езикови модели“.
Claude is starting to get really good at coding and autonomously fixing pull requests. It's becoming clear that in a year's time, a large percentage of code will be written by LLMs.
— Alex Albert (@alexalbert__) June 20, 2024
Let me show you what I mean:
Моделът има и едни от най-добрите визуални възможности, като от Anthropic твърдят, че може да транскрибира текст от „диаграми, графики или несъвършени изображения“. Според компанията това е „важна способност в областта на продажбите на дребно, логистиката и финансовите услуги“, където освен от текст, изкуственият интелект може да извлече информация и от изображения, графики или илюстрации.
Claude 3.5 Sonnet is now our strongest vision model.
— Anthropic (@AnthropicAI) June 20, 2024
Sonnet now surpasses Claude 3 Opus across all standard vision benchmarks.
Improvements are most noticeable in tasks requiring visual reasoning, like interpreting charts, graphs, or transcribing text from imperfect images. pic.twitter.com/vfjdInY20B
Освен това Claude 3.5 Sonnet „може да пише с естествен тон и демонстрира значително подобрение в разбирането на нюанси, хумор и сложни инструкции“, посочват от компанията.
Claude 3.5 Sonnet е вече наличен дори в безплатната версия на чатбота Claude, като абонатите на платените абонаменти Pro и Team разполагат с по-високи лимити за използване. Моделът е достъпен и чрез API на Anthropic, в Amazon Bedrock, Vertex AI на Google Cloud, както и в платената версия на търсачката Perplexity AI.
В допълнение към новия модел, Anthropic представи и функция, наречена „Artifacts“, която позволява генерирането на документи, код, диаграми, векторни графики или дори прости игри.
We're also launching a preview of Artifacts on https://t.co/uLbS2JMEK9.
— Anthropic (@AnthropicAI) June 20, 2024
You can ask Claude to generate docs, code, mermaid diagrams, vector graphics, or even simple games.
Artifacts appear next to your chat, letting you see, iterate, and build on your creations in real-time. pic.twitter.com/ow77Jh7ebO
Редица потребители споделиха видеоклипове в Х (Twitter), демонстрирайки възможностите на Claude в генрирането на най-различни игри и програми. Освен това от компанията посочват, че екипите ще могат да разработват съвместно проекти с помощта на Artifacts.
This is wild.
— Allie K. Miller (@alliekmiller) June 20, 2024
In just 25 seconds, Claude 3.5 Sonnet coded a fully functional Mancala web app for me 🕹️
I only provided ONE screenshot of the game's instructions.
It did the rest:
– Coded the entire game
– Previewed it so I could test
– Provided rules of play pic.twitter.com/WLweZUGt5C
Been using the new Claude 3.5 model as a tester and now that it is out, I can say it is very very impressive, and the "artifacts" that it generates are like a simpler version of Code Interpreter
— Ethan Mollick (@emollick) June 20, 2024
This is a real-time video of me creating a playable game and editing it with Claude pic.twitter.com/bWqw8F8CdH
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!