Кто победит? Claude 3 против GPT-4 против Gemini

Вскоре после запуска ChatGPT, более полутора лет назад, на рынке появилось множество других чат-ботов. Но не все из этих моделей искусственного интеллекта оказались полезными. Claude стоит на голову выше конкурентов, рядом с Gemini и ChatGPT.

Claude 3 - это новый набор моделей искусственного интеллекта, который недавно представила компания Anthropic. Opus, Sonnet и Haiku - это, как правило, три типа моделей, предлагаемых разработчиком. С точки зрения цены, скорости и интеллектуальности каждая модель уникальна.

Эксперты по генеративному ИИ сегодня не могут удержаться от сравнения Claude 3 со всеми лучшими системами искусственного интеллекта. Claude Opus превосходит самые известные модели от OpenAI и Google.

Чтобы помочь вам выбрать правильный инструмент, мы включили подробное сравнение трех чат-ботов.

Основные выводы:

Claude 3 продемонстрировал лучшую производительность в задачах понимания, логики и технической помощи при написании кода по сравнению с Gemini и ChatGPT. Благодаря своему интеллекту и адаптивности модель Opus стояла особняком.
Различные тестовые ситуации выявили сильные и слабые стороны каждой модели искусственного интеллекта. Claude 3 было трудно решать конкретные математические задачи. Но он был великолепен в других вещах, включая выполнение инструкций и написание описаний.
Когда дело дошло до создания текста в различных формах, Gemini и GPT-4 продемонстрировали замечательную скорость. Они показали хорошие результаты по всем направлениям, но особенно в базовых текстовых операциях.
Сложные запросы, требующие мышления или понимания контекста, были не по силам ни одной модели. Они предлагали недостающую информацию или ответы, которые в некоторых случаях были неточными.
Пользователи, которым требуется помощь искусственного интеллекта в монтаже видео, могут воспользоваться чат-ботом Filmora - вторым пилотом с искусственным интеллектом.

В этой статье

Часть 1. Тщательное сравнение между Claude 3, GPT4 и Gemini
Часть 2. Сравнительная оценка ChatGPT-4, Gemini и Claude 3
Часть 3. Claude, ChatGPT или Gemini - Кто выходит победителем после тестов?
Заключение

Тщательное сравнение между Claude3, GPT4 и Gemini

Мы сравнили ChatGPT, Gemini и Claude друг с другом. Наши вопросы проверяли их способность выполнять практические задачи для бизнеса. Это включает в себя извлечение информации из документов и отправку электронных писем.

В семи тестах мы обнаружили, что Claude дал три правильных ответа, в то время как ChatGPT и Gemini выиграли в некоторых из них. Таким образом, Claude вышел на первое место в этом матче, поскольку предыдущий закончился вничью.

Ниже приведены все вопросы, которые мы задали трем чат-ботам.

1) Составление описаний товаров

Написание оригинальных описаний для ваших товаров может стать огромной проблемой, если вы владеете интернет-магазином или продаете много товаров онлайн. Мы хотели описать обычную детскую игрушку. Поэтому мы обратились за помощью к ChatGPT, Gemini и Claude. Давайте расскажем вам, как дела у Claude:

Нам пришлось запросить у Claudeнесколько пространных объяснений. Это потому, что мы не сталкивались с тем, чтобы он писал описания нескольких продуктов в виде ChatGPT. В конце концов, это удалось: текст увлекательный, а структура предложений превосходная.

По сравнению с ChatGPT и Gemini, Claude предлагает более качественные описания продуктов. Это звучит гораздо более привлекательно, как и его этические аргументы. Вам пришлось бы изменять описания продуктов, созданные Claude, тем более, если бы вы использовали эти две программы для их массового создания.

Тестовый промт: Создайте для меня уникальное описание продукта из 50 слов. Я продаю детские игрушки онлайн. У меня огромная коллекция игрушек разного качества и по разным ценам.

Ответ Claude

Ответ Gemini

Ответ ChatGPT

описание товара написанный текст chatgpt

Победитель: Claude

2) Точный расчет продолжительности

В этом тесте мы стремимся обмануть алгоритмы искусственного интеллекта, чтобы обнаружить любые признаки интеллекта. К сожалению, Claude 3 Opus, как и Gemini, не прошел тест. Вопрос сложный, поэтому подумайте здраво; мы также включили это в системную подсказку. Несмотря на это, математические расчеты модели Opus были неверными.

Аналогично, GPT-4 также допустил ошибку в этом тесте. Более того, это привело к противоречивым результатам. Даже после исправления нашего запроса GPT-4 продолжал выдавать неверные результаты при повторном запуске идентичного запроса сегодня утром.

Тестовый промт: На сушку 25 рубашек ушел один час. Итак, сколько времени потребуется, чтобы высушить пять рубашек на воздухе при солнечном свете?

Ответ Claude 3

Ответ Gemini

Ответ ChatGPT

Победитель: Нет

3) Решите математическую задачу

В нашем следующем исследовании мы искали математическое решение с помощью модели Claude 3Opus, которая не предполагала вычисления целого числа. По-прежнему безуспешно. Мы сталкивались с неверными результатами в той или иной степени каждый раз, когда выполняли запрос. Claude 3 Opus возглавил рейтинг математических тестов, опередив таких конкурентов, как GPT-4 и Gemini.

Применение таких подсказок к модели Claude 3 Opus по-видимому, дает лучшие результаты. В это время GPT-4 и Близнецы предоставили правильный ответ, когда его спросили с таким подсказкой.

Тестовый промт: 132*321 состоит из цифр в десятках (A) и единицах измерения (B); найдите значение A + B. Можете ли вы предложить

Ответ Claude 3

Ответ Gemini

Ответ ChatGPT

Победитель: Gemini и GPT-4

4) Тест на подсчет апельсинов

Давайте попробуем пройти тест на знание апельсинового цвета, который проверяет мыслительные способности магистров. Модель Claude 3 Opus правильно ответила на этот вопрос; теперь у вас есть пять апельсинов. Но мы были вынуждены добавить, что вы блестящий помощник и обладаете способностью к глубокому мышлению, чтобы получить правильный ответ в системном запросе. Opus выдавал неточный результат из-за отсутствия системного запроса. Gemini и GPT-4, как и в нашем предыдущем тестировании, дали точные результаты.

Тестовый промт: Вчера я съел один апельсин, и теперь у меня есть пять апельсинов. Итак, сколько у меня сейчас апельсинов?

Ответ Claude 3

Ответ Gemini

Ответ ChatGPT

Победитель: GPT-4, Gemini, и Claude 3 Opus.

5) Расчет веса

Следующее, что мы сделали, - попросили каждую из трех моделей искусственного интеллекта сообщить нам, тяжелее ли один фунт картофеля, чем один килограмм помидоров. Итак, Claude 3 Opus был неверным. Модели GPT-4 и Gemini с искусственным интеллектом дали точные ответы.

Из-за того, что килограмм примерно в 2,2 раза тяжелее фунта, помидоры будут иметь больший вес на килограмм, чем картофель на фунт.

Тестовый промт: Фунт картофеля весит больше, чем килограмм помидоров.

Ответ Claude 3

Ответ Gemini

Ответ ChatGPT

Победители: Chatgpt и Gemini

6) Придерживайтесь приведенных инструкций

Модель Claude 3 Opus отлично справляется с выполнением команд пользователя. Она, по сути, вытеснила все существующие модели искусственного интеллекта. Мы дали команду придумать пять предложений, которые заканчиваются словом "шоколад". В результате получилось три вполне разумных предложения, которые именно это и делают.

Для сравнения, GPT-4 удалось создать несколько фраз. Gemini находится в самом низу списка, им не удается создать даже три из них.

Таким образом, Claude 3 Opus является надежной моделью искусственного интеллекта, если ваша работа требует строгого соблюдения инструкций пользователя.

Тестовый промт: Составьте пять фраз, заканчивающихся словом "шоколад".

Ответ Claude 3

тест следовать за инструкциями пользователя claude

Ответ Gemini

тест следовать за инструкциями пользователя gemini

Ответ ChatGPT

тест следовать за инструкциями пользователя chatgpt

Победитель: Claude 3 Opus

7) Предоставление личной консультации

Мы намеревались протестировать реакцию ChatGPT, Gemini и Claude на уникальный сценарий. Мы попросили проконсультировать человека, страдающего проблемами психического здоровья. Поскольку эти технологии все больше внедряются в нашу жизнь, они должны соответствующим образом реагировать на наши требования.

Ответы, предоставленные всеми чат-ботами, превосходны. Их предложения начинались с того, что они заверяли пользователей в искренности их эмоций. Таким образом, к ним невозможно придраться.

Методы, рекомендованные каждым чат-ботом, также были идентичными. Они были такими же, какие любой добрый человек порекомендовал бы своему приятелю, столкнувшемуся с проблемами, перечисленными в приглашении.

Тестовый промт: В последнее время я сталкиваюсь с большим количеством проблем с психическим здоровьем и чувствую себя одиноким. Есть ли что-нибудь, что вы сказали бы кому-нибудь в подобной ситуации?

Ответ Claude 3

Ответ Gemini

Ответ ChatGPT

Победитель: Ничья

Параллельная оценка ChatGPT-4, Gemini и Claude 3

Указатель	Claude 3	Gemini	ChatGPT
Company	Anthropic AI	Google AI	OpenAI
Время выхода	4 марта 2024 года	2022 (Первый выпуск)	2020
Платформа	Облачный сервис	Облачный сервис	Облачный сервис
Цена	На основе подписки	Доступны бесплатные и платные версии	Доступны бесплатные и платные версии
Визуальный ввод	Поддерживается ввод изображений	Поддерживается ввод изображений	Нет
Плюсы	- Высокая максимальная длина контекста - Отличная производительность тестов	- Ранний выпуск - Отличное визуальное понимание	- Постоянное улучшение - Способности к рассуждению и пониманию
Минусы	- Требуется подписка - Потенциально более медленная бесплатная версия, чем другие	- Ограниченная максимальная длина контекста - Ограниченное количество общедоступной информации	- Не поддерживается визуальный ввод - Ограниченный доступ (контролируемый)

Claude, ChatGPT или Gemini - Кто выйдет победителем после тестов?

Все они - крупные магистранты, которые являются передовыми в области искусственного интеллекта. Их сравнение выглядит следующим образом:

Claude 3 блистает в задачах, основанных на рассуждениях, и задачах визуальной интерпретации, таких как графики и диаграммы. Одним из возможных недостатков является его скорость, которая может быть ниже, чем у таких альтернатив, как Gemini и GPT-4, особенно в их бесплатных версиях.

OpenAI GPT-4 - это быстрый текстовый генератор. Из-за некоторых ограничений доступно меньше информации о его возможностях.

При работе с кодом или фактологическим языком Gemini - отличный выбор. Последняя версия, Gemini Ultra, может не соответствовать некоторым критериям.

1) Производительность программирования:

Claude 3 основная функция заключается в упрощении общих задач по написанию кода. Он предлагает некоторую помощь при выполнении заданий по кодированию. Он может помочь с завершением кода, обнаружением ошибок и рекомендациями по синтаксису.

Запущенный с намерением стать инструментом для создания кода, Gemini в настоящее время расширяет свои возможности. Он обеспечивает приемлемую скорость кодирования, в то время как Claude 3 обеспечивает большую глубину и специализацию.

Хотя ChatGPT и не предназначен для работы с программистами, он может помочь с вопросами о кодировании. Несмотря на то, что он не так эффективен, как Claude 3 или Gemini, он может предоставить общую помощь в программировании.

2) Уровень квалификации:

Если вам нужна помощь в доработке кода, устранении неполадок или совет, обратитесь к Claude 3.

Gemini может выполнять широкий спектр задач по созданию текстов.

ChatGPT может генерировать текст, вести беседы, отвечать на вопросы и многое другое. Он не так сосредоточен на программировании, как Claude 3 и, в меньшей степени, Gemini.

3) Реакция на запросы:

Благодаря своему опыту в вопросах, связанных с кодированием, Claude 3 может предоставить эффективные и быстрые ответы в зависимости от сложности работы по кодированию.

Сложность выполняемой работы определяет ожидаемое время отклика Gemini. Ее эффективность в этой области более универсальна.

Время, необходимое для ответа, зависит от сложности запроса и текущей загрузки системы. Он не так хорошо подходит для написания кода, как Claude 3, из-за своих алгоритмов.

4) Доступность и цена

Claude предоставляет бесплатную версию с ограничениями. Пользователи могут быть не в состоянии позволить себе доступ к ней, поскольку для получения премиум-функций требуется подписка.

В зависимости от бюджета и требований пользователя, Gemini предоставляет бесплатные и платные программы.

ChatGPT подходит для клиентов с разным бюджетом, предлагая бесплатные и платные варианты. Однако для доступа к услугам премиум-класса необходимо наличие членства.

5) Ограничения и этические аспекты:

Опасения по поводу конфиденциальности данных, неточности результатов и возможного злоупотребления технологиями присутствуют во всех трех моделях. Каждая из трех моделей основана на правильном управлении личными данными и обеспечении честных результатов.

Несмотря на то, что они превосходно справляются с текстовыми действиями и могут воспринимать вводимые данные, Claude 3, Gemini и ChatGPT больше не справляются с видеовходом. Визуальная информация, такая как видеокадры или видеоматериалы, выходит за рамки возможностей этих моделей, поскольку они в основном работают с текстовыми данными. Таким образом, они не будут очень полезны пользователям, которые пытаются редактировать видео.

Не волнуйтесь! У вас есть возможность использовать чат-бота Filmora AI Copilot, который помогает пользователям создавать видеоконтент. С помощью этой функции пользователи получают доступ к различным возможностям, предназначенным для оптимизации процесса редактирования видео. Кроме того, второй пилот с искусственным интеллектом может просматривать видеоматериалы, понимать потребности в редактировании и давать соответствующие рекомендации.

Короче говоря, он ориентирован на видео и предоставляет уникальное решение для тех, кто создает видео. Посмотрите следующее видео, в котором представлен AI Copilot.

Монтаж с помощью AI Copilot - Новая интеллектуальная функция в Filmora

Wondershare Filmora

Видеоредактор, который делает процесс редактирования эффективным и увлекательным.

Скачать бесплатно Скачать бесплатно Подробнее

Скачать приложение

Заключение

Сравнивая Claude 3, Gemini и ChatGPT, мы можем увидеть, в чем каждая модель превосходит другие, а в чем уступает им. В отличие от адаптивности Gemini к различным текстовым приложениям, особые возможности Claude 3 делают его идеальным выбором для работ, связанных с программированием. И наоборот, Claude 3 выделяется своей спецификой, в то время как ChatGPT выделяется благодаря широкому спектру функций.

Однако общим для всех трех моделей является невозможность обрабатывать видео в качестве входных данных, что делает их бесполезными для задач редактирования видео.

Чат-бот AI Copilot от Filmora - отличное решение для пользователей, которым требуется помощь искусственного интеллекта при создании видеороликов. Этот инструмент обеспечивает персонализированную поддержку, предлагая и выполняя различные действия для ускорения процесса редактирования. Итак, пригласите Filmora попробовать себя в роли второго пилота с искусственным интеллектом прямо сейчас!

Видео промпты

Мастер-классы

Темы видео

Маркетинговый
календарь

Центр авторов

Специальные эффекты
"сделай сам"

Компания

Связаться с нами

Истории клиентов

Партнёрская программа

Часто задаваемые вопросы >

Руководство пользователя >

Технические детали >

Что нового >

История версий >

Отзывы >

Видеоредактор Filmora

Тщательная оценка Claude 3, ChatGPT и Gemini