xAI выпустила Grok 4.1 — ИИ-модель заняла первое место в независимых тестах LMArena

Компания xAI Илона Маска (Elon Musk) приступила к глобальному развёртыванию модели Grok 4.1 и «думающей версии» Grok 4.1 Thinking, которые представляют собой улучшенные версии предыдущей модели Grok 4. Оба продукта доступны для бесплатного использования, однако для пользователей с платной подпиской действуют менее строгие ограничения.

Пять причин полюбить HONOR Pad V9

Почему ИИ никак не сесть на безматричную диету

Пять причин полюбить HONOR X8c

Пять причин полюбить HONOR Magic7 Pro

Hollow Knight: Silksong — песнь страданий и радостей. Рецензия

HUAWEI FreeArc: вероятно, самые удобные TWS-наушники

Фитнес-браслет HUAWEI Band 10: настоящий металл

Обзор умных часов HUAWEI WATCH 5: часы юбилейные

По заявлению представителей компании, новая модель Grok 4.1 показала в тестах трёхкратное снижение вероятности генерации недостоверной информации, или, как сейчас принято говорить, «галлюцинаций», по сравнению со своими предшественниками, что позволяет назвать данное обновление одним из самых успешных в истории стартапа xAI.

Работа новых моделей была протестирована в рамках независимого открытого проекта LMArena, который специализируется на сравнительном анализе крупных языковых моделей (LLM) с помощью «слепых» рандомизированных тестов. Согласно полученным результатам, обе новинки показали выдающиеся результаты в самой конкурентной среде этой платформы. Так, модель Grok 4.1 Thinking возглавила экспертный рейтинг LMArena, набрав 1483 баллов, в то время как базовая версия Grok 4.1 заняла в этом же рейтинге 2-ю строчку с результатом в 1465 баллов. Специалисты платформы отметили, что данный результат означает улучшение более чем на 40 баллов по сравнению с моделью Grok 4 fast, которая была представлена двумя месяцами ранее.

Несмотря на значительный прогресс, аналитики полагают, что Grok 4.1 может не стать лучшей моделью года, поскольку компания Google готовит к выпуску версию Gemini 3.0, которая, по предварительным оценкам, имеет потенциал и получит звание самой мощной LLM на сегодняшний день.

Оцените статью
Добавить комментарий