Post Thumbnail

Модель, создающая сайты и игры с 1-й попытки

OpenAI молча и без лишнего шума запустила тестирование новой модели под кодовым названием o3 Alpha на платформе WebArena. Это открытая площадка для сравнения моделей искусственного интеллекта через предпочтения пользователей. На самой платформе модель скрывается под именем «Anonymous-Chatbot-0717», но в коде можно увидеть настоящий идентификатор.

Что делает o3 Alpha особенной? По бенчмаркам она занимает 1-е место среди нейросетей для генерации кода и физики мира. Модель также значительно улучшила создание веб-сайтов с качественным пользовательским интерфейсом.

Издание BleepingComputer провело собственное тестирование и подтвердило, что o3 Alpha отлично справляется даже с расплывчатыми запросами. Пользователи отмечают, что она может создавать клоны популярных игр вроде Minecraft, GTA и Flappy Bird с 1-й попытки. Также она генерирует векторную графику лучшего качества среди других систем искусственного интеллекта.

Важно понимать, что это не открытое решение и не та модель с открытым исходным кодом, которую компания обещала выпустить. Также это не новая версия под названием o4. Такой модели пока не существует. Скорее всего, o3 Alpha – это внутренняя тестовая версия улучшенной модели o3, которая может включать наработки для будущей модели GPT-5.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Альтман предупредил ФРС о кризисе безопасности банковских переводов

Руководитель OpenAI Сэм Альтман, выступил с серьёзным предупреждением о надвигающемся кризисе в сфере безопасности финансовых транзакций. На встрече в Федеральной резервной системе США он заявил, что большинство существующих методов аутентификации уже не способны противостоять современным технологиям.

От текста к вирусным роликам: новые творческие инструменты X

В платформу X скоро интегрируют собственный инструмент для создания видеороликов из текстовых описаний. По информации от Илона Маска, новая функция получит название "Imagine". И будет основана на технологиях стартапа Hotshot, который компания xAI приобрела в марте этого года.

Робот-щенок Дженни помогает 300 млн людей с деменцией

Вышла новая версия робота-щенка Дженни и мимо этого события я не смог пройти. Такие роботы-питомцы созданы специально для тех, кто не может ухаживать за живыми животными, но очень нуждается в их компании. Это интересная разработка для людей с деменцией и лёгкими когнитивными нарушениями.

10 учёных из OpenAI отвергли предложения Цукерберга на $300 млн

Знаете, на рынке искусственного интеллекта деньги оказываются иногда бессильны. Цукерберг активно ищет и хантит специалистов по искусственному интеллекту, но результаты бывают и неожиданные. Wall Street Journal сообщает, что минимум 10 учёных из OpenAI отвергли предложения Цукерберга с бонусом в $300 млн.

Qwen 3 превзошла Claude 4 Opus и DeepSeek V3 в тестах

Команда Qwen выпустила обновление своей флагманской модели Qwen 3. Результаты отличные. Новая версия опережает такие мощные модели как Claude 4 Opus, Kimi K2 и DeepSeek V3 по многим ключевым показателям.