Atari 1977 года разгромила ChatGPT в шахматах за 1.5 часа игры
Шахматная битва между прошлым и будущим закончилась неожиданно. Представьте. Старенькая приставка Atari выпуска 1977 года разгромила современный искусственный интеллект ChatGPT. Программист Роберт Карузо организовал это необычное соревнование, результаты которого многих удивили.
ChatGPT играл как полный новичок. Путал ладьи со слонами, терял фигуры на доске и нарушал базовые правила шахмат. Даже переход на стандартную шахматную нотацию не помог языковой модели. Карузо потратил 1.5 часа, постоянно останавливая искусственный интеллект от совершения грубейших ошибок, пока тот наконец не признал поражение.
А что с Atari? Старая консоль просто делала свою работу – просчитывала позиции на 1 ход вперёд. И принимала решения на основе строгих правил. Причина такого разгрома кроется в принципиально разных технологиях. Шахматные движки – это узкоспециализированные алгоритмы, заточенные под конкретную задачу. Они используют вычислительную мощь для анализа млн возможных позиций.
Большие языковые модели работают совсем по-другому. ChatGPT предсказывает следующий токен на основе статистики из обучающих данных, а не применяет правила игры. Языковые модели забывают предыдущие ходы и даже придумывают несуществующие фигуры. Правда, я не нашел информации, какая именно модель ChatGPT была использована в этом противостоянии.
Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
ИИ-мошенник 2.5 года выдавал себя за Киану Ривза и украл $160 тыс.Дианн Рингстафф стала жертвой изощрённого мошенничества, когда играла в мобильную игру и получила сообщение, за которым последовал видеозвонок. Технологии искусственного интеллекта были настолько продвинутыми, что женщина была абсолютно уверена — ей звонил настоящий Киану Ривз.
70-килограммовый гуманоид летает на турбинахИтальянские инженеры совершили невероятное. Металлический летающий гуманоид iRonCub3 с человеческими пропорциями весом в 70 кг летает! 4 мощные турбины подняли гуманоида на высоту 50 см, демонстрируя технологию, которая раньше существовала только в научной фантастике.
MIT и Microsoft разоблачили ложь GPT-3.5Команда ученых из MIT и Microsoft разработала методику, позволяющую заглянуть за кулисы мышления языковых моделей. И понять, когда они нам врут. Исследование раскрывает тревожные случаи системного несоответствия между реальными причинами решений моделей и их вербальными объяснениями.
OpenAI переманивает клиентов Microsoft скидкамиКомпания OpenAI начала предоставлять значительные скидки на корпоративные подписки ChatGPT — от 10 до 20%! Но скидки доступны при дополнительных инвестициях в другие продукты OpenAI, включая Deep Research, Codex и повышенные расходы на API. И этот беспрецедентный шаг вызывает серьезное беспокойство у Microsoft.
GigaChat проиграл Claude и Gemini на русском языке в бенчмарке MERAТестирование GigaChat раскрывает суровую правду о месте России в глобальной гонке искусственного интеллекта. Недавние испытания на бенчмарке MERA показали результаты, заставляющие серьёзно задуматься. Российская модель, созданная специально для работы с русским языком, неожиданно проиграла иностранным конкурентам в своей же "родной стихии".