OpenAI решает задачи IMO лучше большинства людей
Математический мир стал свидетелем исторического события. Экспериментальная ризонинг-модель от OpenAI решила задачи международной олимпиады по математике IMO на золотую медаль. Ссылка в описании. Хотя точное название модели не раскрывается, известно, что она ещё не опубликована и это не GPT-5.
Система искусственного интеллекта успешно справилась с 5 задачами из 6. Оценка проводилась по тем же правилам, что применяются к участникам-людям. Модели дали 9 часов на размышления, ограничили доступ в интернет и принимали только полностью обоснованные доказательства на естественном языке.
В итоге искусственный интеллект набрал 35 из 42 возможных баллов. Что соответствует твёрдой золотой медали. До этого момента ни одной модели не удавалось достичь таких впечатляющих результатов на математической олимпиаде.
Самое интересное, что разработчики из Google DeepMind тоже готовы были объявить о победе своей модели, которая также решила эти же задачи на золотую медаль. Однако им пришлось ждать одобрения от отдела маркетинга, и поэтому официальное объявление от них выйдет на этой неделе. А тем временем глава OpenAI Сэм Альтман уже успел заявить о достижении своей компании и собрать респекты.
Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
UBTech отправит роботов Walker S2 служить на границу Китая за $37 млнКитайская компания UBTech выиграла контракт на $37 миллионов. И отправит человекоподобных роботов Walker S2 служить на границу Китая с Вьетнамом. South China Morning Post сообщает, что роботы будут взаимодействовать с туристами и персоналом, выполнять логистические операции, досматривать грузы и патрулировать местность. И что характерно — они умеют самостоятельно менять свою батарею.
ИИ-чатботы генерируют контент, усугубляющий расстройства питанияСовместное исследование Стэнфордского университета и Центра демократии и технологий показало тревожную картину. Чат-боты с искусственным интеллектом представляют серьёзный риск для людей с расстройствами пищевого поведения. Учёные предупреждают, что нейросети раздают вредные советы о диетах. Предлагают способы скрыть расстройство и генерируют "вдохновляющий контент для похудения", который усугубляет проблему.
OpenAGI выпустил модель Lux, которая обгоняет Google и OpenAIСтартап OpenAGI выпустил модель Lux для управления компьютером и заявляет, что это прорыв. По бенчмаркам модель на целое поколение обгоняет аналоги от Google, OpenAI и Anthropic. Кроме того, она работает быстрее. Примерно 1 секунда на шаг вместо 3 секунд у конкурентов. И в 10 раз дешевле по стоимости обработки 1 токена.