Главная          О Компании          Контакты               Телефон: (012) 449-50-31
Сервис:    (055) 580-44-09
Поиск
Категории
 HP
 Gigabyte
 Lenovo
 Asus
 Dell
 HP
 Toshiba
 Benq
 Sony
 Samsung
 Lenovo
 Gigabyte
 Gigabyte
 Foxconn
 MSI
 Gigabyte
 HP
 Gigabyte
 Creative
 HP
 Kingston
 Super Talent
 Team Group
 TwinMOS
 Samsung
 Dynet
 Hynix
 Patriot
 A-data
 Crucial
 PNY
 Neo Forza
 Seagate
 Western Digital
 HP
 Fujitsu
 Western Digital
 Plextor
 HP
 Seagate
 PNY
 Gigabyte
 Kingston
 ADATA
 AgeStar
 HP
 Lightwave
 Seagate
 SimpleTech
 S-tek
 Transcend
 Western Digital
 Gigabyte
 Benq
 LG
 LITE-ON
 Creative
 Logitech
 HP
 Gigabyte
 Genius
 Edifier
 Sayona
 Creative
 Logitech
 HP
 Codegen
 Gigabyte
 Gigabyte
 GlacialTech
 Godegen
 Mercury
 EVGA
 HP
 Gigabyte
 Zippy
 Logitech
 HP
 A4Tech
 Microsoft
 Creative
 Gigabyte
 Logitech
 HP
 A4Tech
 Genius
 Microsoft
 Creative
 HP
 Benq
 HP
 LG
 Asus
 Lenovo
 Gigabyte
 Benq
 Toshiba
 Canon
 Epson
 HP
 Xerox
 Samsung
 Mustek
 HP
 IRISCard
 Aztech
 Creative
 Shiro
 SMC
 Zyxel
 HP
 TP-Link
 AzTech
 Shiro
 SMC
 Gigabyte
 D-Link
 CNet
 TP-Link
 Zyxel
 HP
 Tp-Link
 SMC
 Kingston
 Super Talent
 TwinMOS
 Silicon Power
 Patriot
 Gigabyte
 GlacialTech
 Powercom
 Dexter
 Canon
 Epson
 Fullmark
 HP
 Lexmark
 Oki
 Panasonic
 Xerox
 Samsung
 Kaspersky
 Dr.Web
 McAfee
 GP
 HP
 Toshiba
 HP
 Toshiba
Производители
 A-data ABBYY
 ADATA Apple
 Aztech Benq
 Canon Codegen
 Creative Crucial
 DeepCool Dell
 Dexter EVGA
 Gigabyte GlacialTech
 GP HP
 Hynix Intel
 IRISCard Kaspersky
 Kingston Lenovo
 LG LITE-ON
 Logitech Microsoft
 Neo Forza Patriot
 Plextor PNY
 Powercom Samsung
 Seagate Shiro
 Silicon Power SMC
 Super Talent Team Group
 TP-Link TwinMOS
 Western Digital
Собери свой компьютер
Все современные ИИ провалили новый сложный тест на общий интеллект — люди с ним тоже справились не идеально

Новый тест для оценки общей интеллектуальной способности моделей искусственного интеллекта, получивший название ARC-AGI-2, поставил в тупик большинство ИИ-моделей. Согласно рейтингу, рассуждающие модели, такие как o1-pro от OpenAI и R1 от DeepSeek, набрали от 1 % до 1,3 %. Модели без логического мышления, включая GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash, набрали менее 1 %.



Фонд Arc Prize Foundation, некоммерческая организация, соучредителем которой является известный исследователь в области искусственного интеллекта Франсуа Шолле (François Chollet), объявил в своём блоге о создании нового, более продвинутого теста для измерения общего интеллекта ведущих моделей искусственного интеллекта.

Тест ARC-AGI-2 представляет собой серию головоломок, в которых ИИ должен распознать визуальные закономерности, анализируя разноцветные квадраты, и на основе этого построить правильное продолжение узора. Испытание специально разработано так, чтобы модели не могли полагаться на прошлый опыт и вынуждены были адаптироваться к новым задачам.

Также Arc Prize Foundation провела тестирование с участием более 400 человек. В среднем группы испытуемых верно ответили на 60 % заданий. Это значительно превосходит показатели всех протестированных ИИ и одновременно подчёркивает разрыв между текущими возможностями ИИ и интеллектом людей в решении задач, требующих адаптации и понимания новых концепций.

Шолле заявил, что ARC-AGI-2 является более точным показателем реального интеллекта ИИ-моделей, чем предыдущая версия теста ARC-AGI-1. Кроме того, ARC-AGI-2 исключает возможность решения задач «методом грубой силы», то есть путём использования огромной вычислительной мощности для перебора всех возможных вариантов, что происходило в тесте ARC-AGI-1 и было признано серьёзным недостатком.

Для устранения погрешностей первого теста в ARC-AGI-2 была введена метрика эффективности, которая заставляла ИИ интерпретировать паттерны «на лету», а не полагаться на запоминание. Сооснователь Arc Prize Foundation Грег Камрадт (Greg Kamradt) отметил, что «интеллект определяется не только способностью решать задачи или достигать высоких результатов, но и эффективностью, с которой приобретаются и развёртываются эти возможности».

ARC-AGI-1 оставался ведущей метрикой в течение примерно пяти лет, пока в декабре 2024 года OpenAI не выпустила свою продвинутую модель рассуждений o3. Эта модель превзошла все другие ИИ-модели и даже сравнялась с производительностью человека в тестах ARC-AGI-1. Однако, как было отмечено, эти достижения были достигнуты за счёт значительных вычислительных затрат.

Разработка нового теста совпала с ростом обеспокоенности в индустрии по поводу недостатка объективных критериев для оценки искусственного интеллекта. В связи с этим Arc Prize Foundation объявила о запуске конкурса Arc Prize 2025, в котором разработчикам предлагается достичь 85 % точности на ARC-AGI-2, затратив при этом вычислительных затрат не более, чем $0,42 на задачу.
 
Главная | Все новости