Connect with us

Hi, what are you looking for?

autopodcast.ru

Наука и технологии

Недостатки традиционных тестов для оценки ИИ и необходимость новой системы оценки

Недостатки традиционных тестов для оценки ИИ и необходимость новой системы оценки

Недостатки традиционных тестов для оценки ИИ и необходимость новой системы оценки

02 сентября 2025, 04:03
, Источник: techxplore.com , Источник фото: freepik.com
Недостатки традиционных тестов для оценки ИИ и необходимость новой системы оценки

Когда компания OpenAI выпустила GPT-5, она заявила, что новая система «намного умнее» предыдущих моделей, ссылаясь на высокие баллы в тестах по программированию, математике и здравоохранению. Такие тесты важны, но они мало говорят о реальной производительности ИИ.

Группа исследователей ИИ и метрологов предложила новый подход к оценке систем ИИ, учитывая их надежность, экономическое, культурное и социальное влияние. Проблема текущих тестов — они не отражают реальные условия работы ИИ.

Для разработчиков ИИ важно демонстрировать эффективность через бенчмарки, но они могут манипулировать результатами. Например, стартап Cognition AI привлек 175 млн долларов США после успешных тестов, а Meta скорректировала модель Llama-4 для улучшения показателей.

Современные системы достигают высоких результатов в тестах, но не отражают сложности реальной практики. В медицине используется система MedHELM с 35 контрольными показателями. Однако эти методы не учитывают взаимодействие людей с ИИ и их влияние на общество.

Необходима новая система оценки, основанная на опыте научных кругов, промышленности и общества. Она должна включать «красную команду» и полевое тестирование для измерения реального влияния ИИ.

Если ИИ оправдает надежды, наука об измерениях должна защищать интересы всех, а не только технологической элиты.

You May Also Like

Наука и технологии

04 июня 2024, 08:24 , Источник: gazeta.ru , Источник фото: freepik.com Американская команда ученых-медиков утверждает, что постоянный контроль за уровнями сахара и холестерина в...

Авто

Появились первые детальные данные о следующей генерации модели Mitsubishi Evolution. Машина будет оснащена силовой установкой гибридного типа, в состав которой войдут дизельный 3-цилиндровый мотор...

Авто

01 мая 2024, 12:30 , Источник: rusargument.ru , Источник фото: Авторевю Новая версия кроссовера Honda Vezel 2024 модельного года теперь доступна для отечественных клиентов....

Архитектура и дизайн

Дом, в котором находится эта квартира, принадлежал графу М. Толстому, родственнику Л. Н. Толстого. Он был построен по проекту известного архитектора Ф. Людваля. Поэтому...

Copyright © 2025 Обратная связь info@gototop.ee