Наука и технологии

Специалисты создали платформу, чтобы оценивать производительность чат-ботов на базе искусственного интеллекта

autopodcast

Published

25.01.2026

Специалисты создали платформу, чтобы оценивать производительность чат-ботов на базе искусственного интеллекта

28 июля 2024, 09:11
, Источник: sciencedaily.com , Источник фото: freepik.com

Исследователи из Кембриджского университета разработали платформу CheckMate для оценки чат-ботов на основе искусственного интеллекта, таких как ChatGPT. Эта платформа позволяет пользователям взаимодействовать с большими языковыми моделями (LLM) и оценивать их производительность.

В ходе эксперимента исследователи обнаружили, что участники использовали три LLM в качестве помощников при решении математических задач на уровне бакалавриата.

В целом, чем правильнее был ответ чат-бота, тем больше пользы он приносил участникам. Однако иногда участники считали неправильные результаты чат-ботов правильными.

Исследователи предлагают модели, которые могут сообщать о неопределенности, хорошо реагировать на исправления пользователей и давать краткое обоснование своим рекомендациям.

In this article:

Наука и технологии

Исследование: мониторинг течения сахарного диабета не снижает риск сердечных заболеваний

04 июня 2024, 08:24 , Источник: gazeta.ru , Источник фото: freepik.com Американская команда ученых-медиков утверждает, что постоянный контроль за уровнями сахара и холестерина в...

autopodcast28.03.2025

Новый Mitsubishi Evolution обзаведется гибридной установкой

Авто

Новый Mitsubishi Evolution обзаведется гибридной установкой

Появились первые детальные данные о следующей генерации модели Mitsubishi Evolution. Машина будет оснащена силовой установкой гибридного типа, в состав которой войдут дизельный 3-цилиндровый мотор...

autopodcast12.06.2025

В РФ начались продажи Honda Vezel за 2,5 млн рублей

Авто

В РФ начались продажи Honda Vezel за 2,5 млн рублей

01 мая 2024, 12:30 , Источник: rusargument.ru , Источник фото: Авторевю Новая версия кроссовера Honda Vezel 2024 модельного года теперь доступна для отечественных клиентов....

autopodcast12.02.2025

Квартира на Ресторанной улице в Санкт-Петербурге

Архитектура и дизайн

Квартира на Ресторанной улице в Санкт-Петербурге

Дом, в котором находится эта квартира, принадлежал графу М. Толстому, родственнику Л. Н. Толстого. Он был построен по проекту известного архитектора Ф. Людваля. Поэтому...

autopodcast25.03.2026

autopodcast.ru

autopodcast.ru

Наука и технологии

Специалисты создали платформу, чтобы оценивать производительность чат-ботов на базе искусственного интеллекта

Специалисты создали платформу, чтобы оценивать производительность чат-ботов на базе искусственного интеллекта

В тренде

Наука и технологии

Исследование: мониторинг течения сахарного диабета не снижает риск сердечных заболеваний

Авто

Новый Mitsubishi Evolution обзаведется гибридной установкой

Авто

В РФ начались продажи Honda Vezel за 2,5 млн рублей

Архитектура и дизайн

Квартира на Ресторанной улице в Санкт-Петербурге

Авто

Renault анонсировала стоимость нового кросс-купе Rafale

Наука и технологии

5 полезных блюд для новогоднего стола

Авто

В России начались продажи нового кроссовера Changan CS55PLUS

Авто

В Россию – за иномаркой

Архитектура и дизайн

Идеи для дизайна квартиры: от декора до масштабного ремонта

Авто

Каков ты – «китаец»? Исследование подержанных авто.

You May Also Like

Наука и технологии

Исследование: мониторинг течения сахарного диабета не снижает риск сердечных заболеваний

Авто

Новый Mitsubishi Evolution обзаведется гибридной установкой

Авто

В РФ начались продажи Honda Vezel за 2,5 млн рублей

Архитектура и дизайн

Квартира на Ресторанной улице в Санкт-Петербурге