Поддержать нас
Беларусы на войне
  1. Святая троица советской медицины. Эти диагнозы знакомы всем беларусам — но за пределами пост-СССР о них никто не слышал. О чем речь
  2. С 19 июня вводят новые штрафы — кого и как будут наказывать рублем
  3. Синоптики предупредили об опасности в субботу
  4. «Если он этого не сделает, сделаем мы». Зеленский поставил Лукашенко ультиматум
  5. «Произошло то, чего мы совсем не ожидали». Популярная минская пекарня передумала закрываться
  6. «Посольство сдало меня КГБ». Иранского врача депортировали из Беларуси и лишили права въезда на 30 лет
  7. Певица и ведущая Водоносова, которая получила в Польше огромный счет после смерти матери, рассказала, чем закончилась история
  8. Зеленский рассказал, где в Беларуси стоят ретрансляторы, которые помогают России корректировать удары по Украине, и сколько их
  9. Банк России принял решение, которое способно повлиять на курс доллара в Беларуси
  10. Девятилетний мальчик прислал однокласснице сообщение: «Иди на х**, ша**ва». Мать девочки в шоке — а что стоит делать в такой ситуации
  11. «Если есть другой выбор, лучше сделать его». Россиянки, которые переехали в Беларусь, рассказали о своем опыте
  12. «Лукашенко понимает язык силы». Тихановская — о рисках для Беларуси после ультиматума Зеленского
  13. Три правила про деньги, которые «меняют все». Экономист — о том, что важно понимать тем, кто хочет копить деньги


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.