Исследование показало, что вероятность ошибки ИИ-агента в комплексных задачах достигает 63%

Исследование показало, что вероятность ошибки ИИ-агента в комплексных задачах достигает 63%

ИИ-агенты, используемые для автоматизации сложных задач, часто допускают ошибки, частота которых усиливается с увеличением числа шагов, пишет Business Insider. Исследование Patronus AI, стартапа, помогающего компаниям оценивать и оптимизировать технологии искусственного интеллекта показывает, что вероятность сбоя достигает 63% при 100 шагах, что угрожает бизнес-процессам компаний.
Читать далее...
00:10, 19.04.2025
 
Рубрика: «Это интересно»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Исследование TRASSIR и AIRI: применение мультимодальных моделей в задачах видеоаналитикиИсследование TRASSIR и AIRI: применение мультимодальных моделей в задачах видеоаналитики TRASSIR и институт AIRI завершили первый этап совместного исследовательского проекта, направленного на изучение потенциала... ...

Исследование OCS: в региональных проектах ИТ-интеграторов доля российских решений достигает 80%Исследование OCS: в региональных проектах ИТ-интеграторов доля российских решений достигает 80% Для своих региональных проектов ИТ-интеграторы используют 70–80% решений отечественных брендов, оценили аналитики... ...

Новое исследование показало, как сжечь до 500 калорий во снеНовое исследование показало, как сжечь до 500 калорий во сне Полноценный ночной сон (7–9 часов) помогает людям худеть. Компания по разработке фитнес-приложений Welltech выяснила, что ночью человек тратит сотни калорий. Тело никогда не отдыхает на 100%, оно работает и ночью — и сжигает до 500 калорий, что примерно равно количеству, которое человек тратит при б ...

Исследование показало снижение интереса молодежи к IT-направлениюИсследование показало снижение интереса молодежи к IT-направлению Самая молодая аудитория постепенно теряет интерес к IT-направлению: как выяснила платформа онлайн-курсов GetCourse, профессию IT-специалиста хотят получить лишь 18% респондентов в возрасте от 18 до 25 лет. Для сравнения, в группе людей от 45 лет IT остается одним из самых востребованных направлений ...

ChatGPT ошибается в диагнозах: исследование показало 63% неточностейChatGPT ошибается в диагнозах: исследование показало 63% неточностей Команда ученых из Университета Ватерлоо провела симуляционное исследование, которое показало: популярные нейросети, в том числе ChatGPT-4o, часто дают неверные медицинские советы. Почти две трети открытых диагностических вопросов нейросеть обработала с ошибками. Ученые адаптировали около 100 задач и ...

Исследование показало, что мед усиливал пробиотические свойства йогуртаИсследование показало, что мед усиливал пробиотические свойства йогурта Ханна Хольшер из Иллинойсского университета исследовала полезные для микрофлоры кишечника сочетания продуктов и выяснила, что мед способен усиливать пробиотические свойства йогурта у взрослых. Новое исследование показало, что добавление меда, особенно клеверного, к простому йогурту усиливает его про ...

Большинство текстов ИИ проходят антиплагиат, показало исследование МГУБольшинство текстов ИИ проходят антиплагиат, показало исследование МГУ Специалисты Московского государственного университета им. М. В. Ломоносова провели анализ текстов, созданных популярными чат-ботами. В результате выяснилось, что около 80% таких текстов показывают уникальность выше 75%, что означает достаточно высокое качество генерации. В ходе эксперимента ученые д ...

Исследование показало, что мозг начинает готовиться к завтрашнему дню еще во снеИсследование показало, что мозг начинает готовиться к завтрашнему дню еще во сне Ученые из Японии попытались узнать больше о роли сна в обработке памяти. Исследование показало, что во сне мозг не только закрепляет прошлый опыт, но и подготавливается к запоминанию новой информации. ...

Исследование показало преимущества письменного обучения для детейИсследование показало преимущества письменного обучения для детей Исследователи из Университета Страны Басков пришли к выводу, что обучение письму от руки способствует лучшему запоминанию букв и усвоению навыков чтения детьми. Эксперимент проводился среди пятидесяти будущих первоклашек, владеющих испанским языком, но не умеющих читать. Ребята были разделены на чет ...

YouTube полон нелегального контента, показало исследованиеYouTube полон нелегального контента, показало исследование Исследование компании Adalytics показало, что YouTube остаётся одной из главных площадок для распространения пиратского контента. На платформе можно найти даже фильмы, которые ещё идут в кинотеатрах или только готовятся к премьере. Общее число просмотров таких материалов превысило 250 миллионов. ...

Исследование показало, что люди по-разному воспринимают фоновый шумИсследование показало, что люди по-разному воспринимают фоновый шум Ученые из 25 лабораторий в 10 странах провели масштабное исследование, которое подтвердило, что у людей разные способности воспринимать фоновый шум. Результаты работы опубликованы в журнале Royal Society Open Science. Ранее, десять лет назад, была проведена похожая работа, но она основывалась всего ...

Исследование показало, как россияне оценивают риск восстания машин из-за ИИИсследование показало, как россияне оценивают риск восстания машин из-за ИИ 32% россиян допускают возможность восстания машин из-за развития искусственного интеллекта (ИИ). Однако большинство граждан не поддерживают идею полного запрета нейросетей, признавая их полезность. Совместное исследование Telegram-канала 360.ru и сервиса Anketolog показало, что 71% респондентов счит ...

Исследование показало рекордное число закрывшихся в Германии предприятийИсследование показало рекордное число закрывшихся в Германии предприятий В прошлом году в Германии закрылось более 196 тыс. предприятий. Об этом стало известно 21 мая из совместного исследования Центра исследований экономики Европы (Zentrum für Europäische Wirtschaftsforschung, ZEW) и немецкой кредитной компании Creditreform. ...

Исследование показало, что ИИ высвобождает фирмам до 12,2 рабочего часа в неделюИсследование показало, что ИИ высвобождает фирмам до 12,2 рабочего часа в неделю Аналитики, в частности, исследовали скорость реализации таких сценариев, как подготовка и отправка договоренностей на встречах, собственная фиксация итогов встречи ...

Исследование показало, что удовлетворенность жизнью имеет генетические корниИсследование показало, что удовлетворенность жизнью имеет генетические корни Новое исследование, опубликованное в журнале Journal of Personality & Social Psychology, показало, что черты личности и удовлетворенность жизнью в значительно большей степени наследуются, чем считалось ранее. ...

Исследование показало, какие цвета автомобилей предпочитают россиянеИсследование показало, какие цвета автомобилей предпочитают россияне Согласно исследованию экспертов сервиса «Автокод», проведенному на основании отчетов о проверках автомобилей в России за весну 2025 года, белый и черный цвета остаются наиболее популярными среди автолюбителей. На белые автомобили пришлась 12,8 тыс. проверок, а черные модели получили 10,2 тыс. провер ...

Рассматривание картин улучшает психическое здоровье, показало исследованиеРассматривание картин улучшает психическое здоровье, показало исследование Новая международная работа, проведенная учеными из Университета Вены, показала, что даже просто просмотр картин и посещение музеев могут положительно влиять на психическое здоровье. Исследование, опубликованное в Journal of Positive Psychology, является первым, которое систематически изучает, как им ...

Позитивный настрой помогает сохранить память после 50 лет, показало исследованиеПозитивный настрой помогает сохранить память после 50 лет, показало исследование Исследование, длившееся 16 лет и охватившее более 10 тысяч британцев старше 50 лет, показало, что люди с более высоким уровнем психологического благополучия со временем демонстрировали лучшие результаты в тестах на память. Участники оценивали свое самочувствие, ощущение контроля над жизнью и свободу ...

Исследование показало ограниченную точность Apple Watch при подсчёте калорийИсследование показало ограниченную точность Apple Watch при подсчёте калорий Новое мета-исследование Университета Миссисипи выявило: Apple Watch точно измеряет частоту пульса и количество шагов, но значительно ошибается при расчёте сожжённых калорий. Учёные проанализировали 56 работ, сравнивающих показатели умных часов с эталонными измерительными приборами. Точные показатели ...

Гравитационное исследование показало причину различий между сторонами ЛуныГравитационное исследование показало причину различий между сторонами Луны Новые данные о том, почему две стороны Луны — одна, постоянно обращенная к Земле, и другая, всегда отвернутая, — выглядят настолько по-разному, получены НАСА, 15 мая указано в публикации в журнале Nature.Благодаря двум автоматическим космическим аппаратам НАСА в рамках миссии GRAIL (Gravity Recovery ...

Исследование показало, что люди с тревожностью обладают одной уникальной способностьюИсследование показало, что люди с тревожностью обладают одной уникальной способностью Ученые обнаружили, что у детей и подростков с генерализованным тревожным расстройством наблюдается усиленная связь в мозговой сети, отвечающей за реагирование на неожиданные события. Эта связь ослабевает у тех, кто выздоравливает от расстройства, что может служить маркером тревожности на уровне мозг ...

Волонтёрство по карману: удивительные выводы показало международное исследование о щедростиВолонтёрство по карману: удивительные выводы показало международное исследование о щедрости Международная группа ученых проанализировала данные более 2,3 млн человек из 60 стран и выяснила, что богатые люди чаще делают добро, чем бедные. "Из-за нехватки ресурсов представителям низших слоев общества дорого вести себя просоциально по отношению к другим", — сказано в исследовании. Просоциальн ...

Исследование показало зависимость между сырным перекусом на ночь и кошмарамиИсследование показало зависимость между сырным перекусом на ночь и кошмарами Исследование, проведенное люксовым брендом сна The Odd Company в Британии с участием 30 человек, требовало в течение четырех ночей употреблять четыре самых популярных сыра в стране: бри, чеддер, стилтон и моцареллу. Оказалось, что употребление 30 г сыра перед сном увеличивало вероятность кошмаров на ...

Сотрудники, использующие ИИ, более продуктивны и зарабатывают больше, показало исследованиеСотрудники, использующие ИИ, более продуктивны и зарабатывают больше, показало исследование Внедрение искусственного интеллекта в рабочие процессы приносит компаниям ощутимую пользу. Согласно новому отчету консалтинговой фирмы PwC, работники, наиболее активно использующие ИИ, значительно превосходят своих коллег по производительности и росту доходов. Это опровергает опасения о том, что ИИ ...

Студенты делегируют сложные интеллектуальные задачи нейросетям, показало исследованиеСтуденты делегируют сложные интеллектуальные задачи нейросетям, показало исследование Новое исследование Anthropic выявило, как студенты используют языковую модель Claude в повседневной учебной работе. Оказалось, что учащиеся преимущественно используют ИИ для решения сложных интеллектуальных, а не рутинных задач. ...

Исследование показало, что люди более довольны своими отношениями с собакой, чем с родственникамиИсследование показало, что люди более довольны своими отношениями с собакой, чем с родственниками Исследователи обнаружили, что владельцы оценивают свои отношения с собаками как столь же удовлетворительные или более удовлетворительные, чем их близкие отношения с друзьями. Это не было связано с тем, что у некоторых людей были более слабые отношения с близкими. ...

Исследование НИУ ВШЭ показало, что повторное использование интерфейса помогает преодолеть синдром утенкаИсследование НИУ ВШЭ показало, что повторное использование интерфейса помогает преодолеть синдром утенка Пользователи часто предпочитают старые версии интерфейсов новым из-за когнитивного искажения, известного как... ...

Исследование Google показало, что современная криптография уязвима перед квантовыми компьютерамиИсследование Google показало, что современная криптография уязвима перед квантовыми компьютерами Исследование Google показало, что 2048-битный ключ шифрования RSA — современный стандарт для онлайн-безопасности — может быть взломан за несколько дней квантовым компьютером с менее чем миллионом кубитов. Это открытие резко снизило требования к конфигурации квантового компьютера по сравн ...

Исследование показало, сколько раз нужно заниматься сексом, чтобы снизить риск депрессииИсследование показало, сколько раз нужно заниматься сексом, чтобы снизить риск депрессии Новое исследование, опубликованное в журнале Journal of Affective Disorders, показывает, что люди, которые занимаются сексом не менее одного раза в неделю, реже испытывают симптомы депрессии. Результаты также предполагают, что секс один-два раза в неделю может принести наибольшую психологическую пол ...

Исследование показало, что подростки, которые рано ложатся спать, обладают более острым умомИсследование показало, что подростки, которые рано ложатся спать, обладают более острым умом Исследование показало, что подростки, которые ложатся спать раньше и спят дольше своих сверстников, как правило, обладают более острыми умственными способностями и показывают более высокие результаты в когнитивных тестах. При этом даже небольшие изменения во сне оказывают влияние на мышление молодых ...

От выбора кино до разговора по душам: исследование показало, какие задачи и вопросы люди доверяют искусственному интеллектуОт выбора кино до разговора по душам: исследование показало, какие задачи и вопросы люди доверяют искусственному интеллекту Россияне все больше внедряют искусственный интеллект (ИИ) в свою жизнь, будь то рабочие задачи, бытовые вопросы или организация досуга и поездок. Однако разговаривать с цифровым собеседником люди пока не готовы. В апреле 2025 года МегаФон провел исследование в 10 крупнейших городах страны. Более 3 6 ...

Береста РК и Fplus стали партнерами в области комплексных ИТ-решений«Береста РК» и Fplus стали партнерами в области комплексных ИТ-решений «Береста РК», разработчик российского программного обеспечения систем резервного копирования «Береста», и производитель... ...

Андрей Мостовой о судействе: Не самая сильная сторона в российском футболе. Отношусь спокойно. Ну, ошибки и ошибкиАндрей Мостовой о судействе: «Не самая сильная сторона в российском футболе. Отношусь спокойно. Ну, ошибки и ошибки» Полузащитник «Зенита» выразил мнение после матча Мир РПЛ с «Пари НН» (2:1), который обслуживал арбитр Сергей Карасев. «Да все как обычно. Это сейчас не самая сильная наша сторона в российском футболе. Поэтому спокойно отношусь. Ну, ошибки и ошибки», – сказал Андрей Мостовой. Соболев дублем спас интр ...

Извещение о начале выполнения комплексных кадастровых работ в границах кадастрового квартала 72:17:0704001Извещение о начале выполнения комплексных кадастровых работ в границах кадастрового квартала 72:17:0704001 В период с 30 апреля 2025 г. по 15 декабря 2025 г. в отношении объектов недвижимости, расположенных на территории: г. Тюмень в границах кадастрового квартала 72:17:0704001, будут выполняться комплексные кадастровые работы в соответствии с муниципальным контрактом от 30.04.2025 № 09/25 ...

Извещение о начале выполнения комплексных кадастровых работ в границах кадастрового квартала 72:17:0704003Извещение о начале выполнения комплексных кадастровых работ в границах кадастрового квартала 72:17:0704003 В период с 30 апреля 2025 г. по 15 декабря 2025 г. в отношении объектов недвижимости, расположенных на территории: г. Тюмень, в границах кадастрового квартала 72:17:0704003, – будут выполняться комплексные кадастровые работы в соответствии с муниципальным контрактом от 30.04.2025 № 10/25 ...

Карпин рассказал о задачах Динамо на трансферном рынкеКарпин рассказал о задачах "Динамо" на трансферном рынке Главный тренер московского "Динамо" Валерий Карпин высказался о трансферных задачах клуба. ...

GPT-4 соответствует человеческим возможностям в задачах на аналогичное рассуждениеGPT-4 соответствует человеческим возможностям в задачах на аналогичное рассуждение Могут ли большие языковые модели (LLM) рассуждать по аналогии? Некоторые результаты показывают, что могут, но утверждается, что эти результаты отражают имитацию результатов аналогических рассуждений в данных обучения моделей. Чтобы проверить это утверждение, LLM-ов попросили решить контрфактуальные ...

Путин заявил о масштабных задачах для судостроения РоссииПутин заявил о масштабных задачах для судостроения России Президент Владимир Путин в поздравлении работникам и ветеранам судостроительной отрасли подчеркнул, что важнейшей задачей для отрасли России сейчас становится укрепление безопасности морских рубежей и развитие арктических ледоколов для круглогодичной навигации. Перед судостроительной отраслью России ...

ИИ-агенты оказались лучше 90% хакеров в сложнейших задачахИИ-агенты оказались лучше 90% хакеров в сложнейших задачах Автономные ИИ-агенты демонстрируют впечатляющие результаты в соревнованиях по кибербезопасности, иногда превосходя команды людей-хакеров. Серия недавних турниров, организованных Palisade Research, показала, что ИИ-системы способны напрямую конкурировать с людьми и даже побеждать их. Это открывает но ...

Организаторы XIII Съезда молодых ученых рассказали о его задачахОрганизаторы XIII Съезда молодых ученых рассказали о его задачах Ольга Тарасова, член Координационного совета по делам молодежи научно-образовательной сферы Совета по науке при президенте России, соавтор проекта «Наша лаба» отметила, что в этом году съезд молодых ученых – особенный. – К примеру, в прошлом году во Владивостоке не было такой большой выставочной про ...

Звезды Приключений Электроника рассказали о своих задачах в зоне СВОЗвезды «Приключений Электроника» рассказали о своих задачах в зоне СВО Актеры Юрий и Владимир Торсуевы, которые сыграли главные роли в знаменитом детском фильме «Приключения Электроника» Константина Бромберга, являются генералами казачьего подразделения в зоне специальной военной операции. ...

Путин рассказал о масштабных задачах судостроительной отрасли РоссииПутин рассказал о масштабных задачах судостроительной отрасли России Перед судостроительной отраслью России стоят масштабные задачи для обеспечения безопасности морских рубежей страны. Об этом 29 июня заявил президент РФ Владимир Путин. «Сегодня перед судостроительной отраслью стоят масштабные, востребованные временем задачи. Их решение имеет принципиальное значение. ...

Пока еще на высоких отметках: Путин рассказал о задачах для экономики РФ«Пока еще на высоких отметках»: Путин рассказал о задачах для экономики РФ Скандал в благородном собрании. Колыбель глобалистов — Давос — лихорадит. Основатель и бессменный предсдатель форума Клаус Шваб внезапно сложил с себя все полномочия и против него началось внутреннее расследование. Нехорошим человеком внезапно оказался господин Шваб! То, что он кассой фо ...

ИИ теперь экономит пользователям Test IT до 50% времени на задачах тестированияИИ теперь экономит пользователям Test IT до 50% времени на задачах тестирования Test IT, бизнес-подразделение «Девелоники» (ГК Softline), выпустило новый релиз одноименной платформы управления тестированием.... ...

Большинство россиян экономят время на рутинных задачах с помощью ИИБольшинство россиян экономят время на рутинных задачах с помощью ИИ Эксперты финансового маркетплейса «Выберу.ру» узнали, как россияне используют нейросети Исследование финансового маркетплейса «Выберу.ру» показало, что 72% россиян уверены: ИИ-ассистенты помогают экономить время и повышают эффективность. Ещё 18% респондентов отметили, что благодаря нейросетям удаётс ...

Bitfufu достигает 36,2 EH/S Hashrate, 728 МВт в июнеBitfufu достигает 36,2 EH/S Hashrate, 728 МВт в июне Bitcoin Miner Bitfufu (FUFU) произвел 445 биткойн в июне-на 11,3% прыжок с мая-при расширении своей инфраструктуры на пяти континентах. Это включает в себя 3,8 EH/S от собственных операций Bitfufu и 32,4 EH/S от сторонних поставщиков и хостинга. Силовая вместимость под руководством поднялась на 11,8 ...

ВСУ начали проверку слов комбата о дебильных задачах в Курской областиВСУ начали проверку слов комбата о «дебильных задачах» в Курской области Комбат 47-й бригады ВСУ «Магура» Ширшин раскритиковал военное руководство, заявив о «дебильных задачах» в Курской области, потерях людей и «политических» играх. Генштаб ВСУ решил провести проверку после его слов ...

Шабаров рассказал о задачах молодежной сборной России на матчи с УзбекистаномШабаров рассказал о задачах молодежной сборной России на матчи с Узбекистаном Главный тренер молодежной сборной России Иван Шабаров ответил на вопросы перед товарищескими матчами против сверстников из Узбекистана. ...

Рубио: США готовы сфокусироваться на других задачах вместо поддержки УкраиныРубио: США готовы сфокусироваться на других задачах вместо поддержки Украины Вашингтон три года поддерживал Киев, но теперь готов сфокусироваться на других задачах. Об этом заявил госсекретарь США Марко Рубио. По его словам, США смогут в течение нескольких дней понять, можно ли завершить конфликт на Украине. ...

В Федерации дзюдо России рассказали о задачах сборной на предстоящем чемпионате мираВ Федерации дзюдо России рассказали о задачах сборной на предстоящем чемпионате мира В организации рассчитывают на достойное выступление спортсменов, не ставя конкретных медальных целей ...

Биткойн достигает 107 000 долларов, так как геополитические кризисы попадаютБиткойн достигает 107 000 долларов, так как геополитические кризисы попадают Цена на биткойны побила много записей в последние годы и только что достигла 107 000 долларов с строительством импульса вокруг геополитических конфликтов. С июня 2020 года Gold выросла на 90%. Ранние инвесторы биткойнов заработали много денег, оставив после себя новых инвесторов, которые могут задат ...

Дефицит учителей в российских селах достигает 30%, врачей  50%Дефицит учителей в российских селах достигает 30%, врачей – 50% Российским сельским школам не хватает трети врачей, а дефицит медиков достигает 50%. Об этом сообщил председатель Госдумы Вячеслав Володин. «Результаты проверок Счетной палаты показывают, что в школах, особенно сельских, не хватает порядка 30% учителей. ...

Bitcoin Miner Cleanspark достигает 50 EH/S Hashrate MilestoneBitcoin Miner Cleanspark достигает 50 EH/S Hashrate Milestone Cleanspark (CLSK), базирующаяся в США, фирма по добыче биткойна BTC, заявила во вторник, что она достигла 50 Exahashes в секунду (EH/S) операционного хэшрата-веха, которая делает его одной из крупнейших горнодобывающих операций в мире. Вертикально интегрированная настройка дает контроль за закупкой ...

Тренер сборной России Лукич рассказал о задачах команды в летних товарищеских матчахТренер сборной России Лукич рассказал о задачах команды в летних товарищеских матчах Главный тренер сборной России Зоран Лукич рассказал о задачах для команды в товарищеских матчах с Иорданией, Египтом и Ираном. ...

Число погибших при крушении самолета в Индии достигает 300 человекЧисло погибших при крушении самолета в Индии достигает 300 человек На борту разбившегося индийского самолета в том числе находились британцы и португальцы. Число жертв авиакатастрофы приближается к 300. ...

1.3-дюймовая панель Samsung Display OLEDoS достигает яркости 20 000 нит1.3-дюймовая панель Samsung Display OLEDoS достигает яркости 20 000 нит В преддверии запуска первой XR-гарнитуры, компания Samsung Display представила свои новейшие разработки на выставке Augmented World Expo (AWE) USA 2025. ...

Руцентр: стоимость доменов в зоне .рф достигает 4,5 миллиона рублей«Руцентр»: стоимость доменов в зоне .рф достигает 4,5 миллиона рублей Компания по управлению онлайн-активами «Руцентр» в честь 15-летия зоны .рф анонсирует ключевые направления развития... ...

Погрешность Apple Watch при подсчете калорий достигает почти 28%Погрешность Apple Watch при подсчете калорий достигает почти 28% Несмотря на то, что смарт-часы Apple демонстрируют высокую точность при измерении пульса и шагов, определение количества потраченных калорий, как выяснилось, остается их слабым местом. ...

РКН: число уведомлений об обработке данных от компаний достигает 150 тыс. в суткиРКН: число уведомлений об обработке данных от компаний достигает 150 тыс. в сутки В связи с большим количеством обращений возможны временные замедления в работе сервиса, через который осуществляется подача заявления на начало обработки персональных данных ...

Глава СПЧ: ежедневный ущерб от кибермошенничества достигает 1 млрд рублейГлава СПЧ: ежедневный ущерб от кибермошенничества достигает 1 млрд рублей Председатель Совета при президенте РФ по развитию гражданского общества и правам человека Валерий Фадеев заявил, что ежедневный ущерб от кибермошенничества в России составляет порядка 1 млрд рублей. Фадеев отметил, что СПЧ представит доклад о цифровой трансформации и защите прав граждан в цифровом п ...

ECHOMSK.SPB.RU Поиск в новостях