2

Ответ на пост «LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought»

Там целесообразность исходного исследования можно ставить под вопрос, так как они НЕ используют для него лучшие современные модели, которые как раз показывают значительный прирост качества, если им позволить рассуждать перед ответом на вопрос по физике/математике/программированию, где есть фиксированные правильные ответы. Они учат с нуля модельки в 100-1000 раз меньше, и говорят, что вот эти модельки типа плохо обобщают и значительно хуже работают за пределами обучающей выборки, что как бы не новость, при этом это мало говорит о топ-тир моделях. Товарищи китайцы, которые разрабатывали дипсик, в своем отчёте писали, что модель делает в процессе тренировки резкий скачок после того, как начинает употреблять слово Aha (так называемый aha moment). Есть ощущение, что нужно тестировать модели на их рассуждающую способность уже после того, как они этот aha moment прошли.

13

Ответ на пост «LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought»

А-а, никак ТС не поймёт, что ИИ это Т9 на максималках, только у него база шире (очень упрощённо). Требовать от него "думать" нерентабельно - с тем же успехом можно спросить у ясеня.

53

LLM и их хрупкая логика: новое исследование ставит под сомнение Chain-of-Thought

Ещё один гвоздь в крышку гроба "ИИ заменит ..."

Сперва ссылка на оригинал и на хабр

Коротко суть, в стиле для ЛЛ: научно доказано, что текущие технологии нейросетей не умеют анализировать, строить логические цепочки и цепочки рассуждений.

Фактический принцип работы нейросети прост. Есть база "вопрос - ответ" и есть механизм сопоставления произвольного ввода вопросу, на выходе ответ из таблицы.

То есть когда вы спрашиваете о чём-то нейросеть, то получаете из её базы ответ на наиболее похожий ранее заданный вопрос. Не больше и не меньше.

"Анализ", "рассуждения", "логика" нейросети - это использование прошлого вывода как нового запроса.

Если вопрос уже задавался и в базе обучения есть много правильных ответов - вы получите правильный ответ. Если вопрос ранее не задавался (не найдено прямое сопоставление), вопрос дискуссионный или просто наибольшее число ответов неверные, то... Нейросеть в качестве ответа будет писать полную чушь.

Было ли это известно разработчикам нейросетей и ИИ ранее? Безусловно. Кто изучал теорию работы нейросетей такому исследованию вообще не удивлён т.к. результат прямо следует из теории.

Почему раньше молчали и сейчас будут активно всё отрицать? Деньги. В проекты с ИИ вкладываются миллиарды долларов инвестиций в месяц и инвесторы вкладывают прежде всего в "ИИ заменит ...", но на самом деле не заменит и заменить не может.

P.S. "Гениям" из комментариев под прошлыми постами по теми хочется сказать следующее:

  1. Участников ИИ-стартапов я полностью понимаю, но подумайте над тем, чтобы начать обещать меньше и выполнять, чем обещать то, что физически невозможно сделать.

  2. Всем остальным - учите матчасть.

Как и любой другой инструмент ИИ имеет свои сферы применения, ограничения, границы эффективности и целесообразности применения. Физические границы.

Показать полностью
Отличная работа, все прочитано!