Это кажется банальным, но может заблокировать искусственный интеллект. Что на самом деле не понимает ИИ, когда дело доходит до цветов

Даже если искусственный интеллект, кажется, способен ответить на какой -либо вопрос, составлять стихи или генерировать сложные изображения, существует тонкое, но фундаментальное препятствие, которое все еще отделяет его от человеческого понимания: прямой сенсорный опыт. Недавнее исследование, опубликованное в Природа человеческое поведение Это показывает, что передовые модели, такие как GPT-4 или Gamini, испытывают серьезные трудности в понимании, казалось бы, простых концепциях, таких как цветок, таким же глубоким и интуитивным образом, как и люди.

Причина проста и часто упускается из виду: ИИ не имеет запаха, у него нет кожи, он не может ходить в цветочном поле, он не может коснуться лепестков, или вы чувствуете ветерок утром. Все эти элементы, которые для людей дают полное значение слову, такому как «цветок», полностью отсутствуют в системах искусственного интеллекта. Хотя я могу описать цветок на основе текстов или изображений, с которыми они были обучены, эти модели не могут испытывать то, что значит быть в его присутствии.

Почему ИИ работает в абстрактном, но слабом для сенсорного

Исследователи проанализировали 4442 слова, сравнивая то, как они воспринимаются людьми, и у вас есть больше измерений: эмоциональная интенсивность, способность генерировать ментальные образы, связь с ощущениями (запах, прикосновение, звук, вкус) и с движением (физические действия по умолчанию).

Результаты были ясны:

ИИ хорошо справляется с абстрактными терминами-математическими, социальными или лингвистическими концепциями;
Производительность резко уменьшается в терминах, прикрепленных к сенсорным и моторным опытам, таким как «пламя», «снег», «кожа» или «цветок».

Этот разрыв исходит от самой архитектуры крупных лингвистических моделей (LLM): они обучены почти исключительно в тексте. Тем не менее, язык не может полностью играть то, что записывают Человеческие чувства. Для ИИ «Цветок» представляет собой комбинацию атрибутов из текстовых корпораций — цвет, духи, случаи — но без прямой жизни понимание поверхностно и функционально, а не подлинно.

Что следует: у вас есть чувства?

Исследование привлекает внимание к тому факту, что для того, чтобы искусственный интеллект действительно развивался в «человеческое» понимание мира, оно должно преодолеть текущие барьеры и интегрировать данные из реальных чувств, датчиков, комнат и роботизированных систем, которые взаимодействуют физически.

Первые мультимодальные модели (текст + изображение) уже показали прогресс в визуальном понимании. Следующим шагом может быть добавление тактильной, обонятельной или слуховой информации, чтобы можно было сказать, возможно, впервые, не только то, как выглядит цветок, но и то, как он себя чувствует.

Однако до тех пор, однако, искусственный интеллект остается заблокированным в словах, неспособной по -настоящему прикоснуться к тому, что кажется тривиальным для людей: цветок.