Еще один эксперимент OpenAI с нейросетями

Технологии и рынок |

OpenAI построили модель мира, в которой одна команда прячется от другой, т.е. условно физический мир в котором одни боты делают все чтобы их не нашли другие. Боты обучались с подкреплением, запоминая какие их действия с большей вероятностью приводили к победе. И научились довольно неплохо прятаться, используя подручные предметы.

Потом исследователи стали усложнять правила, добавляя новые обьекты, позволяя перелазить через некоторые стены. И каждый раз боты выбирали новую оптимальную стратегию.

Для первоначальных простых условий не стоило бы писать нейронную сеть и вообще ИИ, достаточно было описать очень простые алгоритмы, которые эффективно решали бы задачу. Но чем сложнее становились условия, тем эффективнее было именно решение с ИИ.

Поделиться

Обсудить