Cоздать sandbox и механизм генерации reasoning/логики на неизвестных задачах: наблюдать, как агент формирует новые reasoning-паттерны и осмысленно реагирует на нестандартные треки.