محققان تیم رباتیک گوگل، Code-as-Policies (CaP) را منبع باز میکنند، یک روش کنترل ربات که از یک مدل زبان بزرگ (LLM) برای تولید کد کنترل ربات استفاده می کند که به یک هدف مشخص شده توسط کاربر دست می یابد.

CaP از یک تکنیک تحریک سلسله مراتبی برای تولید کد استفاده می کند که از روش های قبلی در معیار تولید کد HumanEval بهتر عمل می کند. تکنیک و آزمایش‌ها در مقاله‌ای که در arXiv منتشر شد، توضیح داده شد. CaP با تلاش های قبلی برای استفاده از LLM برای کنترل روبات ها متفاوت است. به جای ایجاد توالی از مراحل یا سیاست های سطح بالا که توسط ربات فراخوانی می شوند، Cap به طور مستقیم کد پایتون را برای آن خط مشی ها تولید می کند. تیم Google مجموعه‌ای از تکنیک‌های تحریک را توسعه داده است که تولید کد را بهبود می‌بخشد، از جمله یک روش جدید درخواست سلسله مراتبی. این تکنیک در معیار HumanEval به امتیاز پیشرفته 39.8% pass@1 دست یافت.


بیشتر بدانید: https://lnkd.in/e-b4_GEu