محققان تیم رباتیک گوگل، Code-as-Policies (CaP) را منبع باز میکنند، یک روش کنترل ربات که از یک مدل زبان بزرگ (LLM) برای تولید کد کنترل ربات استفاده می کند که به یک هدف مشخص شده توسط کاربر دست می یابد.
CaP از یک تکنیک تحریک سلسله مراتبی برای تولید کد استفاده می کند که از روش های قبلی در معیار تولید کد HumanEval بهتر عمل می کند. تکنیک و آزمایشها در مقالهای که در arXiv منتشر شد، توضیح داده شد. CaP با تلاش های قبلی برای استفاده از LLM برای کنترل روبات ها متفاوت است. به جای ایجاد توالی از مراحل یا سیاست های سطح بالا که توسط ربات فراخوانی می شوند، Cap به طور مستقیم کد پایتون را برای آن خط مشی ها تولید می کند. تیم Google مجموعهای از تکنیکهای تحریک را توسعه داده است که تولید کد را بهبود میبخشد، از جمله یک روش جدید درخواست سلسله مراتبی. این تکنیک در معیار HumanEval به امتیاز پیشرفته 39.8% pass@1 دست یافت.
https://asaco-it.com/wp-content/uploads/2020/06/Asset-4online-e1595754789705.png00Adloginhttps://asaco-it.com/wp-content/uploads/2020/06/Asset-4online-e1595754789705.pngAdlogin2022-12-01 09:01:392022-12-07 10:05:05گوگل با Code-as-Policies به رباتها اجازه میدهد کد خود را بنویسند