کمک انویدیا به سگ های رباتیک برای حفظ تعادل حتی روی توپ بادی
به گزارش بی دانلود، شرکت انویدیا با ابزاری معروف به «یوریکا»(Eureka) به سگ های رباتیک کمک می نماید تا تعادل خویش را حتی روی یک توپ یوگا به خوبی حفظ کنند.
به گزارش بی دانلود به نقل از ایسنا، پژوهشگران از پلت فرم یوریکا ساخته شرکت انویدیا که یک الگوریتم آموزش ربات هاست، برای آموزش یک ربات چهارپا به منظور حفظ تعادل و راه رفتن روی یک توپ یوگا بهره برده اند.
یوریکا در واقع یک مدل زبان بزرگ(LLM) است که در ایجاد کد برای آموزش مهارت ها به ربات ها و شبیه سازی و توسعه چاره هایی به آنها که بر چالش های مختلف غلبه کنند، متخصص است.
محققان ادعا می کنند که این سیستم به صورت یکپارچه عمل می کند و کل فرایند را از کسب مهارت اولیه تا پیاده سازی در دنیای واقعی به صورت خودکار اجرایی می کند و یک انتقال آرام از محیط های مجازی به استقرار عملی را تضمین می نماید.
این تیم از این پلت فرم برای آموزش سگ رباتیک در وظایف شبیه سازی بهره برد و سپس آنرا به شرایط کاری واقعی منتقل کرد. سپس مشاهده شد که این ربات در نخستین تلاش خود موفق به انجام این کار شد و نیازی به تنظیمات بیشتر نبود.
خودکارسازی رباتیک
محققان تاکید می کنند که استفاده از موفقیت های به دست آمده در شبیه سازی برای برنامه های کاربردی در دنیای واقعی، نوید قابل توجهی را در افزایش سطح کسب مهارت ربات ها می دهد.
با این حال، این روش ها اغلب به پیکربندی دستی و تنظیم توابع پاداش وظیفه و پارامترهای فیزیک شبیه سازی نیاز دارند که منجر به پیشرفت آهسته می شود و به تلاش قابل توجه انسانی نیاز دارد.
جیم فن، مدیر ارشد تحقیقات و سرپرست هوش مصنوعی در انویدیا می گوید: به صورت سنتی، انتقال به حقیقت با تصادفی سازی دامنه به دست می آید که فرآیندی خسته کننده است که نیازمند نیروهای انسانی متخصص است تا بر هر پارامتر دقیق شوند و به صورت دستی آنرا تنظیم کنند.
یوریکا با در نظر گرفتن دستورالعمل های کار و ایمنی، همراه با کد منبع محیط کار می کند. سپس یک تابع پاداش و خط مشی استاندارد شده تولید می کند. سپس اینها در شرایط مختلف شبیه سازی آزمایش می شوند.
سر انجام توسط مدل زبان بزرگ برای تولید طیفی از پارامترهای تصادفی سازی دامنه(DR) استفاده می شود و با استفاده از پارامترهای پاداش و DR ترکیب شده، وظایف آماده برای استقرار در دنیای واقعی را آموزش می دهد.
مدلهای زبان بزرگ پیشرفته مانند GPT-4 مجهز به درک داخلی گسترده ای از مفاهیم فیزیکی مانند اصطکاک، تعادل، سختی، گرانش و غیره هستند.
فن می گوید: ما خیلی متعجب شدیم که متوجه شدیم یوریکا می تواند این پارامترها را به خوبی تنظیم کند و استدلال خویش را به خوبی توضیح دهد.
سازگاری با دنیای واقعی
این تیم با ارزیابی حرکت سگ رباتیک، آموزش های یوریکا را در زمینه های مختلف در دنیای واقعی آزمایش کرد.
نتایج، استقامت و عملکرد برتر آنرا در مقایسه با سیاست های آموزش با پاداش و تنظیمات تصادفی طراحی شده نشان داد.
محققان می گویند: عملکرد یوریکا استقامت قابل ملاحظه ای را در دنیای واقعی نشان داده است و تعادل ماهرانه و راه رفتن روی یک توپ یوگا را درحال حرکت و آشفتگی های مختلف و کنترل نشده شرایط زمین در دنیای واقعی میسر می کند.
علاوه بر این، بهبود زیربرنامه طراحی پاداش یوریکا با ادغام دستورالعمل های ایمنی از قابلیت های پیشین پیشی می گیرد که محققان اهمیت آنرا در ایجاد توابع پاداش کافی برای استقرار در دنیای واقعی به صورت ایمن می دانند.
این یافته های کلیدی اهمیت استفاده از یوریکا را برای ایجاد سیستم آگاه از پاداش و به موفقیت رسیدن نشان داده است. علاوه بر این، استفاده از مدل زبان بزرگ برای نمونه برداری از پارامترهای تصادفی سازی دامنه به منظور بهینه سازی عملکرد در دنیای واقعی حیاتی می باشد.
پژوهشگران با نگاهی به آینده می گویند راه های زیادی برای تقویت بیشتر یوریکا وجود دارد. بعنوان مثال هم اکنون، سیاست های یوریکا صرفا در شبیه سازی آموزش خلاصه می شود، اما استفاده از بازخوردها در دنیای واقعی می تواند به مدلهای زبان بزرگ کمک نماید تا روش های بهینه تری را در نسخه های بعدی بگنجانند.
علاوه بر این، تمام وظایف و سیاست ها در این مطالعه تنها به ورودی های حسی داخلی ربات متکی است و یکپارچه سازی بینایی یا سایر حسگرها می تواند عملکرد خط مشی و حلقه بازخورد مدل زبان بزرگ را افزایش دهد.
جزئیات این مطالعه توسط تیم محققان دانشگاه پنسیلوانیا، دانشگاه تگزاس در آستین و پژوهشگران شرکت انویدیا در پایگاه GitHub انتشار یافته است.
این مطلب را می پسندید؟
(0)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب