Atropos v0.3 خارج الآن! شهد إطار عمل RL Environments الخاص بنا الكثير من الترقيات منذ الإصدار 0.2 - بعض النقاط البارزة: - يمكن الآن استخدام Atropos كإطار عمل للمقارنة المعيارية والتقييمات من قبل @rogershijin ، مع أول معيار خارجي لدينا ، Reward-Bench 2! - تمت إضافة Reasoning Gym ، وهو عبارة عن صالة ألعاب رياضية خارجية تم نقلها إلى atropos مع أكثر من 100 مهمة تفكير من قبل @neurosp1ke والأصدقاء - @max_paperclips معسكر تدريبي متكامل للمنطق في @intern_lm ، مضيفا 1000+ مهمة تفكير جديدة ل RL - أضاف @dmayhem93 المهندس الرئيسي لشركة Atropos العشرات من إصلاحات الأخطاء وغيرها من تحسينات الموثوقية والتوافق ، ودعم أفضل للبيئات المتعددة ، و CI / CD - تم دمج العديد من بيئات هاكاثون Atropos في /environments/community - لإدراجها جميعا ستشغل معظم مساحة الشاشة ، ولكن بعض النقاط البارزة: VR-CLI بواسطة @JakeABoggs ، Philosophy RLAIF ، Adaptive LLM Teachers ، WebVoyager ، تصميم البروتين بواسطة @hallerite ، بيئة توجيه نموذجية بواسطة @gabinfay ، متعددة على إثبات الهزيل ، ساحة catbot ، مواجهة البوكيمون ، البوكر ، الأطباء المتعاونين ، الشعر السنسكريتي من @khoomeik وأكثر من ذلك بكثير! - تشمل البيئات الجديدة البارزة الأخرى المدعومة رسميا ما يلي: تنسيق الإجابة بعد البيئة بيئة pydantic إلى JSON المنقولة من عمل @MatternJustus التعليمات التالية المنقولة من عمل @natolambert و @allen_ai عد الحروف - 47 مساهما جديدا تماما! تحقق من سجل التغيير الكامل هنا: