
SmolVLA: โมเดล AI สำหรับหุ่นยนต์ที่ทำงานได้บน MacBook
SmolVLA: โมเดล AI สำหรับหุ่นยนต์ ถ้าหุ่นยนต์สามารถเข้าใจภาพ ภาษามนุษย์ และตัดสินใจได้ในคราวเดียว แล้วอะไรคือข้อจำกัดใหม่? คำถามนี้ไม่ใช่แค่เรื่องของเทคโนโลยี แต่คือแนวโน้มการหลอมรวมความสามารถของ AI เข้ากับฮาร์ดแวร์ระดับบ้านๆ ที่อาจเปลี่ยนแปลงอุตสาหกรรมหุ่นยนต์ไปโดยสิ้นเชิง Hugging Face เพิ่งเปิดตัว SmolVLA โมเดล AI ขนาดเล็กที่รวมการมองเห็น (Vision) การเข้าใจภาษา (Language) และการกระทำ (Action) เข้าด้วยกัน — ทั้งหมดนี้สามารถทำงานได้บน MacBook หรือแม้แต่ CPU ธรรมดา เบื้องหลัง SmolVLA คือความตั้งใจที่จะ democratize หุ่นยนต์ทั่วไปผ่านโครงการ LeRobot โดยเปิดให้ชุมชนแบ่งปันชุดข้อมูลการใช้งานจริงของหุ่นยนต์ เพื่อฝึกโมเดลให้เข้าใจโลกในแบบที่มนุษย์เข้าใจ แนวคิดไม่ใช่แค่ให้หุ่นยนต์ “เห็น” หรือ “ฟัง” ได้ แต่ให้มัน เข้าใจคำสั่งและลงมือทำ ในสภาพแวดล้อมจริง โดยไม่ต้องพึ่งฮาร์ดแวร์ซูเปอร์คอมพิวเตอร์ คุณสมบัติที่น่าจับตาคือ SmolVLA รองรับการประมวลผลแบบอะซิงโครนัส ช่วยให้สามารถแยกการรับรู้ (Perception) ออกจากการกระทำ […]