สถาบันวิจัยโตโยต้า (TRI) ประกาศแนวทางเจนเนอเรทีฟ AI ที่ล้ำสมัยโดยอยู่บนพื้นฐานของนโยบายการแพร่กระจาย (Diffusion Policy) เพื่อสอนทักษะใหม่ๆ ที่คล่องแคล่วและรวดเร็วให้กับหุ่นยนต์ ความก้าวหน้านี้สามารถเพิ่มการใช้ประโยชน์จากหุ่นยนต์ได้อย่างมีนัยสำคัญ และเป็นก้าวต่อไปของการสร้าง “แบบจำลองพฤติกรรมขนาดใหญ่ (LBM)” สำหรับหุ่นยนต์ ซึ่งคล้ายกับโมเดลภาษาขนาดใหญ่ (LLM) ที่เพิ่งปฏิวัติ AI เกี่ยวกับการสนทนาเมื่อไม่นานมานี้

Gill Pratt ซีอีโอของ TRI และหัวหน้านักวิทยาศาสตร์ของ Toyota Motor Corporation กล่าวว่า — “การวิจัยด้านวิทยาการหุ่นยนต์ของเรามุ่งไปที่การขยายผู้คนมากกว่าการเข้าไปแทนพวกเขา” “เทคนิคการสอนใหม่นี้มีประสิทธิภาพมาก และก่อให้เกิดพฤติกรรมที่มีสมรรถนะสูงมาก ทำให้หุ่นยนต์สามารถขยายผู้คนได้อย่างมีประสิทธิผลมากขึ้นในหลายๆ ด้าน”
ก่อนหน้านี้ เทคนิคที่นำมาใช้สอนหุ่นยนต์ให้มีพฤติกรรมใหม่แม้จะมีความล้ำสมัย แต่ก็ทำได้ช้า ไม่สอดคล้องกัน ไม่มีประสิทธิภาพ และมักจำกัดไว้เพียงการปฏิบัติตามภาระงานที่กำหนดไว้อย่างแคบในสภาพแวดล้อมที่มีข้อจำกัดสูง นักวิทยาการหุ่นยนต์ต้องใช้เวลาหลายชั่วโมงในการเขียนโค้ดที่ซับซ้อน และ/หรือใช้การลองผิดลองถูกอยู่หลายรอบมากในการเขียนโปรแกรมพฤติกรรม
TRI ได้สอนทักษะที่ยากและคล่องแคล่วให้กับหุ่นยนต์มาแล้วกว่า 60 ทักษะโดยใช้แนวทางใหม่ ซึ่งรวมถึงการเทของเหลว การใช้เครื่องมือ และการจัดการวัตถุที่เปลี่ยนรูปทรงได้ ความสำเร็จเหล่านี้เกิดขึ้นได้โดยไม่ต้องเขียนโค้ดใหม่แม้แต่บรรทัดเดียว ซึ่งการเปลี่ยนแปลงมีเพียงอย่างเดียว คือ การให้ข้อมูลใหม่แก่หุ่นยนต์ จากความสำเร็จนี้ TRI ได้ตั้งเป้าหมายด้วยความทะเยอทะยานมากขึ้นในการสอนทักษะใหม่ๆ หลายร้อยทักษะภายในสิ้นปีนี้ และให้ได้ 1,000 ทักษะภายในสิ้นปี พ.ศ. 2567
นอกจากนี้ ยังสามารถสอนหุ่นยนต์ให้ทำงานในสถานการณ์ใหม่และมีพฤติกรรมที่หลากหลายได้ ทักษะเหล่านี้ไม่ได้จำกัดอยู่เพียงแค่ “หยิบและวาง” หรือเพียงแค่หยิบสิ่งของและวางลงในตำแหน่งใหม่ โดยขณะนี้ หุ่นยนต์ของ TRI สามารถโต้ตอบกับโลกในรูปแบบที่หลากหลายและสมบูรณ์ ซึ่งสักวันหนึ่งจะช่วยให้หุ่นยนต์สามารถช่วยเหลือผู้คนในสถานการณ์ในชีวิตประจำวัน และในสภาพแวดล้อมที่คาดเดาไม่ได้และเปลี่ยนแปลงตลอดเวลา
Russ Tedrake รองประธานฝ่ายวิจัยหุ่นยนต์ของ TRI และเป็นศาสตราจารย์ด้านวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ การบินและอวกาศ และวิศวกรรมเครื่องกลของ MIT อธิบายว่า — “สิ่งที่น่าตื่นเต้นอย่างมากเกี่ยวกับแนวทางใหม่นี้ คือ อัตรา และความน่าเชื่อถือจากการที่เราสามารถเพิ่มทักษะใหม่ๆ ได้ เนื่องจากทักษะเหล่านี้เป็นการทำงานโดยตรงจากภาพที่ได้จากกล้อง และจากการตรวจจับแบบสัมผัสโดยใช้เพียงตัวอย่างจากที่เรียนรู้เท่านั้น ทักษะเหล่านี้จึงสามารถปฏิบัติได้ดีแม้จะเป็นงานที่เกี่ยวข้องกับสิ่งที่เปลี่ยนรูปทรงได้ทั้ง วัตถุ เสื้อผ้า และของเหลว ซึ่งแต่เดิมแล้วทักษะทั้งหมดนี้เป็นเรื่องยากมากสำหรับหุ่นยนต์”
รายละเอียดทางเทคนิค
โมเดลพฤติกรรมหุ่นยนต์ของ TRI เป็นการเรียนรู้ด้วยการสาธิตการรับรู้จากการสัมผัสโดยผู้สอน และรวมกับคำอธิบายภาษาของเป้าหมาย จากนั้นใช้นโยบายการแพร่กระจายบนพื้นฐานของ AI เพื่อเรียนรู้ทักษะจากที่ได้สาธิตให้เห็น กระบวนการนี้ช่วยให้ปรับใช้พฤติกรรมใหม่ได้โดยอัตโนมัติจากการสาธิตหลายสิบครั้ง แนวทางนี้ไม่เพียงแต่ให้ผลลัพธ์ที่สม่ำเสมอ ทำซ้ำได้ และมีประสิทธิภาพเท่านั้น แต่ยังทำได้อย่างรวดเร็วอีกด้วย
ความสำเร็จที่สำคัญในการวิจัยและพัฒนาใหม่ของ TRI นี้ ได้แก่
นโยบายการแพร่กระจาย: TRI และผู้ร่วมงานในกลุ่มของศาสตราจารย์ Song ที่มหาวิทยาลัยโคลัมเบียได้พัฒนาแนวทางเจนเนอเรทีฟ AI ที่ทรงพลังสำหรับการเรียนรู้พฤติกรรม แนวทางนี้เรียกว่า นโยบายการแพร่กระจาย ช่วยให้การสอนพฤติกรรมจากการสาธิตทำได้ง่ายและรวดเร็ว
แพลตฟอร์มหุ่นยนต์ที่ปรับแต่งเฉพาะได้: แพลตฟอร์มหุ่นยนต์ของ TRI สร้างขึ้นเป็นพิเศษสำหรับงานควบคุมแขนคู่ที่คล่องแคล่ว โดยเน้นเป็นพิเศษสำหรับความสามารถในการป้อนกลับการสัมผัส (haptic feedback) และการตรวจจับแบบกายสัมผัส (tactile sensing)
Pipeline: หุ่นยนต์ TRI ได้เรียนรู้ทักษะความคล่องแคล่วมาแล้ว 60 ทักษะ โดยมีเป้าหมายหลักร้อยภายในสิ้นปีนี้ และ 1,000 ทักษะภายในสิ้นปี พ.ศ. 2567
Drake: เป็นโมเดลพื้นฐานการออกแบบหุ่นยนต์ที่ให้มีกล่องเครื่องมือและแพลตฟอร์มการจำลองที่ล้ำสมัย ซึ่งความสมจริงในระดับสูงของ Drake ช่วยให้มีความสามารถในการพัฒนาทั้งการจำลองและในความเป็นจริงที่สามารถเพิ่มขนาดและความเร็วได้อย่างมากมายเกินกว่าจะเป็นไปได้ กลุ่มหุ่นยนต์ภายใน TRI ถูกสร้างขึ้นโดยใช้วิธีการปรับให้เหมาะสมและใช้เฟรมเวิร์กระบบของ Drake และยังสร้าง Drake เป็นโอเพ่นซอร์ส เพื่อกระตุ้นการทำงานในชุมชนหุ่นยนต์ทั้งหมด
ความปลอดภัย: เป็นหัวใจสำคัญในความพยายามด้านวิทยาการหุ่นยนต์ของ TRI โดยออกแบบระบบให้มีการป้องกันด้วยความแข็งแกร่ง ซึ่งขับเคลื่อนโดย Drake และชุดควบคุมหุ่นยนต์แบบกำหนดเองของ TRI เพื่อให้แน่ใจว่าหุ่นยนต์คำนึงถึงการรับประกันด้านความปลอดภัย เช่น การไม่ชนกับตัวมันเองหรือสภาพแวดล้อมของมัน
ที่มา: Toyota Research Institute