สถาบันวิจัยโตโยต้าเผยความก้าวหน้าในการสอนพฤติกรรมใหม่ให้กับหุ่นยนต์ด้วยเทคนิคเจนเนอเรทีฟ AI ใหม่

สถาบันวิจัยโตโยต้า (TRI) ประกาศแนวทางเจนเนอเรทีฟ AI ที่ล้ำสมัยโดยอยู่บนพื้นฐานของนโยบายการแพร่กระจาย (Diffusion Policy) เพื่อสอนทักษะใหม่ๆ ที่คล่องแคล่วและรวดเร็วให้กับหุ่นยนต์ ความก้าวหน้านี้สามารถเพิ่มการใช้ประโยชน์จากหุ่นยนต์ได้อย่างมีนัยสำคัญ และเป็นก้าวต่อไปของการสร้าง “แบบจำลองพฤติกรรมขนาดใหญ่ (LBM)” สำหรับหุ่นยนต์ ซึ่งคล้ายกับโมเดลภาษาขนาดใหญ่ (LLM) ที่เพิ่งปฏิวัติ AI เกี่ยวกับการสนทนาเมื่อไม่นานมานี้

สถาบันวิจัยโตโยต้าเปิดเผยความก้าวหน้าในการสอนพฤติกรรมใหม่ให้กับหุ่นยนต์ โดยใช้เทคนิคเจนเนอเรทีฟ AI ที่ล้ำสมัย ที่จะเป็นก้าวต่อไปของการสร้างแบบจำลองพฤติกรรมขนาดใหญ่

Gill Pratt ซีอีโอของ TRI และหัวหน้านักวิทยาศาสตร์ของ Toyota Motor Corporation กล่าวว่า — “การวิจัยด้านวิทยาการหุ่นยนต์ของเรามุ่งไปที่การขยายผู้คนมากกว่าการเข้าไปแทนพวกเขา” “เทคนิคการสอนใหม่นี้มีประสิทธิภาพมาก และก่อให้เกิดพฤติกรรมที่มีสมรรถนะสูงมาก ทำให้หุ่นยนต์สามารถขยายผู้คนได้อย่างมีประสิทธิผลมากขึ้นในหลายๆ ด้าน”

ก่อนหน้านี้ เทคนิคที่นำมาใช้สอนหุ่นยนต์ให้มีพฤติกรรมใหม่แม้จะมีความล้ำสมัย แต่ก็ทำได้ช้า ไม่สอดคล้องกัน ไม่มีประสิทธิภาพ และมักจำกัดไว้เพียงการปฏิบัติตามภาระงานที่กำหนดไว้อย่างแคบในสภาพแวดล้อมที่มีข้อจำกัดสูง นักวิทยาการหุ่นยนต์ต้องใช้เวลาหลายชั่วโมงในการเขียนโค้ดที่ซับซ้อน และ/หรือใช้การลองผิดลองถูกอยู่หลายรอบมากในการเขียนโปรแกรมพฤติกรรม

TRI ได้สอนทักษะที่ยากและคล่องแคล่วให้กับหุ่นยนต์มาแล้วกว่า 60 ทักษะโดยใช้แนวทางใหม่ ซึ่งรวมถึงการเทของเหลว การใช้เครื่องมือ และการจัดการวัตถุที่เปลี่ยนรูปทรงได้ ความสำเร็จเหล่านี้เกิดขึ้นได้โดยไม่ต้องเขียนโค้ดใหม่แม้แต่บรรทัดเดียว ซึ่งการเปลี่ยนแปลงมีเพียงอย่างเดียว คือ การให้ข้อมูลใหม่แก่หุ่นยนต์ จากความสำเร็จนี้ TRI ได้ตั้งเป้าหมายด้วยความทะเยอทะยานมากขึ้นในการสอนทักษะใหม่ๆ หลายร้อยทักษะภายในสิ้นปีนี้ และให้ได้ 1,000 ทักษะภายในสิ้นปี พ.ศ. 2567

นอกจากนี้ ยังสามารถสอนหุ่นยนต์ให้ทำงานในสถานการณ์ใหม่และมีพฤติกรรมที่หลากหลายได้ ทักษะเหล่านี้ไม่ได้จำกัดอยู่เพียงแค่ “หยิบและวาง” หรือเพียงแค่หยิบสิ่งของและวางลงในตำแหน่งใหม่ โดยขณะนี้ หุ่นยนต์ของ TRI สามารถโต้ตอบกับโลกในรูปแบบที่หลากหลายและสมบูรณ์ ซึ่งสักวันหนึ่งจะช่วยให้หุ่นยนต์สามารถช่วยเหลือผู้คนในสถานการณ์ในชีวิตประจำวัน และในสภาพแวดล้อมที่คาดเดาไม่ได้และเปลี่ยนแปลงตลอดเวลา

Russ Tedrake รองประธานฝ่ายวิจัยหุ่นยนต์ของ TRI และเป็นศาสตราจารย์ด้านวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ การบินและอวกาศ และวิศวกรรมเครื่องกลของ MIT อธิบายว่า — “สิ่งที่น่าตื่นเต้นอย่างมากเกี่ยวกับแนวทางใหม่นี้ คือ อัตรา และความน่าเชื่อถือจากการที่เราสามารถเพิ่มทักษะใหม่ๆ ได้ เนื่องจากทักษะเหล่านี้เป็นการทำงานโดยตรงจากภาพที่ได้จากกล้อง และจากการตรวจจับแบบสัมผัสโดยใช้เพียงตัวอย่างจากที่เรียนรู้เท่านั้น ทักษะเหล่านี้จึงสามารถปฏิบัติได้ดีแม้จะเป็นงานที่เกี่ยวข้องกับสิ่งที่เปลี่ยนรูปทรงได้ทั้ง วัตถุ เสื้อผ้า และของเหลว ซึ่งแต่เดิมแล้วทักษะทั้งหมดนี้เป็นเรื่องยากมากสำหรับหุ่นยนต์”

รายละเอียดทางเทคนิค

โมเดลพฤติกรรมหุ่นยนต์ของ TRI เป็นการเรียนรู้ด้วยการสาธิตการรับรู้จากการสัมผัสโดยผู้สอน และรวมกับคำอธิบายภาษาของเป้าหมาย จากนั้นใช้นโยบายการแพร่กระจายบนพื้นฐานของ AI เพื่อเรียนรู้ทักษะจากที่ได้สาธิตให้เห็น กระบวนการนี้ช่วยให้ปรับใช้พฤติกรรมใหม่ได้โดยอัตโนมัติจากการสาธิตหลายสิบครั้ง แนวทางนี้ไม่เพียงแต่ให้ผลลัพธ์ที่สม่ำเสมอ ทำซ้ำได้ และมีประสิทธิภาพเท่านั้น แต่ยังทำได้อย่างรวดเร็วอีกด้วย

ความสำเร็จที่สำคัญในการวิจัยและพัฒนาใหม่ของ TRI นี้ ได้แก่

นโยบายการแพร่กระจาย: TRI และผู้ร่วมงานในกลุ่มของศาสตราจารย์ Song ที่มหาวิทยาลัยโคลัมเบียได้พัฒนาแนวทางเจนเนอเรทีฟ AI ที่ทรงพลังสำหรับการเรียนรู้พฤติกรรม แนวทางนี้เรียกว่า นโยบายการแพร่กระจาย ช่วยให้การสอนพฤติกรรมจากการสาธิตทำได้ง่ายและรวดเร็ว

แพลตฟอร์มหุ่นยนต์ที่ปรับแต่งเฉพาะได้: แพลตฟอร์มหุ่นยนต์ของ TRI สร้างขึ้นเป็นพิเศษสำหรับงานควบคุมแขนคู่ที่คล่องแคล่ว โดยเน้นเป็นพิเศษสำหรับความสามารถในการป้อนกลับการสัมผัส (haptic feedback) และการตรวจจับแบบกายสัมผัส (tactile sensing)

Pipeline: หุ่นยนต์ TRI ได้เรียนรู้ทักษะความคล่องแคล่วมาแล้ว 60 ทักษะ โดยมีเป้าหมายหลักร้อยภายในสิ้นปีนี้ และ 1,000 ทักษะภายในสิ้นปี พ.ศ. 2567

Drake: เป็นโมเดลพื้นฐานการออกแบบหุ่นยนต์ที่ให้มีกล่องเครื่องมือและแพลตฟอร์มการจำลองที่ล้ำสมัย ซึ่งความสมจริงในระดับสูงของ Drake ช่วยให้มีความสามารถในการพัฒนาทั้งการจำลองและในความเป็นจริงที่สามารถเพิ่มขนาดและความเร็วได้อย่างมากมายเกินกว่าจะเป็นไปได้ กลุ่มหุ่นยนต์ภายใน TRI ถูกสร้างขึ้นโดยใช้วิธีการปรับให้เหมาะสมและใช้เฟรมเวิร์กระบบของ Drake และยังสร้าง Drake เป็นโอเพ่นซอร์ส เพื่อกระตุ้นการทำงานในชุมชนหุ่นยนต์ทั้งหมด

ความปลอดภัย: เป็นหัวใจสำคัญในความพยายามด้านวิทยาการหุ่นยนต์ของ TRI โดยออกแบบระบบให้มีการป้องกันด้วยความแข็งแกร่ง ซึ่งขับเคลื่อนโดย Drake และชุดควบคุมหุ่นยนต์แบบกำหนดเองของ TRI เพื่อให้แน่ใจว่าหุ่นยนต์คำนึงถึงการรับประกันด้านความปลอดภัย เช่น การไม่ชนกับตัวมันเองหรือสภาพแวดล้อมของมัน

ที่มา: Toyota Research Institute

About pawarit

Check Also

เปิดฉาก ดิจิเทค อาเซียน ไทยแลนด์ 2023 แพลตฟอร์มขับเคลื่อนเศรษฐกิจดิจิทัลประเทศไทยและภูมิภาคอาเซียน

(22 พฤศจิกายน 2566) ตอบรับตลาดดิจิทัลภูมิภาคอาเซียนมูลค่าสูงถึง 500 พันล้านดอลลาร์สหรัฐ ภายในปี 2568 ภาครัฐ-เอกชน ผนึกกาลังจัดงาน ดิจิเทค อาเซียน ไทยแลนด์ 2023 มหกรรมแสดงสินค้าเจรจาธุรกิจด้านเทคโนโลยีและดิจิทัลแห่งอาเซียน …

Stripe ประกาศเปิดตัวสุดยอดโซลูชั่นการรับชำระเงินที่ได้รับการอัปเกรดเพิ่มประสิทธิภาพครั้งใหญ่สุด

ปัจจุบัน Stripe ช่วยให้ธุรกิจสามารถรองรับการชำระเงินได้มากกว่า 100 รูปแบบทั่วโลก Stripe เป็นระบบแพลตฟอร์มชำระเงินรายแรก ที่ให้ผู้ใช้สามารถทดสอบ A/B เพื่อเปรียบเทียบวิธีการชำระเงินรูปแบบต่างๆ บนหน้าชำระเงิน ฟีเจอร์ใหม่ช่วยให้ธุรกิจปรับปรุงสัดส่วนยอดขายต่อการเข้าชมของลูกค้า (Conversion Rate) และเพิ่มรายได้