Các nhà nghiên cứu đã phát minh ra một cách để tối ưu hóa hiệu quả việc điều khiển và thiết kế robot mềm cho các nhiệm vụ mục tiêu theo truyền thống là một công việc hoành tráng trong tính toán.
Các nhà nghiên cứu của MIT đã phát minh ra một cách tối ưu hóa hiệu quả việc điều khiển và thiết kế robot mềm cho các nhiệm vụ mục tiêu, theo truyền thống là một công việc hoành tráng trong tính toán.

Robot mềm có cơ thể co giãn và linh hoạt có thể di chuyển vô số cách tại bất kỳ thời điểm nào. Về mặt tính toán, điều này thể hiện một “đại diện trạng thái” rất phức tạp mô tả cách từng bộ phận của robot di chuyển. Các đại diện trạng thái cho robot mềm có thể có hàng triệu kích thước gây khó khăn cho việc tính toán cách tối ưu để khiến robot hoàn thành các nhiệm vụ phức tạp.
Tại Hội nghị về Hệ thống xử lý thông tin thần kinh vào tháng tới, các nhà nghiên cứu của MIT sẽ trình bày một mô hình học về biểu diễn trạng thái nhỏ gọn hoặc “chiều thấp” dựa trên vật lý cơ bản của robot và môi trường của nó cùng với các yếu tố khác . Điều này giúp mô hình lặp lại tối ưu hóa điều khiển chuyển động và các tham số thiết kế vật liệu phục vụ cho các nhiệm vụ cụ thể.
Robot mềm là những “sinh vật” vô hạn uốn cong theo hàng tỷ cách khác nhau tại bất kỳ thời điểm nào nhưng trong thực tế có những cách tự nhiên mà các vật thể mềm có khả năng uốn cong. Các nhà khoa học thấy trạng thái tự nhiên của robot mềm có thể được mô tả rất nhỏ gọn trong một mô tả chiều thấp và họ tối ưu hóa điều khiển cũng như thiết kế robot mềm bằng cách học một mô tả.
Trong các mô phỏng, mô hình cho phép robot mềm 2D và 3D hoàn thành các nhiệm vụ – chẳng hạn như di chuyển một khoảng cách nhất định hoặc tiếp cận vị trí mục tiêu – nhanh chóng và chính xác hơn các phương pháp hiện đại. Các nhà nghiên cứu kế hoạch tiếp theo để thực hiện mô hình trong robot mềm thực sự.
Tham gia cùng Spielberg trên giấy là các sinh viên tốt nghiệp CSAIL Allan Zhao, Tao Du và Yuanming Hu; Daniela Rus, giám đốc của CSAIL và Giáo sư Kỹ thuật Điện và Máy tính Andrew và Erna Viterbi; và Wojciech Matusik, phó giáo sư MIT về kỹ thuật điện và khoa học máy tính và là người đứng đầu Tập đoàn Chế tạo máy tính.
“Học trong vòng lặp”
Robot mềm là một lĩnh vực nghiên cứu tương đối mới nhưng nó hứa hẹn cho robot tiên tiến. Ví dụ, các cơ thể linh hoạt có thể cung cấp sự tương tác an toàn hơn với con người, thao tác đối tượng tốt hơn và khả năng cơ động hơn trong số các lợi ích khác.
Điều khiển robot trong các mô phỏng dựa trên “người quan sát”, một chương trình tính toán các biến để xem cách robot mềm di chuyển để hoàn thành một nhiệm vụ. Trong nghiên cứu trước đây, các nhà nghiên cứu đã phân tách robot mềm thành các cụm mô phỏng được thiết kế bằng tay. Các hạt chứa thông tin quan trọng giúp thu hẹp các chuyển động có thể của robot. Ví dụ, nếu robot cố gắng uốn cong một cách nhất định, các bộ truyền động có thể chống lại chuyển động đó đủ để nó có thể bị bỏ qua. Nhưng đối với các robot phức tạp như vậy, việc chọn thủ công các cụm để theo dõi trong quá trình mô phỏng có thể rất khó khăn.
Để giải quyết công việc đó, các nhà nghiên cứu đã thiết kế một phương pháp “tối ưu hóa vòng lặp học tập”, trong đó tất cả các tham số tối ưu hóa được học trong một vòng phản hồi duy nhất qua nhiều mô phỏng. Và cùng lúc với việc tối ưu hóa học tập – hoặc “trong vòng lặp” – phương pháp cũng học cách biểu diễn trạng thái.
Mô hình này sử dụng một kỹ thuật gọi là phương pháp điểm vật liệu (MPM) mô phỏng hành vi của các hạt của vật liệu liên tục như bọt và chất lỏng được bao quanh bởi lưới nền. Khi làm như vậy, nó thu được các hạt của robot và môi trường có thể quan sát được của nó thành pixel hoặc pixel 3D, được gọi là voxels mà không cần bất kỳ tính toán bổ sung nào.
Trong giai đoạn tìm hiểu, thông tin lưới hạt thô này được đưa vào thành phần máy học, học cách nhập hình ảnh, nén nó thành biểu diễn chiều thấp và giải nén biểu diễn trở lại hình ảnh đầu vào. Nếu “bộ mã hóa tự động” này giữ lại đủ chi tiết trong khi nén hình ảnh đầu vào, nó có thể tái tạo chính xác hình ảnh đầu vào từ quá trình nén.
Trong công việc của các nhà nghiên cứu, các trình diễn nén đã học của trình tự động đóng vai trò đại diện cho trạng thái chiều thấp của robot. Trong giai đoạn tối ưu hóa, đại diện nén đó lặp lại vào bộ điều khiển, điều này tạo ra một hoạt động được tính toán cho cách mỗi hạt của robot sẽ di chuyển trong bước mô phỏng MPM tiếp theo.
Đồng thời, bộ điều khiển sử dụng thông tin đó để điều chỉnh độ cứng tối ưu cho từng hạt để đạt được chuyển động mong muốn. Trong tương lai, thông tin vật liệu đó có thể hữu ích cho robot mềm in 3D, trong đó mỗi điểm hạt có thể được in với độ cứng hơi khác nhau. Điều này cho phép tạo ra các thiết kế robot phục vụ cho các chuyển động của robot có liên quan đến các nhiệm vụ cụ thể. Bằng cách học các tham số này cùng nhau, bạn giữ mọi thứ được đồng bộ hóa càng nhiều càng tốt để làm cho quá trình thiết kế đó dễ dàng hơn.
Tối ưu hóa nhanh hơn
Lần lượt tất cả các thông tin tối ưu hóa được đưa trở lại vào đầu vòng lặp để huấn luyện bộ mã hóa tự động. Qua nhiều mô phỏng, bộ điều khiển tìm hiểu chuyển động tối ưu và thiết kế vật liệu trong khi bộ điều khiển tự động học biểu diễn trạng thái ngày càng chi tiết hơn.
Sau khi robot đến trạng thái cuối cùng được mô phỏng trong một khoảng thời gian định sẵn – giả sử, càng gần càng tốt đến đích đích – nó sẽ cập nhật “chức năng mất”. Đó là một thành phần quan trọng của học máy, cố gắng giảm thiểu một số lỗi. Trong trường hợp này, nó giảm thiểu và robot đã dừng cách mục tiêu bao xa. Hàm mất đó chảy trở lại bộ điều khiển, sử dụng tín hiệu lỗi để điều chỉnh tất cả các tham số được tối ưu hóa để hoàn thành tốt nhất nhiệm vụ.
Nếu các nhà nghiên cứu cố gắng đưa trực tiếp tất cả các hạt thô của mô phỏng vào bộ điều khiển mà không có bước nén thì “thời gian chạy và tối ưu hóa sẽ bùng nổ”. Sử dụng biểu diễn nén, các nhà nghiên cứu có thể giảm thời gian chạy cho mỗi lần lặp tối ưu hóa từ vài phút xuống còn khoảng 10 giây.
Các nhà nghiên cứu đã xác nhận mô hình của họ trên các mô phỏng của các robot 2D và 3D hai chân và bốn chân khác nhau. Các nhà nghiên cứu cũng phát hiện ra rằng trong khi robot sử dụng các phương pháp truyền thống có thể mất tới 30.000 mô phỏng để tối ưu hóa các tham số này thì robot được đào tạo trên mô hình của chúng chỉ mất khoảng 400 mô phỏng.
Triển khai mô hình thành robot mềm thực sự có nghĩa là giải quyết các vấn đề với tiếng ồn và sự không chắc chắn trong thế giới thực có thể làm giảm hiệu quả và độ chính xác của mô hình. Nhưng trong tương lai, các nhà nghiên cứu hy vọng sẽ thiết kế một đường ống đầy đủ, từ mô phỏng đến chế tạo, cho robot mềm.
###
Viết bởi Rob Matheson, Văn phòng Tin tức MIT
Liên kết liên quan
Bài viết: “Tối ưu hóa học tập trong vòng lặp: Kiểm soát từ đầu đến cuối và đồng thiết kế các robot mềm thông quaL kiếm được các đại diện tiềm ẩn sâu sắc.” http: // cfg. mit. edu / trang web / cfg. mit. edu / files / learning_in_the_loop. pdf
Video: https: / / www. youtube. com / đồng hồ? v = cwxl3957Ysc
Nguồn truyện:
Tài liệu được cung cấp bởi Viện Công nghệ Massachusetts . Bản gốc được viết bởi Rob Matheson. Lưu ý: Nội dung có thể được chỉnh sửa cho kiểu dáng và độ dài.