Tin tức Khoa học Skynet

Robot có thể nhặt bất kỳ vật nào sau khi kiểm tra nó

Ngày:
Th3 28, 2019
Tóm tắt:

Rô bốt một ngày nào đó có thể ‘nhìn thấy’ đủ tốt để ở trong nhà và văn phòng của mọi người.

Chia sẻ:
BÀI VIẾT ĐẦY ĐỦ

Con người từ lâu đã là bậc thầy của sự khéo léo, một kỹ năng mà phần lớn có thể được ghi nhận vào sự giúp đỡ của mắt chúng ta. Robot, trong khi đó, vẫn đang bắt kịp. Chắc chắn đã có một số tiến bộ: trong nhiều thập kỷ, robot trong các môi trường được kiểm soát như dây chuyền lắp ráp đã có thể nhặt cùng một vật thể nhiều lần.

Gần đây, những đột phá trong tầm nhìn máy tính đã cho phép robot tạo ra sự khác biệt cơ bản giữa các vật thể, nhưng ngay cả khi đó, chúng không thực sự hiểu được hình dạng của các vật thể, vì vậy chúng có thể làm được rất ít sau khi chọn nhanh.

Trong một bài báo mới, các nhà nghiên cứu từ Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) của MIT, nói rằng họ đã tạo ra một bước phát triển quan trọng trong lĩnh vực này: một hệ thống cho phép robot kiểm tra các đối tượng ngẫu nhiên và hiểu chúng đủ để thực hiện cụ thể nhiệm vụ mà chưa từng thấy chúng trước đây.

Hệ thống, được đặt tên là “Lưới đối tượng dày đặc” (DON), xem các vật thể như các bộ sưu tập các điểm đóng vai trò là “lộ trình trực quan” của các loại. Cách tiếp cận này cho phép robot hiểu rõ hơn và thao tác các mặt hàng, quan trọng nhất là cho phép chúng thậm chí nhặt được một vật cụ thể trong số các vật thể tương tự – một kỹ năng quý giá cho các loại máy mà các công ty như Amazon và Walmart sử dụng trong kho .

Ví dụ, một người nào đó có thể sử dụng DON để khiến robot nắm lấy một vị trí cụ thể trên một vật thể – giả sử, mũi của một chiếc giày. Từ đó, nó có thể nhìn vào một chiếc giày mà nó chưa từng thấy trước đây, và lấy thành công.

Manuelli sử dụng hệ thống DON và robot Kuka để nắm một chiếc cốc.
Manuelli sử dụng hệ thống DON và robot Kuka để nắm một chiếc cốc.
Tín dụng: Tom Buehler

“Nhiều cách tiếp cận để thao túng không thể xác định các bộ phận cụ thể của một đối tượng qua nhiều hướng mà đối tượng có thể gặp phải”, tiến sĩ Lucas Manuelli, người đã viết một bài báo mới về hệ thống với tác giả chính và nghiên cứu sinh tiến sĩ Pete Florence, cùng với MIT giáo sư Russ Tedrake. “Ví dụ, các thuật toán hiện tại sẽ không thể nắm được một chiếc cốc bằng tay cầm của nó, đặc biệt là nếu chiếc cốc có thể theo nhiều hướng, như thẳng đứng, hoặc ở bên cạnh nó.”

Nhóm nghiên cứu xem các ứng dụng tiềm năng không chỉ trong cài đặt sản xuất mà còn trong nhà. Hãy tưởng tượng cung cấp cho hệ thống hình ảnh của một ngôi nhà ngăn nắp và để nó sạch sẽ trong khi bạn đang làm việc hoặc sử dụng hình ảnh của các món ăn để hệ thống đặt đĩa của bạn đi trong khi bạn đi nghỉ.

Điều đáng chú ý là không có dữ liệu nào thực sự được dán nhãn bởi con người; thay vào đó là hệ thống “tự giám sát”, do đó, nó không yêu cầu bất kỳ chú thích nào của con người.

Làm cho robot dễ nắm bắt

Hai cách tiếp cận phổ biến để nắm bắt robot liên quan đến việc học cụ thể theo nhiệm vụ hoặc tạo ra một thuật toán nắm bắt chung. Cả hai kỹ thuật này đều có những trở ngại: các phương pháp dành riêng cho nhiệm vụ rất khó để khái quát hóa cho các nhiệm vụ khác và việc nắm bắt chung không đủ cụ thể để xử lý các sắc thái của các nhiệm vụ cụ thể, như đặt các đối tượng vào các điểm cụ thể.

Tuy nhiên, hệ thống DON về cơ bản tạo ra một loạt tọa độ trên một đối tượng nhất định, đóng vai trò là một “lộ trình trực quan” của các đối tượng, để giúp robot hiểu rõ hơn về những gì nó cần nắm và ở đâu.

Nhóm nghiên cứu đã đào tạo hệ thống để xem các vật thể như một loạt các điểm tạo nên một hệ tọa độ lớn hơn. Sau đó, nó có thể ánh xạ các điểm khác nhau lại với nhau để trực quan hóa hình dạng 3 chiều của một đối tượng, tương tự như cách các bức ảnh toàn cảnh được ghép lại với nhau từ nhiều bức ảnh. Sau khi đào tạo, nếu một người chỉ định một điểm trên một đối tượng, robot có thể chụp ảnh đối tượng đó, xác định và khớp các điểm để có thể lấy vật thể tại điểm được chỉ định đó.

Điều này khác với các hệ thống như DexNet của UC-Berkeley, có thể nắm bắt nhiều mục khác nhau, nhưng không thể đáp ứng một yêu cầu cụ thể. Hãy tưởng tượng một đứa trẻ sơ sinh 18 tháng tuổi, không hiểu bạn muốn chơi với món đồ chơi nào nhưng vẫn có thể lấy được nhiều đồ, so với một đứa trẻ bốn tuổi có thể phản ứng với việc “đi lấy xe tải đồ chơi của bạn ở đâu đó.”

Trong một loạt các thử nghiệm được thực hiện trên một món đồ chơi mềm, một cánh tay robot Kuka do DON cung cấp có thể nắm lấy tai phải của đồ chơi từ một loạt các cấu hình khác nhau. Điều này cho thấy, trong số những thứ khác, hệ thống có khả năng phân biệt trái với phải trên các đối tượng đối xứng.

Khi thử nghiệm trên một thùng mũ bóng chày khác nhau, DON có thể chọn ra một chiếc mũ mục tiêu cụ thể mặc dù tất cả các mũ có thiết kế rất giống nhau – và chưa bao giờ nhìn thấy hình ảnh của những chiếc mũ trong dữ liệu huấn luyện trước đây.

“Trong các nhà máy, robot thường cần các bộ cấp nguồn phức tạp để hoạt động đáng tin cậy”, Manuelli nói. “Nhưng một hệ thống như thế này có thể hiểu được định hướng của các đối tượng chỉ có thể chụp ảnh và có thể nắm bắt và điều chỉnh đối tượng phù hợp.”

Trong tương lai, nhóm nghiên cứu hy vọng sẽ cải thiện hệ thống đến nơi có thể thực hiện các nhiệm vụ cụ thể với sự hiểu biết sâu sắc hơn về các đối tượng tương ứng, như học cách nắm bắt một vật thể và di chuyển nó với mục tiêu cuối cùng là nói, làm sạch bàn.

Nhóm sẽ trình bày bài viết của họ trên hệ thống vào tháng tới tại Hội nghị về Robot Learning ở Zürich, Thụy Sĩ.

VIDEO: https://www.youtube.com/watch?v=OplLXzxxmdA&feature=youtu.be


Nguồn tin tức:

Tài liệu được cung cấp bởi Viện Công nghệ Massachusetts, CSAIL . Lưu ý: Nội dung có thể được chỉnh sửa cho kiểu dáng và độ dài.


Bài viết liên quan

Bài viết mới