Một hệ thống mới sử dụng thuật toán có thể quay video 2 chiều và biến chúng thành các “tác phẩm điêu khắc chuyển động” được in 3 chiều cho thấy cách cơ thể con người di chuyển trong không gian.
Tiền vệ yêu nước Tom Brady thường ghi nhận thành công của mình khi dành vô số thời gian để nghiên cứu các chuyển động của đối thủ trên phim. Sự hiểu biết về chuyển động này là cần thiết cho tất cả các loài sống, cho dù đó là tìm ra góc nào để ném quả bóng hoặc nhận biết chuyển động của động vật săn mồi và con mồi. Nhưng những video đơn giản thực sự không thể cho chúng ta bức tranh đầy đủ.
Đó là bởi vì video và hình ảnh truyền thống để nghiên cứu chuyển động là hai chiều và không cho chúng tôi thấy cấu trúc 3 chiều cơ bản của người hoặc chủ đề quan tâm. Nếu không có hình học đầy đủ, chúng ta không thể kiểm tra các chuyển động nhỏ và tinh tế giúp chúng ta di chuyển nhanh hơn hoặc hiểu được độ chính xác cần thiết để hoàn thiện hình thức thể thao của chúng ta.
Tuy nhiên, gần đây, các nhà nghiên cứu từ Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) của MIT đã đưa ra một cách để có thể xử lý tốt hơn về sự hiểu biết về chuyển động phức tạp này.
Hệ thống mới sử dụng thuật toán có thể quay video 2 chiều và biến chúng thành “tác phẩm điêu khắc chuyển động” được in 3 chiều cho thấy cách cơ thể con người di chuyển trong không gian. Ngoài việc là một hình ảnh thẩm mỹ hấp dẫn về hình dạng và thời gian, nhóm nghiên cứu hình dung rằng hệ thống “điêu khắc chuyển động” (MoSculp) của họ có thể cho phép nghiên cứu chi tiết hơn về chuyển động cho các vận động viên chuyên nghiệp, vũ công hoặc bất cứ ai muốn cải thiện kỹ năng thể chất của họ.
Nghiên cứu sinh tiến sĩ Xiuming Zhang, tác giả chính của một bài báo mới về hệ thống nói: “Hãy tưởng tượng bạn có một video về Roger Federer đang phục vụ một quả bóng trong một trận đấu quần vợt và một video về việc bạn học chơi quần vợt. Sau đó, bạn có thể xây dựng các tác phẩm điêu khắc chuyển động của cả hai kịch bản để so sánh chúng và nghiên cứu toàn diện hơn về nơi bạn cần cải thiện.”
Vì tác phẩm điêu khắc chuyển động là 3 chiều, người dùng có thể sử dụng giao diện máy tính để điều hướng xung quanh các cấu trúc và nhìn thấy chúng từ các góc nhìn khác nhau, cho thấy thông tin liên quan đến chuyển động không thể truy cập được từ quan điểm ban đầu.
Zhang đã viết bài báo cùng với các giáo sư MIT William Freeman và Stefanie Mueller, nghiên cứu sinh tiến sĩ Jiajun Wu, nhà nghiên cứu Google Qiurui He và Tali Dekel, cũng như UC Berkeley postdoc và cựu tiến sĩ CSAIL Andrew Owens.

Các nghệ sĩ và nhà khoa học từ lâu đã đấu tranh để có cái nhìn sâu sắc hơn về chuyển động, bị giới hạn bởi ống kính máy ảnh của chính họ và những gì nó có thể cung cấp.
Công việc trước đây chủ yếu sử dụng các kỹ thuật chụp ảnh “stroboscopic”(
một dạng chụp phơi sáng kết hợp sử dụng chế độ Multi/repeat của đèn flash), trông rất giống các hình ảnh trong một cuốn sách lật được ghép lại với nhau. Nhưng vì những bức ảnh này chỉ hiển thị ảnh chụp chuyển động, chẳng hạn, bạn sẽ không thể nhìn thấy nhiều quỹ đạo của cánh tay của một người khi họ đang đánh một quả bóng golf chẳng hạn.
Hơn thế nữa, những bức ảnh này cũng đòi hỏi thiết lập trước khi chụp rất tốn công, chẳng hạn như sử dụng phông nền sạch và máy ảnh chuyên sâu và thiết bị chiếu sáng. Tất cả các nhu cầu của hệ thống “điêu khắc chuyển động” là một chuỗi video.
Đưa ra một video đầu vào, trước tiên hệ thống sẽ tự động phát hiện các điểm chính 2 chiều trên cơ thể của đối tượng, chẳng hạn như hông, đầu gối và mắt cá chân của một nữ diễn viên ba lê trong khi cô ấy đang thực hiện một điệu nhảy phức tạp. Sau đó, phải mất những tư thế tốt nhất có thể từ những điểm đó để biến thành “bộ xương” 3 chiều.
Sau khi ghép các bộ xương này lại với nhau, hệ thống tạo ra một tác phẩm điêu khắc chuyển động có thể được in 3 chiều, cho thấy đường di chuyển trơn tru, liên tục được vạch ra bởi đối tượng. Người dùng có thể tùy chỉnh số liệu của mình để tập trung vào các bộ phận cơ thể khác nhau, chỉ định các vật liệu khác nhau để phân biệt giữa các bộ phận và thậm chí tùy chỉnh ánh sáng.
Trong các nghiên cứu người dùng, các nhà nghiên cứu phát hiện ra rằng hơn 75% đối tượng cảm thấy rằng hệ thống “điêu khắc chuyển động” cung cấp một hình ảnh chi tiết hơn để nghiên cứu chuyển động so với các kỹ thuật chụp ảnh tiêu chuẩn.
“Khiêu vũ và chuyển động thể thao có tay nghề cao thường trông giống như” tác phẩm điêu khắc chuyển động “nhưng chúng chỉ tạo ra hình dạng phù du”, Courtney Brigham, trưởng nhóm truyền thông của Adobe nói. “Công trình này cho thấy làm thế nào để chuyển động và biến chúng thành tác phẩm điêu khắc thực sự với hình ảnh chuyển động khách quan, cung cấp cách cho các vận động viên phân tích chuyển động của họ để đào tạo, không cần nhiều thiết bị hơn máy ảnh di động và thời gian tính toán.”
Hệ thống hoạt động tốt nhất cho các chuyển động lớn hơn, như ném bóng hoặc thực hiện bước nhảy vọt trong một chuỗi nhảy. Nó cũng hoạt động cho các tình huống có thể cản trở hoặc làm phức tạp chuyển động, chẳng hạn như những người mặc quần áo rộng hoặc mang đồ vật.
Hiện tại, hệ thống chỉ sử dụng các kịch bản một người, nhưng nhóm sẽ sớm hy vọng mở rộng ra nhiều người. Điều này có thể mở ra tiềm năng để nghiên cứu những thứ như rối loạn xã hội, tương tác giữa các cá nhân và động lực nhóm.
Nhóm sẽ trình bày bài viết của họ trên hệ thống vào tháng tới tại hội nghị Công nghệ và Phần mềm Giao diện Người dùng (UIST) tại Berlin, Đức.
Nguồn truyện:
Tài liệu được cung cấp bởi Viện Công nghệ Massachusetts, CSAIL . Lưu ý: Nội dung có thể được chỉnh sửa cho kiểu dáng và độ dài.