Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh

View Original

Lần đầu tiên người khiếm thị có thể "xem" ảnh bằng thao tác chạm nhờ AI mới của Microsoft

See this content in the original post

Seeing AI của Microsoft là ứng dụng cho phép người khiếm thị và người có thị giác hạn chế chuyển đổi dữ liệu hình ảnh thành các thông tin dưới dạng âm thanh.

Và mới đây, Microsoft đã cập nhật cho ứng dụng này một tính năng mới vô cùng hữu ích. Người dùng có thể sử dụng thao tác chạm để khám phá các vật thể và người trong ảnh.

Công cụ này được phát triển nhờ công nghệ máy học, đặc biệt là trong lĩnh vực nhận diện vật thể và hình ảnh. Tất cả những gì bạn cần làm là chụp một bức ảnh hoặc mở một tấm ảnh đã có sẵn, sau đó chạm vào bất kỳ vị trí nào bạn muốn khám phá.

"Tính năng mới này cho phép người dùng chạm ngón tay vào bức ảnh đang hiển thị trên màn hình cảm ứng để lắng nghe lời mô tả về các vật thể có trong ảnh và mối liên hệ giữa chúng," Saqib Shaikh, trưởng nhóm Seeing AI cho biết trong một bài blog mới đây. "Ứng dụng này thậm chí còn có thể miêu tả dáng vẻ bề ngoài của con người và dự đoán tâm trạng của họ."

Do công cụ này có tích hợp chức năng nhận dạng khuôn mặt, bạn có thể chụp một tấm ảnh bạn bè của mình và nghe ứng dụng mô tả ai đang làm gì, ở đâu, có con vật nào trong bức ảnh nào không… và nhiều hơn nữa. Điều này có thể thực hiện được trên phạm vi toàn hình ảnh, như bạn có thể thấy trong bức ảnh dưới đây:

Với tính năng mới này, ứng dụng của Microsoft cho phép người dùng có thể chạm vào bất kì vị trí nào trong ảnh để tìm vị trí của các vật thể — một tính năng rất quan trọng để giúp người dùng hiểu nội dung và nhận diện được bức ảnh.

Một số chi tiết có thể chưa xuất hiện trong lời mô tả tổng quát, nhưng khi bạn nhấn vào một vị trí cụ thể, ứng dụng cũng có thể miêu tả chúng cho bạn, chẳng hạn những bông hoa hay poster phim nằm ở phần hậu cảnh của tấm ảnh.

Cùng với đó, ứng dụng này hỗ trợ đầy đủ cho dòng máy tính bảng iPad, nhờ vậy có thể hỗ trợ rất tốt cho những người đang sử dụng sản phẩm của Apple để giao tiếp và tương tác với thế giới xung quanh. Ngoài ra, giao diện của ứng dụng cũng được cải tiến, cho phép người dùng có thể sắp xếp vị trí các chức năng bên trong ứng dụng tuỳ theo sở thích của họ.

Quang Huy - Vnreview

Bài gốc

See this content in the original post

Xem thêm

See this content in the original post