Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh

View Original

Ứng dụng chuyển giọng nói thành văn bản miễn phí và chính xác

Nếu bạn không ghét việc “rã băng”, tức là sao chép lại bằng văn bản các nội dung trong băng âm thanh, thì chắc chắn là vì bạn ít phải làm công việc này.

Giao diện ứng dụng Otter trên thiết bị di động - Ảnh: CNET

Theo trang CNET, phát triển các ứng dụng có khả năng chuyển âm thanh thành văn bản (speech to text) từ lâu đã là vấn đề được nhiều hãng công nghệ quan tâm.

Otter, một ứng dụng mới, miễn phí dành cho thiết bị di động, do một nhóm kỹ sư của công ty nhận biết ngôn ngữ Nuance và các chuyên gia của Google phát triển, cũng được thiết kế để giải quyết vấn đề này.

Mục tiêu của ứng dụng nhằm giúp việc "rã băng" trở nên dễ dàng và tiện lợi, giống như việc nhập liệu bằng giọng nói trong ứng dụng Google Doc của Google.

Cho tới thời điểm này, tiếng nói vẫn luôn là "ám ảnh" với các đại gia công nghệ. Các công ty lớn như Amazon, Google và Apple đều tập trung nguồn lực phát triển các trợ lý ảo điều khiển bằng giọng nói như Alexa hay Siri.

Thực tế cho thấy các công nghệ tương tác bằng giọng nói sẽ trở thành một giai đoạn tiếp theo trong định hướng phát triển công nghệ điện toán của các hãng.

Mặc dù được quan tâm ở cấp độ ít hơn so với công nghệ trợ lý ảo, nhưng các ứng dụng speech-to-text cũng đang ngày càng được mọi người quan tâm hơn để phục vụ nhiều nhu cầu trong nhiều lĩnh vực.

Hiện tại các ứng dụng "rã băng" kiểu này đang chia làm hai nhóm. Nếu miễn phí, chúng thường không chính xác. Với những ứng dụng cung cấp bản "rã băng" chính xác, chúng thường có phí bởi luôn phải có người hỗ trợ việc "hiệu đính" bản sao nội dung của máy.

Tuy nhiên với sự ra đời của ứng dụng Otter tại triển lãm di động toàn cầu tuần qua, các nhà phát triển đặt mục tiêu đưa tới người dùng một ứng dụng "rã băng" không những miễn phí, chính xác mà còn thông minh.

Ứng dụng Otter hiện đã sẵn sàng để bạn tải về trên các thiết bị Android và thiết bị di động của Google.

Để sử dụng Otter, bạn chạm vào biểu tượng microphone để bắt đầu ghi âm. Gần như ngay lập tức, một bản sao thô trực tiếp của những gì bạn nói sẽ bắt đầu xuất hiện.

Trong quá trình bạn đăng ký sử dụng Otter trên thiết bị di động, ứng dụng này sẽ "lấy mẫu" một đoạn nói thử của bạn để có thể "học" giọng nói của bạn và ghi chép chính xác những điều bạn nói trong lần sau.

Ứng dụng cũng cho phép bạn tìm kiếm dữ liệu, không chỉ trong nội dung một bản sao chép, mà còn trong toàn bộ các nội dung đã lưu trên máy. Nó cũng tự động tạo ra các từ khóa để bạn có thể chạm vào tìm kiếm.

Ngoài ra, bạn còn có thể thiết lập các nhóm trong Otter và nội dung "rã băng" có thể được chia sẻ trong ứng dụng này giữa các thành viên trong nhóm và giữa người nọ với người kia. Bạn còn có thể gửi cho người khác một đường link dẫn tới bản "rã băng" để xem trên nền tảng web.

Đắc Luân - Báo Tuổi trẻ

Bài gốc

See this gallery in the original post