Sắp có công nghệ giúp nhận diện danh từ riêng

Các kỹ sư nghiên cứu Trí tuệ nhân tạo tại Alt Inc (Nhật Bản) và Công ty TNHH Alt Việt Nam sẽ công bố kết quả nghiên cứu mới nhất trong lĩnh vực nhận diện và phân tích danh từ riêng bằng máy tính tại Hội thảo hằng năm của Hội Ngôn ngữ học máy tính quốc tế (ACL 2017) tổ chức tại Vancouver, Canada từ ngày 30/7 đến 4/8.

Công nghệ nhận diện danh từ riêng là một trong những công nghệ lõi của Xử lý ngôn ngữ tự nhiên nhằm giúp máy tính lý giải được ngôn ngữ con người, đặt nền móng cho Trí tuệ nhân tạo.

Alt Inc và Alt Việt Nam đã phối hợp với giáo sư Satoshi Sekine của Đại học New York để nghiên cứu công nghệ nhận diện danh từ riêng al+ FG_NER (http://fgner.alt.ai ) cho tiếng Anh và tiếng Nhật.

So với công nghệ nhận diện danh từ riêng (NER) hiện có chỉ nhận diện được từ 8 đến 10 loại danh từ riêng như Tên người, Tên địa danh, Tên tổ chức thì al+ FG_NER nhận diện được nhiều loại danh từ riêng hơn (200 loại) và phân loại danh từ riêng ở mức chi tiết hơn (ví dụ Tên tổ chức có thể được phân loại tiếp thành công ty, tổ chức chính trị, đảng phái, câu lạc bộ thể thao, ban nhạc, …).

al+ FG_NER không những thành công trong việc nhận diện 200 loại danh từ riêng mà còn đảm bảo độ chính xác của việc nhận diện ở mức độ cao (trên 80%).

Theo TS. Nguyễn Tuấn Đức, trưởng đại diện Alt Việt Nam, ngoài sự chỉ đạo của GS Satoshi Sekine ra thì hầu hết các phần quan trọng của nghiên cứu này được các nhà nghiên cứu người Việt Nam thực hiện tại trụ sở Alt Việt Nam ở Hà Nội.

Đặc biệt, toàn bộ phần nghiên cứu thuật toán, lập trình, làm thí nghiệm và tóm tắt thành công trình khoa học đều được làm tại Hà Nội.

Những đóng góp trên đã giúp al+ FG_NER được công bố tại Hội thảo ACL 2017, một trong những hội thảo uy tín nhất thế giới về Xử lý ngôn ngữ tự nhiên, Trí tuệ nhân tạo. al+ FG_NER sẽ được công bố dưới dạng demo paper vào 5h45 phút chiều giờ địa phương tại Vancouver ngày thứ ba (1/8/2017).

Đỗ Hợp - Tiền Phong