Ngày 11/3/2020, IBM đã công bố các nền tảng công nghệ IBM Watson mới nhất được thiết kế để hỗ trợ doanh nghiệp nhận biết, hiểu và phân tích ngôn ngữ (tiếng Anh) với những hiểu biết sâu hơn và rõ ràng hơn.
Theo đó, đây là lần đầu tiên các công nghệ mới của khả năng Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) từ dự án Project Debater, thuộc Viện nghiên cứu IBM Research được thương mại hóa. Đây là hệ thống AI duy nhất có khả năng tranh luận với con người về các chủ đề phức tạp. Ví dụ, hệ thống đã lần đầu tiên đưa vào một tính năng phân tích cảm tính nâng cao để xác định và phân tích thành ngữ và những câu nói thông dụng. Các cụm từ, như “hầu như không hữu ích”, hoặc “nóng bỏng tay” đã thách thức các hệ thống AI vì chúng rất khó để các thuật toán phát hiện ra.
Điều này có nghĩa là, các doanh nghiệp có thể bắt đầu phân tích dữ liệu ngôn ngữ với các giao diện lập trình ứng dụng (APIs) của Watson để hiểu rõ hơn về hoạt động của mình. Đồng thời, các mô hình AI để hiểu các tài liệu kinh doanh như các văn bản đã được chuyển sang định dang PDF và các hợp đồng cũng được IBM giới thiệu trong lần ra mắt này.
Ông Rob Thomas - Giám đốc, Nhóm Dữ liệu và AI của IBM cho biết: “Ngôn ngữ là công cụ để thể hiện suy nghĩ và ý kiến, đồng thời là công cụ của thông tin. Đó là lý do tại sao chúng tôi tích cực nghiên cứu Project Debater và tích hợp những thành quả thu được vào Watson, nhằm hỗ trợ doanh nghiệp nắm bắt, phân tích, và hiểu rõ hơn ngôn ngữ con người và bắt đầu chuyển đổi cách thức ứng dụng nguồn tài nguyên trí tuệ này thành nguồn dữ liệu quý giá.”
Theo đại diện IBM, thời gian tới, các công nghệ của Project Debater tích hợp vào Watson sẽ tập trung vào việc nâng cao khai phá ngôn ngữ con người, với các kỹ năng chính là Phân tích (Analysis), Tóm tắt (Briefs) và Phân cụm (Clustering).
Với kỹ năng Phân tích, IBM đã tăng cường phân tích cảm tính để có thể xác định và hiểu rõ hơn các lược đồ từ vựng phức tạp như các cụm từ và biểu ngữ, mà khi kết hợp cùng nhau sẽ mang ý nghĩa mới. Công nghệ này sẽ được tích hợp vào công nghệ Hiểu biết ngôn ngữ tự nhiên của Watson trong tháng này. Ngoài ra, IBM cũng đưa ra công nghệ phân loại mới, cho phép khách hàng tạo ra các mô hình AI có thể dễ dàng phân loại các mệnh đề trong các tài liệu kinh doanh, như hợp đồng mua hàng. Dựa trên công nghệ phân loại từ tính năng học sâu của Project Debater, khả năng mới có thể học được từ vài trăm mẫu để thực hiện phân loại mới một cách nhanh chóng và dễ dàng. Công nghệ này sẽ được bổ sung vào Watson Discovery cuối năm nay.
Công nghệ Tóm tắt sẽ thu thập dữ liệu văn bản từ nhiều nguồn khác nhau để cung cấp cho người dùng bản tổng kết về những gì đang được nói và viết về một chủ đề cụ thể. Phiên bản đầu tiên đã được sử dụng tại Lễ trao giải Grammys năm nay để phân tích hơn 18 triệu bài viết, blog và tiểu sử để đưa ra những hiểu biết sâu sắc về hàng trăm nghệ sĩ và người nổi tiếng tham gia vào giải thưởng danh giá này. Dữ liệu sau đó được truyền tới các kênh phát sóng trực tiếp từ thảm đỏ, các video và hình ảnh theo yêu cầu trên trang web www.grammy.com để mang đến cho người hâm mộ bối cảnh sâu sắc hơn về các chủ đề hàng đầu của đêm trao giải. Theo kế hoạch, nó sẽ được bổ sung vào công nghệ Hiểu biết ngôn ngữ tự nhiên của IBM Watson trong thời gian từ nay tới cuối năm.
Và cuối cùng, được xây dựng từ những kết quả nghiên cứu của Project Debater, công nghệ phân cụm các chủ đề sẽ cho phép người sử dụng phân chia các dữ liệu theo từng nhóm cụm riêng biệt và tạo ra các chủ đề có ý nghĩa theo thông tin liên quan, sau đó có thể phân tích nhanh chóng và phù hợp. Công nghệ này sẽ được tích hợp vào Watson Discovery trong năm nay, cho phép các chuyên gia tùy chỉnh và tinh chỉnh các chủ đề liên quan, nhằm phản ánh ngôn ngữ theo nhóm doanh nghiệp hoặc ngành cụ thể, như bảo hiểm, y tế và sản xuất.
IBM đã từ lâu được biết đến là đơn vị tiên phong trong lĩnh vực NLP, đang phát triển các công nghệ cho phép các hệ thống máy tính học hỏi, phân tích và hiểu được ngôn ngữ của con người, bao gồm cả cảm tính, ngôn ngữ địa phương và ngữ điệu, đồng thời nâng cao tính chính xác và tốc độ học hiểu của hệ thống. IBM đã đưa công nghệ NLP của IBM Research ra thị trường thông qua các công nghệ Watson. Các sản phẩm như Watson Discovery để hiểu văn bản, Watson Assistant cho các trợ lý ảo, và Watson Natural Language Understanding cho phân tích cảm tính nâng cao đều được tích hợp NLP.
Một trong những ví dụ điển hình là việc Tập đoàn KPMG đã làm việc với IBM để tạo ra một giải pháp AI tích hợp nhiều dịch vụ Watson, bao gồm cả công nghệ Hiểu biết ngôn ngữ tự nhiên của Watson. |