AWS ra mắt dịch vụ Amazon DataZone

Tạp chí Nhịp sống số - Ngày 6/12/2022 - Amazon Web Services Inc. (AWS) đã công bố Amazon DataZone, một dịch vụ quản lý dữ liệu mới giúp khách hàng nhanh chóng và dễ dàng lập danh mục, tìm kiếm, chia sẻ và quản lý dữ liệu được lưu trữ trên các nền tảng như AWS, tại chỗ (on-premise) hay bên thứ ba.

Với Amazon DataZone, quản trị viên và người quản lý tài sản dữ liệu của tổ chức có thể quản lý và chi phối quyền truy cập vào dữ liệu bằng cách sử dụng các biện pháp kiểm soát tốt nhất để đảm bảo dữ liệu được truy cập với quyền và bối cảnh phù hợp. Amazon DataZone giúp các kỹ sư, nhà khoa học dữ liệu, người quản lý sản phẩm, nhà phân tích và người dùng doanh nghiệp dễ dàng truy cập dữ liệu trong toàn tổ chức để họ có thể tìm kiếm, sử dụng và cộng tác với dữ liệu nhằm có được những hiểu biết sâu sắc (insights) từ thông tin đó. Để tìm hiểu thêm, hãy truy cập aws.amazon.com/datazone.

Amazon DataZone

Ngày nay, các tổ chức thu thập hàng petabyte và thậm chí hàng exabyte dữ liệu trải rộng trên nhiều bộ phận, dịch vụ, cơ sở dữ liệu tại chỗ và nguồn bên thứ ba (ví dụ: các giải pháp từ đối tác và bộ dữ liệu công cộng). Trước khi các tổ chức có thể khai thác toàn bộ giá trị của dữ liệu này, quản trị viên và người quản lý dữ liệu (hay là nhà cung cấp dữ liệu), là những người tạo và quản lý dữ liệu, cần phải biến dữ liệu này trở nên có thể truy cập được, đồng thời duy trì quyền kiểm soát và quản trị để đảm bảo chỉ có đúng người và vào đúng hoàn cảnh mới có thể truy cập dữ liệu đó. Đồng thời, nhân viên trong toàn công ty (tức là người sử dụng dữ liệu) muốn tìm kiếm và phân tích thông tin từ các nhà cung cấp dữ liệu để hỗ trợ họ đưa ra các quyết định. Các tổ chức phải cân bằng giữa nhu cầu kiểm soát, đảm bảo dữ liệu được bảo mật, với nhu cầu truy cập, để thúc đẩy việc đạt được những hiểu biết chi tiết mới. Tuy vậy, cũng thật khó để triển khai các chính sách quản trị khi cần phải cân nhắc đến hàng loạt loại dữ liệu, phòng ban và trường hợp sử dụng khác nhau trong toàn tổ chức. Một số doanh nghiệp xây dựng danh mục để sắp xếp thông tin của họ, nhưng các hệ thống này tốn nhiều thời gian để duy trì, yêu cầu nhà cung cấp dữ liệu gắn nhãn thủ công cho từng tập dữ liệu với ngữ cảnh bổ sung (ví dụ: nguồn gốc và mô tả) để có thể nhận biết được cũng như thiếu các biện pháp kiểm soát truy cập tích hợp để đơn giản hóa việc quản trị. Các tổ chức cũng gặp khó khăn trong việc thực hiện phân loại dữ liệu đảm bảo tính nhất quán, trong khi đó, các nhà cung cấp dữ liệu riêng lẻ phải đảm bảo thông tin của họ được đồng bộ, khiến việc tìm kiếm dữ liệu trong toàn tổ chức trở nên khó khăn và có thể dẫn đến thông tin trở nên cũ kỹ. Ngay cả khi người sử dụng dữ liệu tìm thấy thông tin họ cần, họ không có một phương thức đơn giản để yêu cầu quyền truy cập từ chủ sở hữu trực tiếp từ danh mục để tải dữ liệu vào dịch vụ phân tích và cộng tác với những người khác. Do đó, những người ra quyết định không thể có được thông tin họ cần một cách kịp thời, hoặc có thể đưa ra quyết định sai lầm dựa trên dữ liệu không đầy đủ hoặc lỗi thời.

Amazon DataZone là một dịch vụ quản lý dữ liệu mới giúp nhà cung cấp dữ liệu quản lý và điều chỉnh quyền truy cập dữ liệu dễ dàng hơn, đồng thời cho phép người sử dụng dữ liệu tìm kiếm, sử dụng và cộng tác trên dữ liệu để có những thấu hiểu về hoạt động kinh doanh. Nhà cung cấp dữ liệu sử dụng cổng web của Amazon DataZone để thiết lập danh mục dữ liệu kinh doanh của riêng họ bằng cách xác định phân loại dữ liệu, cấu hình chính sách quản trị và kết nối với nhiều dịch vụ AWS (ví dụ: Amazon S3 và Amazon Redshift), các giải pháp của đối tác (ví dụ: Salesforce và ServiceNow) và các hệ thống tại chỗ. Amazon DataZone loại bỏ gánh nặng duy trì danh mục bằng cách sử dụng máy học (ML) để thu thập và đề xuất siêu dữ liệu (metadata) (ví dụ: nguồn gốc và loại dữ liệu) cho mỗi tập dữ liệu, và bằng cách đào tạo về phân loại và sở thích của khách hàng để cải thiện theo thời gian. Sau khi danh mục được thiết lập, người sử dụng dữ liệu có thể sử dụng cổng web Amazon DataZone để tìm kiếm và tra nội dung dữ liệu, kiểm tra siêu dữ liệu theo bối cảnh và yêu cầu quyền truy cập vào các bộ dữ liệu khác nhau. Khi người sử dụng dữ liệu sẵn sàng bắt đầu phân tích dữ liệu, họ sẽ tạo Dự án dữ liệu trên Amazon DataZone - một không gian dùng chung trong cổng web nơi người dùng có thể trích xuất các bộ dữ liệu khác nhau, chia sẻ quyền truy cập với đồng nghiệp và cộng tác trong quá trình phân tích. Amazon DataZone được tích hợp với các dịch vụ phân tích của AWS, chẳng hạn như Amazon Redshift, Amazon Athena và Amazon QuickSight, cho phép người sử dụng dữ liệu truy cập các dịch vụ này tùy theo bối cảnh dự án dữ liệu của họ, nhờ vậy, họ không cần phải quản lý thông tin xác thực đăng nhập riêng biệt và dữ liệu của họ sẽ tự động có sẵn trong các dịch vụ này. Amazon DataZone cũng cung cấp các giao diện lập trình ứng dụng (API) để tích hợp với các giải pháp hoặc đối tác tùy chỉnh như DataBricks, Snowflake và Tableau để khách hàng có thể dễ dàng xuất bản, tìm kiếm và làm việc với tất cả các tài sản dữ liệu của họ.

Swami Sivasubramanian, phó chủ tịch Cơ sở dữ liệu, Phân tích và Máy học tại AWS, cho biết: “Quản trị tốt là nền tảng giúp toàn bộ tổ chức có thể truy cập dữ liệu, tuy nhiên chúng tôi thường nghe khách hàng chia sẻ rằng họ rất khó để đạt được sự cân bằng hợp lý giữa việc làm cho dữ liệu có thể khám phá được và duy trì quyền kiểm soát. Với Amazon DataZone, khách hàng có thể sử dụng một dịch vụ cân bằng giữa các biện pháp kiểm soát quản trị mạnh mẽ với quyền truy cập hợp lý để giúp dễ dàng tìm kiếm, sắp xếp và cộng tác với dữ liệu. Amazon DataZone tạo ra tính tự do dữ liệu trong toàn tổ chức, vì vậy mọi nhân viên có thể có những thấu hiểu mới về dữ liệu để tối đa hóa giá trị của nó.”

ENGIE là một công ty năng lượng toàn cầu tập trung vào năng lượng tái tạo và cơ sở hạ tầng năng lượng phân tán ít carbon để giúp khách hàng đạt được các mục tiêu giảm mức phát sinh carbon. Gregory Wolowiec, giám đốc công nghệ tại Data@ENGIE chia sẻ: “Tại ENGIE, các ưu tiên chính của chúng tôi là thống nhất dữ liệu giữa các bộ phận kinh doanh và cho phép chia sẻ dữ liệu để cải thiện hiệu suất và tạo ra giá trị trên quy mô lớn. Để giải quyết vấn đề này, trước tiên chúng tôi đã xây dựng một Nơi lưu trữ dữ liệu chia sẻ (Common Data Hub) trong nội bộ để giải quyết thách thức này ở tầm vỹ mô. Thay vì xây dựng và duy trì một nền tảng để hỗ trợ các nhu cầu quản trị và chia sẻ dữ liệu của mình, trong sáu tháng qua, chúng tôi đã làm việc với đội ngũ của Amazon DataZone, với tư cách là khách hàng thử nghiệm, cung cấp thông tin đầu vào để tạo ra một dịch vụ trên AWS, đồng thời mong muốn sử dụng Amazon DataZone để phổ biến dữ liệu trong toàn tổ chức và sử dụng quyền truy cập đơn giản với các dịch vụ phân tích và công cụ quản trị AWS. Điều này sẽ giúp các nhà phân tích và lãnh đạo kinh doanh của chúng tôi tạo ra các dự án sáng tạo và đưa ra quyết định dựa trên dữ liệu. Chúng tôi rất vui mừng được tích hợp Amazon DataZone vào các hoạt động kinh doanh của mình để tận dụng các khả năng mạnh mẽ của dịch vụ nhằm cho phép chia sẻ dữ liệu và tạo ra giá trị với dữ liệu trên quy mô lớn.”

Fox Corporation là nhà sản xuất và phân phối nội dung hàng đầu thông qua các thương hiệu kênh thể thao, tin tức và giải trí. Alex Tverdohleb, phó chủ tịch hạ tầng dữ liệu tại Fox Corporation cho biết: “Tại FOX, việc hợp nhất dữ liệu giữa các mảng kinh doanh của chúng tôi và tạo khả năng đáng tin cậy để tìm kiếm, xuất bản, truy cập và chia sẻ dữ liệu một cách an toàn trên quy mô lớn là rất quan trọng. Chúng tôi muốn các nhóm kinh doanh có thể tìm kiếm và chia sẻ dữ liệu một cách an toàn mà không cần phải làm các công việc kỹ thuật chuyên sâu. Amazon DataZone sẽ giúp đơn giản hóa và tự động hóa quá trình tìm kiếm và chia sẻ dữ liệu của chúng tôi - với sự quản lý phù hợp - để chúng tôi có thể đảm bảo dữ liệu được truy cập vào đúng thời điểm và với các công cụ phù hợp”.

Itaú là một công ty dịch vụ tài chính toàn cầu và là tổ chức tài chính khu vực tư nhân lớn nhất ở Mỹ Latinh. Roberto Figueira, trưởng phòng Nền tảng kỹ thuật phân tích và dữ liệu tại Itaú Unibanco cho biết: “Trở thành một tổ chức được thúc đẩy bởi dữ liệu là một trong những mục tiêu chính của công ty, nhưng chúng tôi phải liên tục cân bằng giữa quyền truy cập dữ liệu với các chính sách quản trị và tuân thủ của mình trong quá trình sử dụng các dịch vụ phân tích AWS, khiến các đội nhóm khó hoạt động nhanh chóng. Chúng tôi rất vui mừng được thử nghiệm Amazon DataZone bởi nó sẽ đơn giản hóa việc quản trị dữ liệu và giúp truy cập dữ liệu giữa các đơn vị kinh doanh dễ dàng hơn nhiều. Với Amazon DataZone, chúng tôi có thể thiết lập quyền truy cập chi tiết một cách nhanh chóng và dễ dàng cho các nhóm nhà phân tích, kỹ sư và nhà khoa học dữ liệu để thử nghiệm các giả thuyết dữ liệu trong các trường hợp kinh doanh khác nhau.”

Có thể bạn quan tâm