Thứ Bảy, 20 tháng 1, 2024

Data governance

 1. Data governance là gì?

Data governance là quá trình quản lý chất lượng, tính nhất quán, an toàn và tuân thủ của dữ liệu trong một tổ chức. Data governance giúp đảm bảo rằng dữ liệu được sử dụng đúng mục đích, bởi những người có thẩm quyền và theo các nguyên tắc đã định sẵn. Data governance cũng giúp tăng cường khả năng truy cập, chia sẻ và phân tích dữ liệu, từ đó tạo ra giá trị kinh doanh cho tổ chức.

(Nguồn: https://www.alteryx.com/glossary/data-governance)

2. Những yêu cầu khi thực hiện Data governance

Để thực hiện data governance một cách hiệu quả, bạn cần tuân thủ những yêu cầu sau:

  • Xác định các vai trò và trách nhiệm liên quan đến dữ liệu, như chủ sở hữu dữ liệu, người quản lý dữ liệu, người sử dụng dữ liệu và các bên liên quan khác.
  • Thiết lập các tiêu chuẩn và chính sách về dữ liệu, như định dạng, đặt tên, phân loại, bảo mật và tuân thủ pháp luật.
  • Thực hiện các quy trình và công cụ để kiểm soát chất lượng dữ liệu, theo dõi nguồn gốc dữ liệu, giải quyết các vấn đề và xử lý các yêu cầu thay đổi.
  • Đánh giá và cải thiện liên tục hiệu suất và giá trị của data governance, bằng cách thu thập và phân tích các chỉ số và phản hồi.
  • Tạo ra một văn hóa ủng hộ data governance trong tổ chức, bằng cách tăng cường nhận thức, đào tạo và khuyến khích sự hợp tác giữa các bộ phận.

(Nguồn: https://www.alation.com/blog/steps-for-building-data-governance-strategy/)


3. Phân biệt Data governance với data management

Data Governance:

  • Data governance (quản trị dữ liệu) là việc xác định các quy tắc, tiêu chuẩn, quy trình và phương pháp để đảm bảo rằng dữ liệu được quản lý và sử dụng một cách hiệu quả, an toàn và tuân thủ các quy định pháp luật. 
  • Data governance tập trung vào việc xây dựng cấu trúc quản lý dữ liệu, xác định vai trò, trách nhiệm và quyền lực của các cá nhân hoặc phòng ban trong tổ chức đối với việc quản lý và sử dụng dữ liệu.
  • Data governance cũng bao gồm việc thiết lập chính sách, quy trình, và các nguyên tắc để đảm bảo tính nhất quán, độ chính xác và an toàn của dữ liệu.


Data Management:

  • Data management (quản lý dữ liệu) tập trung vào các hoạt động cụ thể liên quan đến việc thu thập, lưu trữ, xử lý, phân tích và quản lý dữ liệu.
  • Data management  bao gồm các công việc hàng ngày để quản lý và duy trì dữ liệu, nhưng không chỉ giới hạn ở việc quản lý dữ liệu trong một môi trường cụ thể. 
  • Data management cũng liên quan đến việc sử dụng các công cụ, kỹ thuật và quy trình để đảm bảo dữ liệu được tổ chức, sạch sẽ, có chất lượng và có thể tiếp cận một cách hiệu quả.

Tóm lại, data governance là quá trình thiết lập và duy trì các nguyên tắc, chính sách và tiêu chuẩn để đảm bảo dữ liệu của tổ chức được sử dụng một cách hiệu quả và an toàn. Data management là quá trình thực hiện các hoạt động liên quan đến việc thu thập, lưu trữ, xử lý, phân tích và phân phối dữ liệu. Data governance tập trung vào việc tạo ra một khung hoạt động cho dữ liệu, trong khi data management tập trung vào việc thực hiện các hoạt động đó theo khung đã định.

4. Các công cụ hỗ trợ data governance

Metadata Management Tools: 

  • Các công cụ quản lý metadata giúp tổ chức mô tả, định nghĩa và quản lý thông tin về dữ liệu. Các ví dụ bao gồm Collibra, Informatica Metadata Manager, Apache Atlas.

Data Quality Tools: 

  • Công cụ kiểm tra chất lượng dữ liệu giúp xác định và sửa chữa các vấn đề liên quan đến chất lượng dữ liệu. Các ví dụ bao gồm Informatica Data Quality, Talend Data Quality, Trifacta.


Master Data Management (MDM) Tools: 

  • Công cụ quản lý dữ liệu chính giúp duy trì và đồng nhất dữ liệu cơ bản trong toàn bộ tổ chức. Các ví dụ bao gồm Informatica MDM, Profisee, IBM InfoSphere Master Data Management.

Data Catalogs: 

  • Các công cụ danh mục dữ liệu giúp tổ chức tổ chức và tìm kiếm dữ liệu trong toàn bộ hệ thống. Các ví dụ bao gồm Collibra Catalog, Alation, AWS Glue Data Catalog.

Data Governance Platforms: 

  • Các nền tảng hoàn chỉnh cung cấp các tính năng toàn diện để triển khai và quản lý các chương trình data governance. Các ví dụ bao gồm Collibra, erwin Data Intelligence, Alation.

Data Security Tools: 

  • Các công cụ bảo mật dữ liệu giúp đảm bảo an ninh cho dữ liệu. Các ví dụ bao gồm Varonis, Symantec Data Loss Prevention, Thales CipherTrust Data Security Platform.

Data Governance Frameworks và Templates: 

  • Ngoài các công cụ cụ thể, sử dụng các khung như DAMA-DMBOK (Data Management Body of Knowledge) hoặc các mẫu quản lý dữ liệu có sẵn để xây dựng các quy trình và chính sách data governance.

Tài liệu tham khảo 

  • https://www.techtarget.com/searchdatamanagement/definition/data-governance
  • https://cloud.google.com/learn/what-is-data-governance#:~:text=Get%20the%20whitepaper-,Data%20governance%20defined,throughout%20the%20data%20life%20cycle.
  • https://www.talend.com/resources/what-is-data-governance/
  • https://www.ibm.com/topics/data-governance
  • https://www.cio.com/article/202183/what-is-data-governance-a-best-practices-framework-for-managing-data-assets.html


Không có nhận xét nào:

Đăng nhận xét

Sandbox

Thuật ngữ "sandbox" trong bối cảnh công nghệ được dùng để chỉ một môi trường thử nghiệm an toàn, trong đó các phần mềm, chương tr...