Big data và phát triển chính phủ số
Ngày nay, xu hướng mới trong môi trường chính phủ điện tử chính là big data. Nó được coi là một trong những vấn đề quan trọng nhất do những thách thức về quản lý, chất lượng và quyền riêng tư. Việc tạo và lưu trữ khối lượng khổng lồ dữ liệu có cấu trúc và phi cấu trúc do các chính phủ tạo ra ở nhiều định dạng khác nhau không mang lại giá trị cho các bài toán cho máy học ra quyết định. Mặt khác, các chính phủ luôn mong muốn được hưởng lợi từ sự tăng vọt dữ liệu này, từ đó có thể sử dụng các khía cạnh khác nhau của nó như phát hiện gian lận hoặc để đo lường nhu cầu và mong muốn của người dân đối với các dịch vụ. Các dịch vụ ở đây nằm trong nhiều lĩnh vực khác nhau như tài chính, y tế, môi trường, thống kê kinh tế và xã hội, v.v.
Bài viết giới thiệu việc ứng dụng Big data trong bối cảnh môi trường chính phủ điện tử giải quyết những thách thức mà các chính phủ phải đối mặt và mô tả các cơ hội trong lĩnh vực này.
Bối cảnh thế giới
Ngày nay, công nghệ kỹ thuật số đang biến đổi các khía cạnh kinh tế và xã hội của các tổ chức công và tư. Số hóa, truyền thông xã hội và việc sử dụng các thiết bị điện tử ngày càng tăng được coi là nguyên nhân chính dẫn đến sự gia tăng dữ liệu do các tổ chức nhà nước và tư nhân tạo ra. Các mối quan hệ với ngân hàng, nhà cung cấp, khách hàng ngày càng liên tục (không ngừng nghỉ) và tự động hóa các giao dịch được đăng ký trực tuyến đã tăng lên đáng kể. Những thay đổi của Công nghệ Thông tin và Truyền thông (ICT) đòi hỏi sự xuất hiện của những đổi mới căn bản của các hệ thống truyền thống để lưu trữ dữ liệu và xử lý dữ liệu. Như vậy, ví dụ, thông qua việc sử dụng ICT trong lĩnh vực y tế, đã có sự thay đổi trong việc chuyển đổi mô hình, từ một hệ thống phản ứng với trọng tâm là chữa bệnh thành một hệ thống chủ động để phòng bệnh. Ngoài ra, hệ thống giáo dục đang có sự thay đổi căn bản thông qua việc sử dụng các nền tảng đào tạo từ xa (E-learning) có sử dụng Internet. Tăng cường sử dụng thiết bị, mạng điện tử và số hóa các quy trình xử lý dữ liệu tạo ra một lượng lớn dữ liệu từ hoạt động kinh tế và xã hội mà con người thực hiện.
Dựa trên một số dự báo về dữ liệu lũ lụt, lượng dữ liệu được tạo ra trên toàn thế giới sẽ tăng gấp đôi sau mỗi hai năm; dự kiến sẽ tăng từ 4,4 zettabyte (hoặc 4,4 nghìn tỷ gigabyte) vào năm 2013 lên 44 zettabyte vào năm 2020 (Cyclone, 2014). Dữ liệu khổng lồ này đến từ các nguồn không đồng nhất khác nhau như web, giao dịch thương mại trực tuyến, dữ liệu chính phủ điện tử, dữ liệu mạng xã hội, mạng di động, ứng dụng di động và internet vạn vật.
Vào năm 2013, chỉ có 22% thông tin trong tổng thể không gian kỹ thuật số có giá trị và hữu ích để phân tích, vì siêu dữ liệu (dữ liệu tổng hợp) bị thiếu. Đến năm 2020, tỷ lệ thông tin có giá trị được phân tích ước đạt hơn 35%, chủ yếu do tăng cường đầu tư vào năng lực kỹ thuật và con người trong lĩnh vực big data. Thị trường thế giới về công nghệ big data dự kiến sẽ đánh dấu mức tăng trưởng hàng năm là 23% trong giai đoạn 2014-2019, trong khi doanh thu trên toàn thế giới từ big data sẽ tăng hơn 50% từ 122 tỷ USD năm 2015 lên 187 tỷ USD (WordWide Big Data, 2016). Các lĩnh vực có sức nặng lớn nhất trong cuộc cách mạng dữ liệu này là lĩnh vực sản xuất, lĩnh vực ngân hàng, viễn thông, y tế, giao thông và khu vực công.
Có thế thấy một xu thế bứt phá của big data ảnh hưởng trực tiếp đến mọi mặt của xã hội, kinh tế, chính phủ và điều tất yếu sự hiện diện của dữ liệu.
Các sáng kiến từ Big data
Các cơ quan chính phủ sử dụng đổi mới công nghệ để tăng tính cởi mở, hiệu quả, nâng cao sự hài lòng của người dân. Mục tiêu của họ là hướng tới dịch vụ và họ nhận thức được tiềm năng của việc thu thập, xử lý và phân tích dữ liệu như sau:
- Chính phủ mở và chia sẻ dữ liệu: Cung cấp thông tin chính xác và nhanh chóng từ các tổ chức công cho người dân là yêu cầu để chính phủ minh bạch hơn, thúc đẩy sự tin cậy cao hơn giữa công dân và chính phủ, phù hợp với các sáng kiến dữ liệu mở.
- Phân tích tình cảm của người dân: Nó được coi là con mắt mới của chính phủ nơi thông tin từ cả phương tiện truyền thông xã hội truyền thống và mới đang mở ra cơ hội mới để đạt được sự minh bạch và sự tham gia của người dân.
- Phân tích kinh tế: Mối tương quan, nhận dạng mẫu và phân tích dữ liệu phong phú đến từ nhiều nguồn giúp các nhà hoạch định chính sách đưa ra quyết định dựa trên kiến thức.
- Cơ quan thuế: Tích hợp và đối sánh dữ liệu có cấu trúc và phi cấu trúc, dữ liệu đến từ các nguồn khác nhau, có tác động lớn đến việc phát hiện gian lận tiềm ẩn.
- Ứng dụng thành phố thông minh và Internet vạn vật (IoT): Dựa trên sự đổi mới công nghệ, các tổ chức công trên toàn thế giới đang sử dụng các cảm biến để đo các hiện tượng vật lý như lưu lượng giao thông, vị trí của phương tiện, v.v. Phân tích lượng dữ liệu khổng lồ này được đặc trưng bằng tốc độ, mang lại cho các cơ quan công quyền tiềm năng cải thiện quản lý đô thị với mục tiêu chính là nâng cao chất lượng cuộc sống cho người dân của họ.
- An ninh mạng: Thu thập và phân tích dữ liệu đến từ các máy tính mạng của chính phủ và nhật ký của chúng làm tăng khả năng phát hiện và ngăn chặn các cuộc tấn công độc hại của các tổ chức.
Trong lịch sử, một khu vực công thường phát triển nhiều hệ thống không kết nối với nhau nhưng lại cố gắng phục vụ một nhóm công dân duy nhất. Duy nhất ở đây là yếu tố dân số nhỏ nhưng đạt được sự phục vụ tốt về chất. Việc không giới hạn và kết nối các hệ thống này có thể cho phép phối hợp và tích hợp nhiều hơn giữa các cơ quan cung cấp các dịch vụ hiệu quả, thông suốt hơn cho công dân. Nhiều sáng kiến được thực hiện bởi các chính phủ trên toàn thế giới để chuyển đổi các dịch vụ được cung cấp cho công dân và doanh nghiệp bằng cách tiếp cận một cách tổng thể các dịch vụ của chính phủ.
Ở một khía cạnh, khả năng tương tác được coi là yếu tố then chốt quan trọng nhất để chuyển đổi. Khả năng tương tác được định nghĩa là sự kết nối của dữ liệu, hệ thống, con người và quy trình đa dạng, mang lại cho chính phủ khả năng kết hợp các dịch vụ cho các hệ thống mới. Ngoài ra, bằng khả năng tương tác, các chính phủ có thể hưởng lợi từ việc kết nối cơ sở hạ tầng hiện có với môi trường công nghệ mới. Nhưng khi chúng ta nói về khả năng tương tác, nó không nên được coi là khía cạnh kỹ thuật, bởi vì nó là một vấn đề chính trị hơn. Trên thế giới, lãnh đạo của nhiều nước đại diện cho chế độ chính phủ khác nhau đang thảo luận về sự cần thiết của khả năng tương tác tốt hơn để thúc đẩy chia sẻ dữ liệu giữa các hệ thống khác nhau trên toàn thế giới.
Ở một khía cạnh khác, trong các khu vực công, khái niệm big data là mới trong hệ thống và nó được coi là mô hình để chuyển sang chính phủ thông minh. Nó có thể giảm chi phí, cải thiện việc ra quyết định và giảm thời gian cần thiết để xử lý dữ liệu. Một lượng lớn dữ liệu do các hệ thống chính phủ điện tử tạo ra phải giải quyết các vấn đề chủ yếu liên quan đến ngữ nghĩa dữ liệu. Thông tin được chia sẻ giữa các hệ thống khác nhau, được coi là nguồn dữ liệu lớn, cần được thực hiện một cách có ý nghĩa và hiệu quả để đạt được khả năng tương tác. Các quốc gia khác nhau như Hoa Kỳ, Brazil, Đức và Estonia đã phát triển khung khả năng tương tác của Chính phủ (GIF) cho phép tích hợp dữ liệu đến từ nhiều hệ thống. Đây là chìa khóa để mở ra tiềm năng dữ liệu lớn để nâng cao khả năng ra quyết định.
Ở một ví dụ cụ thể, Ủy ban châu Âu coi big data là tài sản kinh tế quan trọng, mang lại lợi thế cạnh tranh. Có khoảng 20 công ty thống trị thị trường big data đang thực hiện những thay đổi lớn đưa ra mô hình mới để lưu trữ và xử lý dữ liệu. Chỉ có hai trong số các công ty này là công ty châu Âu, và điều này xảy ra bởi vì châu Âu phải đầu tư nhiều hơn vào chuỗi giá trị dữ liệu. Một dự án lớn, được khởi động vào năm 2005, với chi phí khoảng 500 triệu euro, đã bắt đầu, đó là một thỏa thuận Đối tác Công tư, giữa Ủy ban Châu Âu, giới học giả, nhà nghiên cứu và các ngành công nghiệp. Mục tiêu của dự án này là khởi động các hành động và đóng góp vào sự phát triển của cơ sở hạ tầng ICT và các ứng dụng hỗ trợ big data, nhằm cải thiện việc ra quyết định. Lợi ích của các dự án này là:
- Tạo ra 40% dữ liệu đã được xử lý và sẵn sàng trao đổi trên thị trường dữ liệu toàn cầu,
- 100.000 công việc mới ở châu Âu vào năm 2020,
- Giảm bớt 10% tiêu thụ năng lượng và chăm sóc sức khỏe tốt hơn.
Phân loại nguồn dữ liệu lớn
Các nguồn dữ liệu lớn không đồng nhất và được thu thập từ nhiều ứng dụng khác nhau như: dữ liệu tuần tự hoặc chuỗi thời gian (hồ sơ lịch sử); các luồng dữ liệu liên tục phát triển (dữ liệu video, dữ liệu nhận được bởi các cảm biến khác nhau); dữ liệu không gian địa lý; các tệp đa phương tiện (văn bản, âm thanh và video); dữ liệu mạng xã hội; dữ liệu web, v.v.
Năm 2013, UNECE đã phân loại các nguồn Dữ liệu lớn thành ba loại chính:
- Mạng xã hội: dữ liệu phi cấu trúc được tạo ra bởi con người được số hóa và phổ biến;
- Kinh doanh truyền thống có hệ thống: dữ liệu đến từ các quy trình nơi các sự kiện kinh doanh được ghi lại và theo dõi, chẳng hạn như đăng ký khách hàng, sản xuất sản phẩm, nhận đơn đặt hàng, v.v. Những dữ liệu này là dữ liệu có cấu trúc và bao gồm các giao dịch, bảng tham chiếu và các mối quan hệ, cũng như siêu dữ liệu xác định ngữ cảnh của chúng (Devlin và cộng sự, 2012). Loại dữ liệu này bao gồm dữ liệu mà một công ty quản lý và xử lý, cả trong hệ thống hoạt động và hệ thống thông minh kinh doanh và các đặc điểm chính của chúng là được cấu trúc và chủ yếu được lưu trữ trong hệ thống cơ sở dữ liệu quan hệ. Chúng bao gồm dữ liệu hành chính, được định nghĩa là dữ liệu được thu thập bởi hoặc thay mặt cho các tổ chức trung ương và địa phương, cho các mục đích hành chính, phù hợp với các hành vi pháp lý và dưới luật mà hoạt động của họ dựa trên đó;
- Internet of Things (IoT) - triết lý phát triển công nghệ mới, dựa trên các đối tượng thông minh giúp tương tác và cải thiện cuộc sống của con người. Mọi đối tượng trong cuộc sống hàng ngày từ ô tô đến nhà cung cấp khí đốt đều có thể có nhận dạng kỹ thuật số, thông qua mạng, vì vậy nó trở nên chức năng hơn, tiết kiệm hơn và hiệu quả hơn, nơi các "đối tượng thông minh" có thể chia sẻ thông tin về bản thân và môi trường xung quanh chúng. Cảm biến "thông minh" làm tăng số lượng những thứ có thể được kết nối, nhưng cũng tự nhiên cung cấp quyền kiểm soát thông tin.
Thách thức trong việc sử dụng big data
Cơ hội và thách thức của việc sử dụng big data trong các tổ chức chính phủ đang là vấn đề tranh luận mở vì tính phức tạp của việc quản lý dữ liệu và bản chất của các sản phẩm dịch vụ mà chính phủ cung cấp cho công dân và doanh nghiệp. Dưới đây là tổng quan về những thách thức chính:
- Quản lý big data:
Những thách thức này bao gồm các thách thức về xử lý dữ liệu, quản lý dữ liệu giữa các tổ chức và thiếu các công nghệ và chuyên môn cần thiết để quản lý một lượng lớn dữ liệu. Các phân tích thống kê truyền thống dựa trên dân số mục tiêu, dữ liệu có cấu trúc và các phương pháp xử lý dữ liệu dựa trên lý thuyết lấy mẫu. Vì big data hầu hết không có cấu trúc và ở các định dạng khác nhau như video, hình ảnh, dữ liệu văn bản, nên các kỹ thuật truy xuất thông tin như khai thác dữ liệu, giảm dữ liệu và trí tuệ nhân tạo nên được các nhà thống kê chính thức xem xét sử dụng để đối phó với những thách thức này. Truy xuất, lưu trữ, xử lý và chuyển khối lượng lớn tập dữ liệu là một thách thức. Những đổi mới công nghệ như máy tính hiệu suất cao, phương tiện lưu trữ và kênh dữ liệu băng thông cao có thể giải quyết một phần những vấn đề này. Vì dữ liệu được bảo mật và bảo mật là ưu tiên hàng đầu trong các tổ chức, nên việc sử dụng các giải pháp điện toán đám mây giá rẻ không phải là lựa chọn tốt nhất được họ cân nhắc. Các nhóm làm việc nhân sự trong các dự án dữ liệu lớn nên bao gồm các thành viên có kỹ năng đa ngành từ các nền tảng chuyên môn khác nhau. Các cơ quan thống kê, ngân hàng và các cơ quan công quyền nên đào tạo nhân viên của họ.
- Quyền truy cập, mối quan tâm về đạo đức và quyền riêng tư:
Trong phần lớn các trường hợp, chủ sở hữu của dữ liệu lớn nằm ngoài sự kiểm soát của các tổ chức quốc gia hoặc quốc tế. Dữ liệu do khu vực tư nhân nắm giữ và việc truy cập và sử dụng chúng yêu cầu biên bản ghi nhớ phải được thỏa thuận với chủ sở hữu dữ liệu nơi tính bảo mật và quyền riêng tư của dữ liệu cần được chỉ rõ. Vì big data chứa dữ liệu cá nhân, các tổ chức nên đầu tư cơ sở hạ tầng công nghệ thông tin thích ứng với các kỹ thuật bảo mật như mật mã, ẩn danh dữ liệu và kiểm soát tiết lộ thống kê. Hơn nữa, có sự xung đột giữa các yêu cầu về quyền riêng tư và những yêu cầu về sự cởi mở và minh bạch hơn.
- Chất lượng của dữ liệu:
Chất lượng của các chỉ số được tạo ra bằng dữ liệu lớn cần được đánh giá để đảm bảo rằng các chỉ số mới được tạo ra đáp ứng các tiêu chuẩn chất lượng dữ liệu tối thiểu cho các thống kê tài chính, tiền tệ, tài chính thực tế hoặc các thống kê khác. Hầu hết dữ liệu đến từ big data là không có cấu trúc và các kỹ thuật thao tác dữ liệu thích hợp nên được áp dụng để chuyển đổi chúng thành dữ liệu chuỗi thời gian. Quá trình xử lý có nghĩa là làm sạch dữ liệu (loại bỏ dữ liệu không cùng tham chiếu), phát hiện và xử lý ngoại lệ (những dữ liệu đi ngược lại bảng giá trị), bổ sung các biến còn thiếu cần được thực hiện theo các phương pháp thống kê truyền thống để đảm bảo chất lượng dữ liệu. Ví dụ, chính phủ dựa trên dữ liệu mạng xã hội, sử dụng phân tích tình cảm có thể đưa ra kết luận về các xu hướng hoặc quan điểm kinh tế - xã hội khác nhau.
Kết luận
Big data, một khái niệm không mới nhưng thực sự nắm bắt được và ứng dụng được là một câu chuyện khác. Hầu như việc ứng dụng big data vào các vấn đề cần giải quyết của chính phủ trên thế giới vẫn là một câu chuyện nan giải và cần nhiều sự thay đổi hay hỗ trợ hợp tác hơn nữa.
Ở Việt Nam cũng vậy, big data trong các công ty, các sàn thương mại điện tử là đã là một quân cờ mạnh để khẳng định vị thế, là kim chỉ nan dẫn lối cho sự thay đổi. Nhưng trong chính phủ, big data vẫn là một câu chuyện cần thực sự có cái nhìn rõ ràng và nó là điều tất yếu nếu muốn có một chính phủ số trong tương lai. Hiệu trưởng trường Đại học Kinh tế Quốc dân, PGS.TS. Phạm Hồng Chương đã từng nói: “Tại Việt Nam, kho dữ liệu còn rất hạn chế, muốn nghiên cứu phải đòi hỏi nền tảng công nghệ rất lớn. Tuy nhiên, để phục vụ người dân tốt hơn thì việc xây dựng dữ liệu lớn (big data) là việc cần thiết, phải đẩy mạnh triển khai trong thời gian tới.” Phát biểu này hoàn toàn đúng với chính phủ điện tử Việt Nam.
Bài viết chia sẻ góc nhìn big data trong các chính phủ và hi vọng là gợi ý cho chính phủ điện tử ở Việt Nam.
Vũ Cao Minh Đức