Thứ Tư, 26 tháng 4, 2023

Vấn đề ứng dụng trí thông minh nhân tạo trong báo chí, truyền thông ở Việt Nam hiện nay.

 Hiện nay, các phần mềm sử dụng trí thông minh nhân tạo và dữ liệu lớn đang ngày càng được sử dụng rộng rãi trong đời sống xã hội, đặc biệt là trong lĩnh vực báo chí, truyền thông, nhằm trợ giúp việc sản xuất nội dung, chia sẻ tin tức, tương tác với độc giả và tìm hiểu thông tin người dùng… Bài viết khái quát về trí thông minh nhân tạo và việc ứng dụng trong lĩnh vực báo chí, truyền thông; đề xuất một số giải pháp ứng dụng trí thông minh nhân tạo vào hoạt động báo chí, truyền thông ở Việt Nam hiện nay.

Vấn đề ứng dụng trí thông minh nhân tạo trong báo chí, truyền thông ở Việt Nam hiện nay

Các phần mềm sử dụng trí thông minh nhân tạo và dữ liệu lớn đang ngày càng được sử dụng rộng rãi trong đời sống - Ảnh IT

1. Khái quát về trí thông minh nhân tạo

Trí tuệ nhân tạo là một lĩnh vực đã được ngành công nghệ thông tin nghiên cứu từ rất sớm. Trí tuệ nhân tạo hay trí thông minh nhân tạo (Artificial Intelligence - viết tắt là AI) là một ngành thuộc lĩnh vực khoa học máy tính (Computer science), đây là một sản phẩm do con người sử dụng các kỹ thuật, công nghệ để giúp máy tính có thể tự động hóa các hành vi, suy nghĩ, xử lý và hành động mô phỏng trí thông minh của con người. Theo thời gian, các phần mềm ứng dụng trí thông minh nhân tạo ngày càng tiếp cận tới nhiều người dùng, có khả năng phân tích, tư duy như con người đồng thời có khả năng cung cấp các dữ liệu hữu ích, có tính chính xác cao, có khả năng kiểm chứng được và có thể áp dụng cho nhiều lĩnh vực nếu được sử dụng đúng cách. 

Việc áp dụng các phần mềm ứng dụng trí thông tin nhân tạo hiện nay phổ biến trong các hoạt động nghiệp vụ như tóm tắt nội dung văn bản và tài liệu có dung lượng lớn, tạo ra các câu trả lời theo yêu cầu và chủ đề của người dùng hoặc sáng tạo các nội dung, các tác phẩm theo góc nhìn mới, đặt tiêu đề cho các bài báo, dịch thuật đa ngôn ngữ. Các ứng dụng này giúp con người có thể tiết kiệm thời gian và công sức lao động của mình trong các hoạt động hàng ngày. 

Nguyên lý hoạt động của các phần mềm hỏi - đáp tự động sử dụng dữ liệu lớn khá là đơn giản. Phần mềm sẽ ghi nhận những câu hỏi của người dùng, sau đó đưa ra lời giải đáp dựa trên kỹ thuật phân tích dữ liệu lớn. Để trả lời câu hỏi của người dùng, các phần mềm này sẽ dự đoán, phân tích và sau đó đưa ra đáp án dựa vào nguồn thông tin trong hệ thống hoặc các dữ liệu được cung cấp từ người dùng dẫn đến một cảm giác thông minh thực sự như một con người. Điểm tạo nên sự khác biệt của các phần mềm này là việc không ngừng thu thập dữ liệu, phân tích và tăng vốn hiểu biết thông qua các dữ liệu được thay đổi liên tục trên không gian mạng và các dữ liệu thu thập được trong khi vẫn dự đoán các nội dung của câu hỏi. Điều này giúp các phần mềm cũng như các hệ thống ứng dụng trí thông minh nhân tạo ngày các tiếp cận được với con người và dần thu thập các dữ liệu đầu vào với nhiều gợi ý và trả lời nhiều thắc mắc của người dùng hơn. Với một người dùng bình thường, các phần mềm này đơn giản là một trang web hay một ứng dụng cho phép nói chuyện các chủ đề với một con người ảo.

Về bản chất, đây là các phần mềm thông minh nhân tạo, thực hiện các câu trả lời của người dùng thông qua dữ liệu. Quá trình tạo ra một phần mềm thông minh nhân tạo bao gồm các bước: Thu thập dữ liệu (từ không gian mạng, từ cung cấp của người dùng), chọn lọc dữ liệu, thực hiện gán nhãn dữ liệu để thực hiện huấn luyện cho phần mềm và huấn luyện phần mềm như việc tiếp thu tri thức của con người. Dữ liệu thu thập được càng nhiều thì càng có nhiều câu trả lời. 

Tuy nhiên, một vấn đề nảy sinh ở đây là các phần mềm này có thể phân tích và hiểu rất nhiều tầng ý nghĩa của một dữ liệu của đầu vào, nhưng không thể hiểu được ý nghĩa đó “đúng” hay “sai”. Thực tế cho thấy, việc một dữ liệu là đúng hay sai chỉ là tương đối. Các dữ liệu đang tồn tại trên internet mà các nhà khoa học thu thập được để huấn luyện cho phần mềm cũng không phải luôn theo thiên hướng có ý nghĩa là “đúng” và dữ liệu đó chứa thông tin là “đúng” do các nhà khoa học thường sử dụng các công cụ thu thập dữ liệu tự động, sức người cũng không thể thu thập được các dữ liệu để phân tách được tính đúng - sai của các dữ liệu đó do các dữ liệu trên internet là rất lớn. Đơn cử, dữ liệu thu thập về trái đất của chúng ta, có thể có các dữ liệu là trái đất hình tròn, nhưng cũng có thể có các dữ liệu minh chứng trái đất là phẳng. Khi đó, các dữ liệu thu thập được sẽ chứa cả dữ liệu đúng và dữ liệu sai. 

Một phần mềm sử dụng trí thông minh nhân tạo sẽ phân tích, xử lý và tìm kiếm các dữ liệu để tìm ra các tầng ý nghĩa của thông tin đầu vào đó thì đồng thời nó cũng tìm ra các dữ liệu mang tính “đúng” và các dữ liệu mang tính “sai” mà nó không thể xác định được đâu là dữ liệu đúng, đâu là dữ liệu sai. Các phần mềm sử dụng trí thông minh nhân tạo đơn giản chỉ là ghi nhớ dữ liệu thu thập được, phân tích để tìm ra các tầng ý nghĩa của các dữ liệu nên khi được hỏi, các phần mềm này không phân biệt được đúng hay sai mà chỉ trả lời lại các dữ liệu đã được nó lưu trữ, phân tích. 

ChatGPT ra đời đã đánh dấu một bước tiến mạnh mẽ của lĩnh vực ứng dụng trí thông minh nhân tạo trong đời sống kinh tế, xã hội. ChatGPT (Chat Generative Pre-training Transformer) là một chatbot do công ty OpenAI của phát triển. ChatGPT được huấn luyện với 300 tỷ từ, 175 tỷ tham số, tổng thời gian huấn luyện gộp là 300 năm với chi phí huấn luyện hơn 5 triệu USD và được OpenAI phát triển từ 2015 với số tiền đầu tư 1 tỷ USD. 

Hiểu một cách đơn giản, ChatGPT là một phần mềm ứng dụng trí thông minh nhân tạo nhưng điểm khác biệt là nằm ở "kho" kiến thức đã học được, nó có thể hiểu được nội dung câu hỏi một cách chính xác và nhanh chóng đưa ra câu trả lời lưu loát, đầy đủ. Các câu trả lời này được ChatGPT tự tổng hợp và được tạo ra từ dữ liệu lớn đã được huấn luyện trước. ChatGPT còn có thể làm thơ, soạn nhạc, viết thư, thiết kế đồ họa, lập trình... ChatGPT và các phần mềm ứng dụng trí thông minh nhân tạo khác có khả năng tự tạo ra nội dung dựa trên yêu cầu đầu vào, được lập trình để tự học dựa vào dữ liệu và tương tác với con người nên càng nhiều người sử dụng ChatGPT và ứng dụng trí thông minh nhân tạo càng khiến cho các phần mềm ứng dụng trí thông minh nhân tạo này ngày càng thông minh, hoàn thiện và rất khó để phân biệt giữa kết quả được tạo ra bởi các phần mềm ứng dụng trí thông minh nhân tạo này với kết quả được tạo bởi con người.

Đây là một phần mềm ứng dụng trí thông minh nhân tạo để trả lời các câu hỏi của người dùng thông qua phân tích ngôn ngữ tự nhiên như việc trao đổi giữa người với người. Để huấn luyện phần mềm này, các nhà khoa học tại công ty OpenAI đã thu thập một lượng lớn dữ liệu dưới dạng văn bản của con người từ internet, các dữ liệu này đến từ Wikipedia, các trang thông tin điện tử, mạng xã hội, các dữ liệu từ bách khoa toàn thư được công khai trên không gian mạng. Sau khi thu thập, họ làm sạch, chọn lọc nội dung và cho phần mềm ChatGPT học và tìm hiểu các tầng ngữ nghĩa như suy nghĩ của con người khi tiếp nhận thông tin. Các tầng ngữ nghĩa được phần mềm này nhận ra thì càng có nhiều tham số để ChatGPT trả lời người dùng.

2. Trí thông minh nhân tạo ứng dụng vào báo chí, truyền thông hiện nay

ChatGPT và ứng dụng trí thông minh nhân tạo cũng tạo ra các thách thức cho hoạt động báo chí, truyền thông: làm thế nào để nhận diện, xác định và loại bỏ các nội dung được tạo ra bởi các ứng dụng thông minh nhân tạo khi bản thân nó chứa các thông tin chưa được kiểm chứng, không trích dẫn nguồn gốc, sai lệch cũng như các vấn đề bảo mật thông tin người dùng. 

Báo chí, truyền thông luôn cần những dữ liệu trung thực, nguồn thông tin và các góc nhìn mới về các sự kiện chính trị, xã hội, văn hóa đang diễn ra trong thực tiễn Việt Nam và trên thế giới, trong khi đó ChatGPT ứng dụng trí thông minh nhân tạo có khả năng trợ giúp con người tạo ra các thông tin mới dựa trên phân tích ngữ nghĩa và tổng hợp thông tin từ các dữ liệu có sẵn, hoặc nếu bị các đối tượng lạm dụng các phần mềm ứng dụng trí thông minh nhân tạo này để sản xuất nội dung sẽ dẫn tới các thông tin sai lệch, xuyên tạc. 

Các phần mềm sử dụng trí thông minh nhân tạo này cũng có thể được sử dụng và huấn luyện các dữ liệu có chủ ý để tạo ra các thông tin sai lệch, gây nhầm lẫn hoặc tạo ra các chỉ dẫn không đúng… từ đó phát tán thông tin sai lệch trên không gian mạng. Khi đó, việc tuyên truyền các nội dung cũng như kiểm duyệt nội dung được tạo ra bởi các phần mềm ứng dụng trí thông minh nhân tạo cũng là một thách thức lớn trong hoạt động báo chí, truyền thông. 

Thực tế cho thấy, nhiều hãng công nghệ như Google, Facebook, IBM, Microsoft đã nhiều lần giới thiệu các phần mềm trả lời tự động nhưng do các phần mềm đó khi được ứng dụng đều trả lời một số câu hỏi dẫn tới thiên hướng có ý nghĩa “sai” mà không thể chấp nhận được về mặt chuẩn mực của con người như xúc phạm về giới tính, không tôn trọng tôn giáo, sắc tộc hay bịa đặt, thay đổi tính chính xác của các sự kiện đã diễn ra hay sai lệch so với các chân lý được con người đồng thuận là đúng… Chính vì thế, các phần mềm này đều bị dừng ứng dụng hoặc không đưa ra thị trường. Các công ty lớn nhận định, nếu phần mềm chưa thể giải quyết được nhận thức “đúng”-“sai” thì sẽ không đưa ra thương mại hóa hay cung cấp cho người sử dụng để phòng ngừa việc lạm dụng các phần mềm này cho các hoạt động gây ảnh hưởng không tốt tới cộng đồng. 

ChatGPT cũng tạo ra những đoạn văn vi phạm tới chuẩn mực về tính "đúng - sai" của con người do nó không hiểu được các ý nghĩa “đúng” - “sai” trong dữ liệu mà nó thu thập được, nhưng công ty OpenAI vẫn đưa ChatGPT ra công chúng. OpenAI đã trở thành công ty đi  đầu trong việc thương mại hóa một phần mềm mà chưa thể kiểm soát về tính "đúng - sai".

Hiện nay, các phần mềm sử dụng trí thông minh nhân tạo và dữ liệu lớn đang ngày càng được sử dụng rộng rãi trong đời sống. Các thế lực thù địch, chống phá Đảng và Nhà nước ta đang cũng đang lợi dụng các kỹ thuật mới, công nghệ mới trong đó có trí thông minh nhân tạo để xây dựng các nội dung chống phá nền tảng tư tưởng của Đảng, tấn công thu thập dữ liệu để sử dụng vào mục đích chống phá, can thiệp vào hoạt động chính trị, an ninh, quốc phòng, kinh tế, đưa ra các thông tin thất thiệt hay dựng chuyện, bịa chuyện… Do đó, để ứng dụng hiệu quả trí thông minh nhân tạo vào hoạt động báo chí, truyền thông ở Việt Nam, bài viết đề xuất một số giải pháp sau: 

Một là, tăng cường sự lãnh đạo, bảo đảm sự lãnh đạo tuyệt đối, trực tiếp của Đảng, Nhà nước về bảo vệ nền tảng tư tưởng của Đảng; cần có sự thống nhất và phối hợp đồng bộ trong các cơ quan, tổ chức quản lý thông tin trên không gian mạng. Đặc biệt, cần xây dựng một cơ sở dữ liệu lớn về lý luận chính trị, nền tảng tư tưởng của Đảng để cung cấp luận cứ cho toàn Đảng, toàn quân và toàn dân soi chiếu tính đúng đắn của thông tin thu thập được.

Hai là, bổ sung, hoàn thiện hành lang pháp lý, ban hành luật pháp và hướng dẫn thực thi pháp luật liên quan đến sử dụng các hệ thống phần mềm ứng dụng trí thông minh nhân tạo, đặc biệt là sử dụng các dữ liệu trên không gian mạng, trong đó bổ sung các hành lang pháp lý về điều chỉnh hành vi của người dùng khi sử dụng các phần mềm hỏi - đáp tự động để sáng tạo nội dung và cung cấp thông tin trên không gian mạng. Cần bổ sung những quy định liên quan đến các hành vi vi phạm như đánh cắp thông tin, bảo hộ quyền sở hữu trí tuệ để bảo vệ đơn vị sở hữu khỏi những tình huống bị thiệt hại bởi các cá nhân/đơn vị khác.

Ba là, các cơ quan quản lý nhà nước cần xây dựng các kế hoạch, chiến lược, chương trình tập huấn cho các cơ quan, tổ chức báo chí, truyền thông, nhà báo, phóng viên trong các hoạt động ứng dụng các phần mềm thông minh nhân tạo. Nâng cao nhận thức của các tổ chức, cá nhân và phát huy vai trò của các cơ quan, tổ chức báo chí, truyền thông đối với công tác kiểm chứng các thông tin ứng dụng các phần mềm ứng dụng trí thông minh nhân tạo.

Bốn là, xây dựng cơ chế phối hợp giữa các cơ quan, tổ chức báo chí, truyền thông để tận dụng thế mạnh về các cơ sở dữ liệu của mình, đồng thời chia sẻ dữ liệu với các cơ quan, tổ chức khác. Bên cạnh đó, cần xây dựng các kế hoạch và chiến lược truyền thông một cách hợp lý, phù hợp với đại đa số người dân về chất lượng, ảnh hưởng của các sản phẩm do các phần mềm này tạo ra. 

Năm là, tăng cường công tác tập huấn, đào tạo nguồn nhân lực tham gia hoạt động bảo đảm an toàn, an ninh thông tin, nguồn lực tham gia việc kiểm chứng thông tin, đặc biệt nhận diện và kiểm chứng thông tin do các phần mềm ứng dụng trí thông minh nhân tạo tạo ra. Đặc biệt chú trọng các hoạt động ứng dụng trí thông minh nhân tạo trong các lực lượng chuyên trách bảo đảm và bảo vệ nền tảng tư tưởng của Đảng, bảo đảm chủ quyền, an ninh quốc gia trên không gian mạng. Đồng thời, ban hành các chính sách hợp lý nhằm tổ chức thực hiện cũng như phối hợp giữa các cơ quan được giao nhiệm vụ nghiên cứu, đấu tranh bảo vệ nền tảng tư tưởng của Đảng, bảo vệ bí mật nhà nước, chủ quyền quốc gia, an ninh quốc gia trên không gian mạng.

_________________

Ngày nhận bài: 10-3-2023; Ngày bình duyệt: 12-3-2023; Ngày duyệt đăng: 17-3-2023.

 

Tài liệu tham khảo

1. Theo báo cáo tổng hợp Cuộc cách mạng công nghiệp lần thứ Một số đặc trưngtác động hàm ý chính sách đối với Việt Nam” của Viện Hàn lâm Khoa học xã hội Việt Nam năm 2017.

2. Nguyễn Đăng Đào: Bảo đảm an toànan ninh thông tin quốc gia trên không gian mạng, Tạp chí Antoàn thông tin, 2018.

3. Thorp, H. Holden. "ChatGPT is fun, but not an author" Science 379.6630 (2023): 313-313.

4. Alan D. Thompson (tháng 2 năm 2023), Báo cáo của Cục Nghiên cứu Kinh tế Quốc gia (Scholes, Bernanke, MIT),  https://lifearchitect.ai/chatgpt/#timeline.

1 nhận xét: