Việt Nam vươn mình trong kỷ nguyên mới

Viện CMC ATI đạt Top 1 Hội thi Giải pháp ứng dụng trí tuệ nhân tạo

Hà Thanh
Chia sẻ Zalo

Kinhtedothi - Mới đây, tại TP.HCM, Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) đã đạt Top 1 tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo năm 2022 với giải pháp số hóa, chuyển đổi số toàn diện văn bản, hồ sơ giấy tờ dạng ảnh C-ORC.

Hội thi Giải pháp ứng dụng trí tuệ nhân tạo lần 3 do Sở Thông tin và Truyền thông, Thành đoàn phối hợp Đại học Quốc gia TP HCM, Hiệp hội phần mềm và dịch vụ công nghệ thông tin Việt Nam tổ chức nhằm tìm kiếm các giải pháp ứng dụng trí tuệ nhân tạo vào các lĩnh vực cuộc sống.

Hội thi năm nay có 210 đội thi, gồm có 2 nhóm dự thi: nhóm 1 là thử thách trí tuệ nhân tạo (AI Challenge) với chủ đề "Truy vấn sự kiện từ dữ liệu thị giác" (Event Retrieval from Visual Data) được tổ chức theo chuẩn của các cuộc thi quốc tế; nhóm 2 là sản phẩm ứng dụng trí tuệ nhân tạo (AI solution).

Anh Nguyễn Tiến Đồng, đại diện đội CMC ATI  tham dự cuộc thi cho biết, nhóm nghiên cứu, giải pháp có thể số hóa toàn bộ các dạng tài liệu, văn bản, kể cả văn bản viết tay, biểu mẫu, hồ sơ... phục vụ các thủ tục hành chính. Riêng văn bản chữ viết tay, mô hình của nhóm có thể nhận dạng với độ chính xác trên 95% dựa trên việc cho máy học trên tập hơn 10.000 loại dữ liệu viết tay tiếng Việt.

CMC ATI nhận cú đúp giải thưởng tại Cuộc thi Xử lý Ngôn ngữ và Tiếng nói tiếng Việt VLSP 2022

Nhóm CMC AI của Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) tiếp tục nhận cú đúp giải thưởng tại cuộc thi Xử lý Ngôn ngữ và Tiếng nói tiếng Việt - VLSP 2022 (Vietnamese Language and Speech Processing) với một giải Nhất và một giải Ba.

Viện CMC ATI nhận giải Ba tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo.
Viện CMC ATI nhận giải Ba tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo.

Đây là cuộc thi được Câu lạc bộ Xử lý ngôn ngữ và tiếng nói tiếng Việt (VLSP) và Hội Tin học Việt Nam tổ chức lần thứ 9. VLSP 2022 tổ chức 7 cuộc thi về xử lý tiếng nói và xử lý văn bản, bao gồm: tổng hợp tiếng nói, nhận dạng tiếng nói, xác minh người nói, phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung - Việt, hỏi đáp đa ngữ về nội dung ảnh.

Cụ thể, nhóm CMC AI đạt giải Nhất với giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” tại cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”. Đồng thời, nhóm còn giành được giải Ba với giải pháp “Mô hình transformers với khả năng mô hình hoá văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” tại Cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt”.

Với cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”, các đội phải giải bài toán nghiên cứu đa lĩnh vực: Xử lý ngôn ngữ tự nhiên và Xử lý ảnh. Cuộc thi này xuất hiện lần đầu tiên tại VLSP 2022. Nhiệm vụ của các nhóm là xây dựng những mô hình/hệ thống phải có khả năng trả lời câu hỏi về nội dung ảnh bằng ngôn ngữ tự nhiên. Thêm một thách thức nữa cho các đội là câu hỏi có thể bằng tiếng Việt, tiếng Anh hoặc tiếng Nhật.

Cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt” (VLSP Abmusu) là một trong các tác vụ xử lý ngôn ngữ rất hữu ích để giải quyết vấn đề khai thác dữ liệu văn bản. Trong thời đại bùng nổ thông tin, khai thác dữ liệu một cách hiệu quả có tiềm năng rất lớn nhưng lại là một bài toán khó, tốn nhiều thời gian, tiền bạc và công sức. Nhận một tập tài liệu đầu vào, hệ thống tóm tắt phải chọn lọc hoặc tạo sinh một bản tóm tắt ngắn gọn cho các tài liệu này.

Để đạt được giải nhất trong cuộc thi VLSP 2022, team CMC AI đã thử nghiệm nhiều thuật toán khác nhau để tìm được ra thuật toán tốt nhất. Kết quả được đánh giá trên hệ thống do ban tổ chức cuộc thi cung cấp và team đã vượt qua 27 đội dự thi khác như Viettel, VinGroup, VCCorp, TopCV,… để đạt được vị trí dẫn đầu.

Nhóm CMC AI của Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) đã nhận cú đúp giải thưởng tại cuộc thi VLSP 2022.
Nhóm CMC AI của Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) đã nhận cú đúp giải thưởng tại cuộc thi VLSP 2022.

Toàn bộ cuộc thi diễn ra trong khoảng hơn một tháng, trong đó thời gian để các đội thi đăng ký, chuẩn bị là khoảng 3 tuần. Thời gian để các đội nộp bài thi và cạnh tranh với nhau trên bảng xếp hạng kéo dài trong 10 ngày.

“Giải thưởng là kết quả của sự cố gắng của cả đội trong một khoảng thời gian tuy không quá dài nhưng hết sức cam go và thử thách. Đây cũng là minh chứng cho năng lực của team AI nói riêng cũng như Viện CMC ATI nói chung. Các bài toán trong cuộc thi nếu xử lý được rất tiềm năng trong việc tích hợp trong nền tảng trợ lý ảo mà nhóm đã và đang phát triển”, TS  Đặng Minh Tuấn, Viện trưởng Viện Nghiên cứu Ứng dụng Công nghệ CMC ATI chia sẻ.

Nói về điểm nổi bật về giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” của Viện CMC ATI, anh Nguyễn Tiến Đồng Trưởng nhóm CMC AI cho biết, đây là một một ý tưởng sáng tạo riêng, dựa trên những kinh nghiệm làm việc cũng như khả năng chuyên môn của Viện. Giải pháp này vừa đơn giản lại vừa hiệu quả, không giới hạn trong phạm vi cuộc thi mà còn có thể áp dụng vào thực tiễn. Đây chính là sự giao thoa giữa kỹ thuật xử lý ảnh và xử lý ngôn ngữ tự nhiên. Bên cạnh đó, giải pháp còn kết hợp các thông tin về đặc trưng ảnh với các thực thể có trong ảnh để đưa ra câu trả lời. Đặc biệt, mô hình giải pháp này cho phép đưa ra câu trả lời cũng như sử dụng câu hỏi ở nhiều ngôn ngữ khác nhau, bao gồm tiếng Việt, tiếng Anh và tiếng Nhật.

Đặc biệt, với “Mô hình transformers với khả năng mô hình hoá văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” đã được team CMC AI lựa chọn dựa trên việc thử nghiệm rất nhiều bộ tham số khác nhau. Mô hình này có thể xử lý được các văn bản dài cũng như các bài toán tóm tắt đơn văn bản và đa văn bản.

“Cả nhóm đã phải thử nghiệm nhiều thuật toán khác nhau nhưng có các thuật toán không đem lại kết quả như kỳ vọng. Khó khăn là vậy nhưng team đã không nản chí và tiếp tục cố gắng trong suốt quá trình diễn ra cuộc thi để cuối cùng tìm ra một giải pháp tốt nhất và giành được vị trí cao nhất trong cuộc thi. Mỗi thời điểm bài thi được nộp lên hệ thống và thấy kết quả được cải thiện đều là những kỷ niệm đáng nhớ đối với team’, anh Đồng tâm sự.

Anh Nguyễn Trung Chính - Chủ tịch HĐQT/Chủ tịch Điều hành Tập đoàn Công nghệ CMC, Giám đốc Viện Nghiên cứu Ứng dụng Công nghệ CMC ATI chia sẻ: “Mô hình tổ chức Viện nghiên cứu trong tập đoàn rất quan trọng. CMC ATI sẽ là nơi nghiên cứu tạo ra các sản phẩm công nghệ có năng lực cạnh tranh, đem lại sự hữu ích cho sự phát triển của tập đoàn và cho xã hội. Tập đoàn chuẩn bị bước sang tuổi 30 với các thách thức và cơ hội mới. Mong rằng Viện sẽ trở thành hạt nhân để dẫn dắt những chiến lược phát triển về công nghệ kỹ thuật, đồng thời tạo ra nguồn nhân lực nghiên cứu ứng dụng chất lượng cao cho Việt Nam”.