Hôm thứ Ba, bộ phận truyền thông của Ngân hàng Sberbank, Nga, tiết lộ với tờ Izvestiya về một mô hình AI, được gọi là GigaChat, do chính ngân hàng này thiết kế, đã vượt qua kỳ thi bác sĩ y khoa, vốn chỉ dành cho những sinh viên ngành y đã hoàn thành sáu năm học.
Cụ thể, GigaChat đã hoàn thành được 100 câu hỏi, đạt tỷ lệ chính xác 82%, cũng như những bài kiểm tra vấn đáp buộc thí sinh phải giải quyết ba nhiệm vụ tình huống liên quan đến phẫu thuật, trị liệu, sản khoa và phụ khoa. Trong một lần kiểm tra, mô hình này đã được yêu cầu đưa ra chẩn đoán, lập kế hoạch điều trị và chỉ định các xét nghiệm bổ sung.
Theo các nhà phát triển mô hình, mất sáu tháng cho việc đào tạo thuật toán để vượt qua các bài kiểm tra. Mô hình cũng được cung cấp một bộ dữ liệu 42 GB gồm các tài liệu giáo dục và phương pháp luận, bài báo và sổ tay được sử dụng bởi sinh viên y khoa Nga cũng như dữ liệu y tế.
Mặc dù đạt được kết qua ban đầu ấn tượng, các chuyên gia nhấn mạnh AI còn lâu mới thay thế được các bác sĩ thực thụ. Sergey Zhdanov, giám đốc Trung tâm Công nghiệp Y tế của Sberbank, đã dự đoán rằng mô hình GigaChat có thể trở thành tiền đề để phát triển những hệ thống, trang thiết bị phục vụ cho việc chăm sóc sức khỏe trong tương lai, hỗ trợ công việc hàng ngày của các bác sĩ lâm sàng.
Tuy vậy, Ruslan Permykov, chuyên gia tại cơ quan thuôc Sáng kiến Công nghệ Quốc gia, Nga cho biết dù có khả năng kiểm tra dữ liệu với tốc độ vượt qua con người, AI khó có thể đưa ra kết luận vượt khỏi phạm vi dữ liệu thiết lập.
“Giả sử chúng ta đào tạo một hệ thống để phân loại táo và lê, nó có thể xác định những đặc điểm của hai loại trái cây này với tốc độ nhanh hơn nhiều so với con người. Tuy nhiên, nếu yêu cầu hệ thống này phân tích một quả cà tím, tôi tin rằng nó có thể đưa ra câu trả lời sai do chưa được thiết lập dữ liệu cũng như chưa được đào tạo để trả lời"– ông Ruslan Permykov cho biết và nhấn mạnh rằng đầy là điểm yếu chung của tất cả hệ thống AI hiện tại.
Sber đã chính thức ra mắt GigaChat vào tháng 4/2023 và khẳng định đây là giải pháp thay thế cho ChatGPT. Tính đến tháng 1/2024, chatbot này đã có 2,5 triệu người dùng.
Kể từ khi ra đời, các ứng dụng AI, chẳng hạn như ChatGPT, có thể vượt qua một số bài kiểm tra vốn được thiết kế cho con người trong các lĩnh vực như: luật, kinh doanh, hay y học. Chẳng hạn, vào tháng 10, mạng thần kinh YandexGPT 2 của Nga đã vượt qua Kỳ thi quốc gia của nước này, gồm một bài kiểm tra về văn học, vốn được xem là thách thức cho các mạng thuật toán.