Động thái mới nhất của OpenAI thể hiện tham vọng của công ty nhằm tiếp tục duy trì vị trí dẫn đầu trong cuộc đua thống trị công nghệ mới nổi.
Các nhà nghiên cứu của OpenAI đã trình diễn tại một sự kiện livestream về khả năng đối thoại như con người với công nghệ mới khi có thể lắng nghe và phản hồi theo thời gian thực mà không có độ trễ. Hơn nữa, ứng dụng có thể ngắt đoạn trong hội thoại như người thật, điều này tạo ra những cuộc trò chuyện thực tế mà các chatbot giọng nói AI cho đến nay vẫn chưa có.
GPT-4o là một bước tiến hướng tới trải nghiệm tương tác giữa người và máy tính toàn diện và thực tế hơn. Ứng dụng được thiết kế để tiếp nhận yêu cầu từ nhiều dạng, bao gồm văn bản, âm thanh và hình ảnh, sau đó tạo ra phản hồi theo mong muốn của người sử dụng.
Đáng chú ý, GPT-4o có thể phản hồi chỉ trong 232 - 320 mili giây, tương tự như thời gian phản hồi của con người trong một cuộc trò chuyện. Ngoài ra, nhà phát triển cũng đang xây dựng chức năng tương tự đối với các ngôn ngữ khác. GPT-4o đặc biệt tân tiến trong khả năng giải mã âm thanh từ người dùng, nó có thể nhận biết cảm xúc của người sử dụng, phân định qua tông giọng hay lắng nghe tiếng cười, khóc.
OpenAI được Microsoft hậu thuẫn đang phải đối mặt với sự cạnh tranh ngày càng tăng và áp lực mở rộng lượng người dùng của ChatGPT, sản phẩm chatbot nổi tiếng đã gây tiếng vang trên thế giới với khả năng tạo ra nội dung văn bản giống con người và mã nguồn phần mềm mang tính đột phá.
OpenAI cho biết họ sẽ triển khai mô hình AI mới này trong vài tuần tới. Giám đốc công nghệ Mira Murati cho biết mô hình GPT-4o mới sẽ được cung cấp miễn phí nhằm mang đến trải nghiệm tốt nhất cho người sử dụng.
Các nhà nghiên cứu của OpenAI đã trình diễn các khả năng sử dụng giọng nói mới của ChatGPT. Trong một bản demo, trợ lý giọng nói ChatGPT đã thực hiện yêu cầu đọc một câu chuyện cho trẻ em trước khi đi ngủ bằng các giọng nói, cảm xúc và âm điệu khác nhau.
Trong một bản demo thứ hai, trợ lý giọng nói ChatGPT đã sử dụng khả năng thị giác để hướng dẫn giải một phương trình toán học được viết trên một tờ giấy.
Các nhà nghiên cứu cũng trình diễn khả năng dịch ngôn ngữ theo thời gian thực của mô hình GPT-4o.
Murati cho biết người dùng trả phí của GPT-4o sẽ có giới hạn dung lượng lớn hơn so với bản miễn phí.
Ngay sau khi ra mắt vào cuối năm 2022, ChatGPT được xướng danh là ứng dụng đạt 100 triệu người dùng hoạt động hàng tháng nhanh nhất từ trước đến nay. Tuy nhiên, lưu lượng truy cập toàn thế giới vào trang web của ChatGPT đã có những biến động mạnh trong năm qua và hiện mới chỉ quay trở lại mức đỉnh điểm vào tháng 5 năm 2023, theo công ty phân tích Similarweb.
Các chuyên gia trong ngành cho biết, việc cung cấp cho ChatGPT khả năng giống như công cụ tìm kiếm để truy cập và liên kết đến thông tin web chính xác. Cập nhật là bước tiếp theo rõ ràng và là điều mà phiên bản hiện tại của ChatGPT còn chưa làm được.
OpenAI đã đưa ra thông báo này chỉ một ngày trước khi Google dự kiến tổ chức hội nghị thường niên dành cho nhà phát triển, nơi họ dự kiến sẽ trình diễn các tính năng liên quan đến AI mới của riêng mình.