Sự ra mắt của Gemini- AI được xem là nỗ lực nghiêm túc nhất của Google vốn được cho là chậm chân hơn so với các đối thủ.
Gemini được xây dựng theo hướng đa phương thức có thể khái quát, vận hành và kết hợp nhiều thông tin khác nhau gồm văn bản, code, âm thanh, hình ảnh và video.
Theo Phó Chủ tịch sản phẩm của Google- Phụ trách Bard- Bà Sissie Hsiao cho biết: Gemini có thiết kế linh hoạt, được tối đa hóa với ba kích cỡ khác nhau (Ultra, Pro và Nano) để có thể hoạt động trên mọi thứ từ Trung tâm dữ liệu đến thiết bị di động".
Được biết, trước khi ra mắt, hãng đã cho vận hành Gemini Pro thông qua một số điểm tiêu chuẩn ngành. Trong 6/8 tiêu chuẩn, Gemini Pro hoạt động tốt hơn GPT 3.5, bao gồm tiêu chuẩn MMLU - một trong những tiêu chuẩn hàng đầu để đo lường các mô hình AI lớn, và cả tiêu chuẩn GSM8K dùng để đo lường khả năng tư duy toán học ở cấp độ phổ thông.
Đồng thời, Google cũng điều chỉnh Gemini Pro trong Bard để có khả năng ưu việt hơn trong việc hiểu, tóm tắt, lý luận, lập trình và lập kế hoạch.
Hiện, người dùng có thể trải nghiệm với phiên bản Bard tích hợp Gemini Pro vpis các prompt tạo văn bản (còn các phương thức khác sẽ sớm được hỗ trợ). Tuy nhiên, Bard sử dụng Gemini Pro hiện mới hỗ trợ tiếng Anh có thể sử dụng ở 180 quốc gia và vùng lãnh thổ.
Gemini hiện đang trong giai đoạn thử nghiệm, nhưng Google có kế hoạch phát hành nó cho công chúng vào năm 2024 với nhiều ngôn ngữ sẽ được tích hợp tren Bard.
Gemini là mô hình AI đa phương thức do bộ phận Google DeepMind nghiên cứu và phát triển, được đề cập lần đầu hồi tháng 5 tại sự kiện Google I/O 2023. Gemini nhìn chung là bước tiến lớn trong lĩnh vực AI. Nó có tiềm năng cách mạng hóa cách chúng ta tương tác với máy tính và mang lại lợi ích cho người dùng doanh nghiệp và xã hội.