Các nhà nghiên cứu của OpenAI cho biết phiên bản mới nhất của Dall-E có thể hiểu bối cảnh tốt hơn, không bỏ qua những từ cụ thể như phiên bản trước.
Đặc biệt, Dall-E 3 còn tích hợp với ChatGPT. Như vậy, khi sử dụng ChatGPT, người dùng không phải nghĩ ra lời nhắc chi tiết cho Dall-E 3 nữa mà chỉ cần yêu cầu ChatGPT đưa ra lời nhắc thay mình. Chatbot sau đó sẽ viết một đoạn văn (Dall-E làm tốt hơn với các câu dài) để Dall-E 3 làm theo. Người dùng vẫn có thể sử dụng lời nhắc riêng nếu họ có ý tưởng cụ thể cho Dall-E.
Trong phần demo với The Verge, Aditya Ramesh – nhà nghiên cứu chính và giám đốc nhóm Dall-E, nhắc ChatGPT giúp ông làm logo một nhà hàng ramen ở vùng núi.
ChatGPT đã viết một lời nhắc dài và Dall-E 3 đưa ra bốn lựa chọn. Việc kết nối Dall-E với chatbot giúp nhiều người sáng tạo tác phẩm AI hơn vì họ không cần phải giỏi viết lời nhắc.
Dall-E 3 sẽ phát hành cho người dùng ChatGPT Plus và ChatGPT Enterprise trước tiên vào tháng 10, sau đó là các phòng nghiên cứu và dịch vụ API. Chưa rõ khi nào phiên bản miễn phí cho mọi người được công bố.
OpenAI khẳng định đã bỏ nhiều công sức cho Dall-E 3 để tạo ra các biện pháp an toàn mạnh mẽ nhằm ngăn chặn việc tạo ra những hình ảnh thù địch. Công ty đã hợp tác với “quân đỏ” bên ngoài – những nhóm cố tình phá một hệ thống để kiểm tra tính an toàn – và dựa vào phân loại đầu vào (một cách để dạy mô hình ngôn ngữ bỏ qua những từ nhất định để tránh lời nhắc bạo lực, khiêu khích). Dall-E 3 cũng không thể tạo hình ảnh các nhân vật của công chúng nếu lời nhắc đề cập một cái tên cụ thể.
Trong một email, đại diện OpenAI cho biết Dall-E 3 được đào tạo để không tạo hình ảnh mang phong cách của những nghệ sỹ còn sống, khác với Dall-E 2.
Ngoài ra, OpenAI cũng cho phép nghệ sỹ bảo vệ tác phẩm của mình trước các mô hình AI tạo sinh tương lai. Họ có thể nộp một hình ảnh đang nắm bản quyền và yêu cầu không được dùng để đào tạo AI. Các phiên bản Dall-E sắp tới sẽ chặn kết quả có vẻ giống hình ảnh và phong cách của nghệ sỹ đó.