AI giúp tạo ảnh có thể ... nói chuyện

VASA-1 của Microsoft không chỉ tạo cử động môi "đồng bộ một cách tinh tế" kèm âm thanh mà còn thể hiện thần thái nhân vật thông qua chuyển động khuôn mặt và đầu tự nhiên, từ đó tăng tính chân thực.

VASA-1 tạo được ảnh chuyển động và nói chuyện một cách tự nhiên và chân thực.

Theo chia sẻ của Microsoft, đây là "hệ thống động học cho khuôn mặt" được huấn luyện thông qua mô hình tạo chuyển động tốt hơn một cách toàn diện so với các phương pháp trước đó. AI này hỗ trợ xử lý ảnh chân dung với phần đầu và phần trên của thân, với nhiều biểu cảm khác nhau, như: vui vẻ, tức giận, ngạc nhiên hoặc nghiêm nghị.

Trong video giới thiệu của Microsoft trên YouTube, VASA-1 có thể khiến các bức ảnh, tạo bởi Dall-E 3 và StyleGAN2, nói chuyện tự nhiên. Người dùng cũng có thể điều chỉnh thông số khuôn mặt, biểu cảm, giọng nói và nhiều chi tiết khác.

Trang chuyên về hình ảnh PetaPixel đánh giá VASA-1 cho khả năng thể hiện tốt hơn so với các AI tương tự, khiến khó nhận biết nếu xem lần đầu.

Hiện tại, Microsoft vẫn từ chối đề cập mô hình đứng sau, cũng như không có kế hoạch phát hành sản phẩm riêng, hay cung cấp API cho nhà phát triển. Họ giới thiệu VASA-1 nhằm phô diễn một trong những khả năng của AI: "Nghiên cứu của chúng tôi tập trung vào phát triển cảm xúc trực quan cho ảnh đại diện AI, hướng tới ứng dụng tích cực. Nó không nhằm tạo nội dung gây hiểu lầm hoặc lừa dối. Tuy nhiên, giống như các mô hình AI khác, nó vẫn có thể bị lạm dụng để mạo danh con người. Chúng tôi phản đối bất kỳ hành vi nào như vậy".

Ngoài làn sóng chatbot như ChatGPT hay Google Gemini, lĩnh vực AI cũng chứng kiến cuộc đua giữa các mô hình có khả năng tạo video như thật từ ảnh tĩnh. cách đây 1 tháng, Alibaba giới thiệu công cụ tương tự là EMO (Emotive Portrait Alive). AI này có thể tạo nét mặt, tư thế, di chuyển phần lông mày, nhíu mắt hay thậm chí lắc lư theo điệu nhạc.

AI giúp tạo ảnh có thể ... nói chuyện

Kinhtedothi - Công cụ AI mới của Microsoft có tên gọi là VASA-1, cho phép ảnh chân dung có thể nói, hát với biểu cảm tự nhiên.

Tin đọc nhiều

Galaxy S25 Ultra có giá cao hơn phiên bản tiền nhiệm

Galaxy S25 và Galaxy S25 Plus sẽ có nâng cấp quan trọng

Threads đạt mốc 35 triệu người dùng

Lừa đảo tài chính trực tuyến gia tăng trên không gian mạng Việt Nam

Hé lộ màu sắc của Galaxy S25 và Galaxy S25 Plus

Bạn đọc

Bồi thường đất cho người dân thế nào để ngang bằng giá thị trường?

Kinh tế đô thị cuối tuần

Lạng Sơn: tổng thu ngân sách Nhà nước ước 9.805,5 tỷ đồng

Sắp xếp lại số lượng cán bộ, công chức làm việc tại 41 phường mới

TP Hồ Chí Minh: năm 2025, GRDP bình quân đầu người sẽ đạt khoảng 8.500 USD?

Multimedia

Cao điểm kiểm tra vi phạm giao thông

Hương ước, Quy ước góp phần xây dựng nếp sống văn hóa, văn minh

Lịch nghỉ Tết Nguyên đán Ất Tỵ 2025

Khi thời gian là tài sản chung

Giá vàng trong nước đồng loạt tăng cao vọt lên