MV “Em Ơi Ví Dầu” của Đan Trường đã gây chú ý không chỉ bởi âm nhạc mà còn bởi việc ứng dụng công nghệ AI trong sản xuất. Với những mô hình AI tiên tiến được sử dụng, ê-kíp đã tạo ra những hình ảnh ấn tượng, tuy nhiên, vẫn còn tồn tại những hạn chế nhất định trong chất lượng hình ảnh. Trong bối cảnh công nghệ ngày càng phát triển, nhu cầu sửa máy tính tại nhà Đà Nẵng cũng ngày càng tăng, khi người dùng muốn trang bị cho mình những công cụ tốt nhất để khám phá và làm việc với công nghệ mới.
Những mô hình AI được sử dụng trong MV Em Ơi Ví Dầu của Đan Trường
Đầu tiên, chúng ta rất dễ dàng có thể nhận ra được những AI mà ê kíp của anh Bo sử dụng trong MV này.
Trước hết là huấn luyện một mô hình LoRA dựa trên hình ảnh của ca sĩ Đan Trường. Thứ hai là tạo ra hình ảnh tĩnh và sau đó biến chúng thành hình ảnh động, bằng cách lồng ghép các đoạn cắt cảnh ngắn vào giữa những cảnh AI tạo ra phiên bản của Đan Trường ngồi một chỗ và mấp máy môi hát. Một giải pháp khác là sử dụng hình ảnh tĩnh do AI tạo ra, đưa vào ứng dụng AI để đồng bộ hóa môi với âm thanh bài hát, sau đó chèn đoạn clip ngắn đó vào MV.
Dựa trên những quan sát này, mình dự đoán ê-kíp của Đan Trường sử dụng công cụ Stable Diffusion, cụ thể là các mô hình dựa trên phiên bản SD 1.5. Điều này có thể nhận ra qua những đặc điểm như gương mặt do AI tạo ra nhìn trông rất nhựa.
Ca sĩ Đan Trường đã chia sẻ với báo VnExpress rằng “AI đã học từ gần 600 tấm ảnh của tôi để tạo ra phiên bản Đan Trường giống nhất. Dĩ nhiên hình ảnh thực hiện bằng công nghệ không đẹp và sống động như ngoài đời thật nhưng tôi muốn thử nghiệm làm điều mới mẻ”. Đây chính là lý do mình tin rằng mọi hình ảnh Đan Trường ngồi ngoài ruộng đội nón mặc sơ mi hát là kết quả của quá trình huấn luyện mô hình LoRA (Low Rank Adaptation) bằng card đồ họa.
Ngoài ra, mình dự đoán rằng ê kíp còn sử dụng thêm một mô hình AI nữa để ghép âm thanh khớp với cử động môi, đó là Wav2lip.
Vậy tại sao MV của anh Bo lại vẫn xấu như vậy?
Nguyên nhân dẫn đến việc này có lẽ đến từ 2 điều, đó là do khả năng giới hạn của tạo sinh hình ảnh, sau đó biến hình ảnh thành video của mô hình AI Stable Diffusion và thứ hai là ê kíp làm MV vẫn còn bị giới hạn về khả năng xử lý và điều khiển AI.
Đầu tiên và quan trọng nhất là tổng thể màu sắc của MV. Các khung hình trông rất rực rỡ, với màu xanh nổi bật và hình ảnh thiếu chi tiết. Dường như ê-kíp làm MV đã bỏ qua việc xử lý hậu kỳ, chỉ đơn giản là ghép các đoạn cắt cảnh của Đan Trường phiên bản AI ngồi hát và các cảnh do AI tạo ra. Những đoạn clip này có thể được đưa vào Premiere Pro hoặc DaVinci Resolve để xử lý hậu kỳ, điều chỉnh màu sắc và LUT để tạo ra chất lượng hình ảnh đẹp hơn, làm cho khung hình trông dễ nhìn hơn.
Thứ hai là khả năng điều khiển prompt và sử dụng các công cụ như ControlNet và Inpainting trong Stable Diffusion. MV có những đoạn không khớp về bố cục không gian và chi tiết, chẳng hạn như các ngôi nhà có mái hiên méo mó và các khối nhà không nối với nhau hợp lý. Vấn đề này có thể được chỉnh sửa kỹ lưỡng bằng công cụ Inpainting, đến khi tạo ra sản phẩm hợp lý và ưng mắt. Stable Diffusion có thể tạo ra kết quả tốt hơn nhiều nếu người dùng kiểm soát tốt quy trình tạo hình ảnh và video.
Thứ ba, công nghệ AI tạo sinh video hiện tại còn nhiều hạn chế trong việc tạo ra các khung hình đồng nhất về không gian, chi tiết và logic. Bạn có thể tìm kiếm trên YouTube với từ khóa “AI MV” để thấy những video có thể đẹp hơn MV của Đan Trường, nhưng các vấn đề về chi tiết hình ảnh thì vẫn tồn tại tương tự. Điều này có lẽ phải chờ công nghệ phát triển hơn trong tương lai gần.
Tóm lại, MV “Em Ơi Ví Dầu” của Đan Trường, mặc dù chưa hoàn thiện về mặt hình ảnh, đã thể hiện sự đổi mới và sáng tạo trong việc ứng dụng công nghệ AI. Những thử nghiệm này mở ra hướng đi mới cho ngành công nghiệp âm nhạc, nhưng cũng phản ánh những thách thức mà công nghệ hiện tại gặp phải. Hy vọng rằng trong tương lai, với sự phát triển của công nghệ, chúng ta sẽ được chứng kiến những sản phẩm chất lượng hơn. Đối với những người muốn khám phá và làm việc với những công nghệ mới này, dịch vụ sua may tinh tai nha Da Nang sẽ là một lựa chọn hữu ích để đảm bảo thiết bị luôn hoạt động hiệu quả.