Sự phát triển của công nghệ trí tuệ nhân tạo (AI) trong lĩnh vực tạo sinh video đã ghi nhận những bước tiến vượt bậc trong ba năm qua. Quá trình này được thể hiện rõ nét qua các phiên bản video AI mô phỏng diễn viên Will Smith ăn mỳ, từ chất lượng hình ảnh còn nhiều lỗi vào đầu năm 2023 đến độ chân thực cao vào cuối năm 2025, song song với đó là những thách thức ngày càng lớn về pháp lý và nguy cơ tin giả.
Sự tiến hóa của công nghệ qua ba năm
Vào đầu năm 2023, video do mô hình ModelScope tạo ra và được chia sẻ trên Reddit cho thấy những hạn chế rõ rệt của công nghệ AI tạo sinh thời kỳ đầu. Hình ảnh được cộng đồng đánh giá là “rất tệ”, trong đó nam diễn viên có khuôn mặt biến dạng, thiếu chỉn chu, cùng các lỗi sai phổ biến về giải phẫu như thừa ngón tay.
Đến năm 2024, một phiên bản khác do mô hình MiniMax của Trung Quốc thực hiện đã cho thấy sự cải thiện. Theo video so sánh do chính Will Smith đăng tải, hình ảnh đã được mô phỏng chính xác hơn đáng kể. Tuy nhiên, sản phẩm vẫn tồn tại các điểm thiếu tự nhiên, điển hình là động tác nhai còn kỳ quặc và các sợi mỳ có xu hướng lơ lửng một cách phi vật lý ở cuối video.
Bước sang năm 2025, chất lượng video đã có bước nhảy vọt. Tháng 5, một video tạo bởi mô hình Veo 3 của Google được nhà phát triển Javi Lopez đăng tải, cho thấy hình ảnh hài hòa nhưng gặp vấn đề về âm thanh với tiếng nhai “quá giòn”. Tới tháng 10, phiên bản Veo 3.1 đã khắc phục được lỗi âm thanh, tạo ra một sản phẩm được đánh giá là chân thực hơn nhiều so với các phiên bản trước đó. Sự cải tiến liên tục này cho thấy tốc độ phát triển nhanh chóng của công nghệ tạo video AI.
Thách thức pháp lý và cuộc đua thị trường
Song song với tiến bộ công nghệ, các vấn đề pháp lý và nỗi lo về tin giả cũng ngày càng gia tăng. Hollywood đang có những động thái mạnh mẽ để ngăn chặn việc sử dụng trái phép hình ảnh người nổi tiếng. Vào tháng 9/2025, một nhóm các đơn vị sở hữu bản quyền lớn gồm Disney, Universal và Warner Bros đã đệ đơn kiện MiniMax lên tòa án liên bang vì vi phạm bản quyền.
Không chỉ trong lĩnh vực giải trí, giới chính trị gia tại Washington cũng bày tỏ lo ngại về khả năng AI bị lạm dụng để tạo ra các video giả mạo lời nói và hành động của họ, tiềm ẩn nguy cơ ảnh hưởng đến an ninh và ổn định xã hội. Những lo ngại này càng trở nên cấp thiết trong bối cảnh cuộc đua phát triển công cụ tạo video AI đang diễn ra quyết liệt.
Thị trường liên tục đón nhận các sản phẩm mới từ những tên tuổi lớn. Có thể kể đến một số cột mốc trong năm 2025 như:
- Tháng 5: TikTok ra mắt AI Alive, công cụ biến ảnh tĩnh thành video.
- Tháng 7: xAI trình làng Grok Imagine, một trình chuyển đổi văn bản thành video.
- Ngày 30/9: OpenAI giới thiệu Sora 2, phiên bản nâng cấp của mô hình tạo video nổi tiếng.
Đánh giá và các vấn đề còn tồn tại
Nhìn lại hành trình ba năm, có thể thấy AI tạo video đã tiến một chặng đường dài từ những sản phẩm thử nghiệm thô sơ đến các video có độ chân thực cao. Theo ghi nhận từ Business Insider và Ars Technica, sự tiến bộ này là rất đáng kể. Tuy nhiên, các vấn đề kỹ thuật vẫn còn tồn tại, ví dụ như lỗi âm thanh bất hợp lý trên mô hình Veo 3 của Google, được cho là có thể xuất phát từ hạn chế của bộ dữ liệu đào tạo.
Hiện tại, thách thức lớn nhất đối với việc phát triển và thử nghiệm các mô hình AI có thể không chỉ nằm ở khía cạnh công nghệ mà còn ở các rào cản pháp lý. Việc Hollywood và các nhà làm luật siết chặt quy định về bản quyền và sử dụng hình ảnh có thể khiến việc dùng chân dung người nổi tiếng cho các bài thử nghiệm trở nên khó khăn hơn trong tương lai.
Sự phát triển của AI trong lĩnh vực tạo sinh video đang ở giai đoạn tăng tốc, mang lại cả cơ hội đột phá lẫn thách thức lớn về quản lý. Diễn biến trong thời gian tới sẽ phụ thuộc nhiều vào khả năng cân bằng giữa đổi mới công nghệ và việc xây dựng các khung pháp lý, đạo đức phù hợp để kiểm soát các rủi ro tiềm ẩn.

