Midjourney ra mắt mô hình AI tạo video V1

Sau một thời gian dài nổi danh với các mô hình AI tạo ảnh có tính nghệ thuật cao, Midjourney chính thức công bố bước ngoặt mới: V1 – công cụ tạo video từ hình ảnh đầu tiên của hãng. Sự kiện này không chỉ đưa hãng vào cuộc chơi cạnh tranh cùng OpenAI, Google, Adobe và Runway mà còn đánh dấu tham vọng lớn hơn: xây dựng nền tảng mô phỏng thời gian thực bằng trí tuệ nhân tạo.

V1 là gì?

Midjourney V1 là mô hình chuyển đổi hình ảnh thành video (image-to-video). Người dùng có thể tải lên một bức ảnh (từ bất kỳ nguồn nào hoặc do chính ứng dụng tạo ra) và nhận lại bốn đoạn video ngắn, mỗi đoạn dài 5 giây, mô phỏng chuyển động và bối cảnh từ ảnh gốc.

Tổng thời lượng có thể mở rộng lên tối đa 21 giây, nếu người dùng chọn tính năng extend.

Những điểm nổi bật của V1

Truy cập qua Discord: V1 chỉ khả dụng trên nền tảng Discord tương tự như cách ứng dụng này vận hành từ đầu.

Tùy chỉnh chuyển động:

  • Auto Mode: tạo hiệu ứng chuyển động tự động, nghệ thuật.
  • Manual Mode: người dùng mô tả cụ thể chuyển động mong muốn bằng văn bản.

Điều khiển động học:

  • Low Motion: chuyển động nhẹ nhàng, tinh tế.
  • High Motion: chuyển động phức tạp, camera chuyển hướng nhiều.

Chất lượng hình ảnh đặc trưng: Vẫn giữ phong cách hình ảnh siêu thực, bay bổng, mang đậm chất nghệ thuật, không chạy đua theo hướng siêu thực như Sora (OpenAI) hay Gen-4 (Runway).

Mức giá và các gói sử dụng

Midjourney áp dụng mức phí cao hơn 8 lần cho video so với ảnh tĩnh. Điều này có nghĩa người dùng sẽ tiêu tốn nhanh hơn số lượt tạo nội dung hàng tháng nếu chuyển sang video.

Gói Giá Video generation
Basic $10/tháng Giới hạn video, chạy nhanh
Pro $60/tháng Tạo video không giới hạn ở chế độ “Relax”
Mega $120/tháng Ưu tiên cao nhất, không giới hạn video

Ứng dụng này đang dự kiến xem xét lại cấu trúc giá cho video trong tháng tới, dựa trên lượng người dùng và chi phí hạ tầng.

Cạnh tranh trực tiếp với Sora, Veo và Firefly

Ra mắt trong bối cảnh thị trường AI video đang nóng hơn bao giờ hết, V1 chính thức bước vào đường đua cùng các ông lớn:

  • Sora (OpenAI): mạnh về chuyển động vật lý thực tế, ánh sáng và logic cảnh vật
  • Runway Gen-4: chuyên nghiệp cho dựng video thương mại
  • Adobe Firefly: tích hợp sâu trong hệ sinh thái Premiere – After Effects
  • Google Veo 3: xử lý video theo prompt kết hợp ảnh và nhạc

Tuy nhiên, ứng dụng giữ vững định vị là công cụ dành cho nghệ sĩ sáng tạo, hơn là nhà làm phim chuyên nghiệp.

Tham vọng xa hơn

Trong blog giới thiệu sản phẩm, CEO David Holz khẳng định V1 chỉ là bước đầu. Đơn vị vận hành đã đặt mục tiêu phát triển:

  • Mô hình dựng hình 3D bằng AI
  • Hệ thống mô phỏng thời gian thực quy mô lớn – giống như thế giới game open-world nhưng do AI dựng nên.

Đây là định hướng dài hạn để biến ứng dụng thành một nền tảng trải nghiệm tương tác trực quan, thay vì chỉ là nơi tạo ra hình ảnh đơn lẻ.

Rắc rối pháp lý đang chờ đón

Midjourney ra mắt mô hình AI tạo video V1
Midjourney ra mắt mô hình AI tạo video V1

Chỉ một tuần trước khi ra mắt V1, công cụ này đã bị Disney và Universal đồng thời khởi kiện vì cho rằng ứng dụng đã tạo ra hình ảnh có nét giống các nhân vật có bản quyền như Homer Simpson, Darth Vader…

Vụ việc làm dấy lên mối lo ngại về việc AI học từ kho dữ liệu vi phạm bản quyền, một chủ đề đang khiến Hollywood và các nhà sáng tạo nội dung thực sự lo lắng.

Có nên dùng V1 ngay lúc này?

Nên thử nếu bạn là:

  • Nghệ sĩ số, nhà làm phim indie, nhà thiết kế ý tưởng
  • Người đang cần demo nhanh ý tưởng video nhưng không biết dựng phim
  • Tìm kiếm trải nghiệm tạo chuyển động từ ảnh có chiều sâu nghệ thuật

Cân nhắc nếu bạn là:

  • Doanh nghiệp cần dựng video thực tế, logic cao, nhiều lớp hành động
  • Muốn dựng clip dài hơn 30 giây hoặc cần kịch bản phức tạp

Là người thường xuyên đào tạo và ứng dụng AI trong sáng tạo nội dung, tôi đánh giá sự ra mắt của V1 đánh dấu bước chuyển mình có định hướng của ứng dụng. Công ty không còn đơn thuần là một nền tảng tạo ảnh nghệ thuật, mà đang hướng tới mô hình đa phương tiện từ ảnh sang chuyển động, từ ý tưởng sang mô phỏng thực tại.

Tuy nhiên, về mặt chi phí, tôi phải nói thẳng rằng: Với mức giá hiện tại (từ 10 USD/tháng cho gói cơ bản, nhưng video tốn gấp 8 lần ảnh), Midjourney V1 vẫn khá khó tiếp cận với người dùng phổ thông đặc biệt là những ai chỉ muốn dùng thử hoặc thử nghiệm ý tưởng nhanh.

Trong khi các đối thủ như Runway, Pika hay Google Veo (khi ra mắt công khai) có xu hướng miễn phí giới hạn tính năng video, thì công cụ này lại buộc người dùng trả phí ngay từ bước đầu tiên và đốt token nhanh hơn nhiều so với ảnh.

Đây có thể là chiến lược để giữ chất lượng cộng đồng và tối ưu hạ tầng, nhưng vô hình trung cản trở nhóm người dùng sáng tạo nhỏ lẻ, sinh viên ngành thiết kế, hoặc những người làm cá nhân chưa sẵn sàng đầu tư ngân sách hàng chục đô mỗi tháng. Nói cách khác phần mềm này mạnh, đẹp, khác biệt nhưng vẫn là cuộc chơi dành cho ai chấp nhận bỏ tiền nghiêm túc để theo đuổi lâu dài.

Dù sao đi nữa cũng không thể phủ nhận rằng, sự ra đời của V1 là dấu hiệu rõ ràng công ty chủ quản đang mở rộng tầm nhìn không còn chỉ là công cụ tạo ảnh, mà đang bước vào giai đoạn mới: tạo chuyển động, mô phỏng không gian, xây dựng thế giới.

TÌM KIẾM KIẾN THỨC HOẶC KHÓA HỌC