Trang chủ Ý tưởng sáng tạo toàn cầu 24h Top Ý Tưởng Sáng Tạo Thế Giới Năm 2023 - AI chuyển...

Top Ý Tưởng Sáng Tạo Thế Giới Năm 2023 – AI chuyển văn bản thành video trong vài giây

Runway cho ra mắt công cụ AI có khả năng biến các mô tả văn bản đơn giản thành một đoạn video ngắn.

Ngày 20/3, Runway, công ty AI có trụ sở tại New York, giới thiệu công cụ Gen-2, cho phép tạo video từ ảnh tĩnh hoặc văn bản đầu vào. Chẳng hạn, khi nhập “một con mèo đi dưới mưa”, AI sẽ đưa ra một video ba giây với nội dung như yêu cầu.

Đoạn video được AI tạo từ mô tả “một người đi bộ băng qua rừng rậm”. Ảnh: Runway

Runway ra đời năm 2018, là startup nổi tiếng về AI không kém OpenAI và có 45 nhân viên toàn thời gian. Công ty đang cung cấp website hỗ trợ người dùng chỉnh sửa video nhanh, như xóa phông hay thêm hiệu ứng. Họ nằm trong nhóm phát triển phiên bản đầu của Stable Diffusion – AI chuyển văn bản thành ảnh và sau này được công ty Stability AI mở rộng thêm.

Tháng 2/2019, Runway công bố mô hình chỉnh sửa video có tên Gen-1. Công cụ này tập trung vào chuyển đổi cảnh quay video có sẵn, nhập hoạt cảnh 3D thô hoặc thêm bộ lọc do AI tạo. Gen-2 vẫn dựa trên kiến trúc của Gen-1, nhưng tập trung nhiều hơn vào việc khởi tạo video bằng văn bản, ảnh đầu vào hoặc kết hợp cả hai.

Bản demo được Cris Valenzuela, nhà đồng sáng lập kiêm CEO Runway, trình diễn trên Twitter cho thấy Gen-2 có thể tạo được cảnh quay “drone trên bầu trời sa mạc” hay “cận cảnh mắt của con người” trong vài giây. Tuy nhiên, độ phân giải và tính chân thực vẫn bị hạn chế, cũng như chưa có âm thanh.

“Bạn có thể tạo video về cuộc rượt đuổi gay cấn bằng ôtô, nhưng đôi khi, những chiếc ôtô có thể bay đi”, Valenzuela nói về Gen-2.

Video được Gen-2 tạo từ mô tả “cảnh núi non nhìn từ trên không”.

“Hoàng hôn qua cửa sổ trong một căn hộ ở New York”. Video: Runway

Valenzuela khẳng định nếu yêu cầu đầu vào càng chi tiết, nội dung được Gen-2 tạo ra càng sống động, tương tự AI tạo ảnh từ văn bản như Dall-E hay Stable Diffusion. Trong tương lai, công cụ sẽ được cải tiến để giúp nghệ sĩ, nhà thiết kế và nhà làm phim biến các ý tưởng thành video nhanh hơn với chi phí thấp.

Giáo sư Hany Farid tại Đại học California đánh giá video do Gen-2 tạo ra “siêu tuyệt vời”. Ông dự đoán video chất lượng cao hơn từ công nghệ này chỉ là vấn đề thời gian.

Tuy nhiên, ông lo ngại Gen-2 có thể trở thành công nghệ dễ bị lạm dụng và có thể nguy hiểm hơn cả deepfake. Chẳng hạn, kẻ xấu có thể cho ra đời video giả mạo để lan truyền tin giả, lừa đảo…

Theo The Verge, Runway đang mở ra cuộc đua mới cho mô hình AI tổng quát, nơi khả năng sáng tạo không giới hạn, bất kể nội dung là văn bản, hình ảnh hay video. Dù vậy, trang công nghệ này cũng lo ngại chúng sẽ bị lợi dụng trong các nội dung tinh vi khiến người dùng tin tưởng lập tức, bất kể đúng hay sai.

Gen-2 hiện bị hạn chế quyền truy cập, người dùng cần đăng ký và chờ đợi. Theo người phát ngôn Kelsey Rondenet của Runway, người dùng sẽ được cấp quyền truy cập rộng rãi trong những tuần tới.

Theo VN Express

CÁC TIN KHÁC

Máy ảnh nhanh nhất thế giới, chụp 156.000 tỉ khung hình mỗi giây

Với tốc độ 156.000 tỉ khung hình mỗi giây, máy ảnh mở ra khả năng ghi lại những hiện tượng xảy ra cực nhanh mà trước nay không nhìn thấy được.

Keo tản nhiệt mới cho CPU có mùi thơm như “hoa từ thiên đường”

Mặc dù trên thị trường có nhiều lựa chọn keo tản nhiệt khác nhau, CWTP vẫn nổi bật với các sản phẩm có mùi thơm độc đáo

Phát triển lá gan mới trong cơ thể người từ túi tế bào

Các nhà khoa học tiêm tế bào gan để biến một trong các hạch bạch huyết trong cơ thể người thành lá gan thứ hai.

Sử dụng nước thải để giảm khí thải carbon

Trong một nhà máy ở ngoại ô Vienna, các đường ống sáng bóng dẫn nước thải đã xử lý qua 3 máy bơm nhiệt khổng lồ bơm nước nóng cung cấp cho hàng chục ngàn hộ gia đình. Đây là một phần trong nỗ lực của Chính phủ Áo nhằm giảm lượng khí thải carbon và sự phụ thuộc vào khí đốt của Nga.

Chiếc kính mắt có thể chuyển từ kính râm thành kính đọc sách chỉ bằng cái vuốt nhẹ

Công ty Deep Optics mới đây đã chế tạo 32 Degrees North - loại kính thích ứng cải tiến, vừa hoạt động như kính một chiếc kính râm nhưng cũng có thể biến thành kính đọc.

Chó AI dẫn đường hỗ trợ 17 triệu người khiếm thị ở Trung Quốc

Nghiên cứu mới gợi ý rằng, công trình chó dẫn đường AI ở Trung Quốc có thể sớm trở thành hiện thực.

Bài viết nổi bật

Đại học Sư phạm TP.HCM ‘bắt tay’ doanh nghiệp công nghệ Việt thúc đẩy chuyển đổi số

Theo hợp tác mới ký kết với Viettel Solutions, Đại học Sư phạm TP.HCM sẽ cùng doanh nghiệp này xây dựng các giải pháp công nghệ trong giáo dục tập trung vào 4 nội dung chính.

Nhóm sinh viên trường ĐH Ngoại thương giành giải ‘Olympic Kinh tế lượng và ứng dụng’

Ngày 12/6, tại Học viện Tài chính diễn ra Chung khảo Hội thi khoa học sinh viên toàn quốc 'Olympic Kinh tế lượng và ứng dụng' lần thứ VII, năm 2022. Ban Giám khảo đã chọn ra nhóm sinh viên ĐH Ngoại thương TP. Hồ Chí Minh giành giải Đặc biệt.

Bài viết mới nhất

Nghiên cứu cho thấy AI giúp con người cảm thấy được lắng nghe

Một nghiên cứu mới được công bố trong Kỷ yếu của Viện Hàn lâm Khoa học Quốc gia Mỹ đã phát hiện rằng tin nhắn do trí tuệ nhân tạo (AI) phản hồi mang lại cảm giác được lắng nghe nhiều hơn tin nhắn do một người có khả năng giao tiếp non nớt.

TOP 100 Hồng bảo Kỷ lục Thế giới tại Việt Nam (P.48) Làng cổ Phước Tích (Thừa Thiên Huế): Di sản trăm năm bên dòng Ô Lâu – [VIETKINGS-TOPPLUS đề cử]

(kyluc.vn) Với vẻ hiền hòa, yên bình được bồi đắp hơn 500 năm nay từ dòng sông Ô Lâu huyền thoại bốn mùa trong xanh, bao bọc lấy ngôi làng, Phước Tích như một bức tranh quê đặc trưng không chỉ ở dáng dấp bên ngoài với cây đa, bến nước, sân đình… mà còn ở những trầm tích di sản và nét văn hóa mà những con người ở Phước Tích xây dựng và bồi đắp nên qua bao thế hệ.

Meta tung ra trợ lý AI cải tiến, cạnh tranh vị trí dẫn đầu với OpenAI

Meta Platforms vừa phát hành các phiên bản của mô hình ngôn ngữ lớn (LLM) mới nhất mang tên Llama 3, cùng với một trình tạo hình ảnh có khả năng cập nhật hình ảnh theo thời gian thực dựa trên các yêu cầu bằng văn bản của người dùng. Đây được xem là một bước đi của Meta nhằm bắt kịp OpenAI, công ty dẫn đầu thị trường Trí tuệ nhân tạo (AI) tạo sinh.

[WOWTIMES – VIETKINGS] (1922-2024) Khách sạn Dalat Palace – Châu Âu cổ kính giữa lòng phố núi – Top 100 đơn vị trên 100 tuổi còn hoạt động tại Việt Nam 2024 – P.6

(nienlich.vn) Khách sạn Dalat Palace là một trong những công trình điển hình cho di sản kiến trúc Pháp ở xứ sở sương mù Đà Lạt. Không những thế, công trình này còn là chứng tích đánh dấu sự hình thành và phát triển của cao nguyên Lâm Viên, là địa chỉ đỏ gắn với sự ra đời của Chi bộ Đảng Cộng sản đầu tiên của tỉnh này.

Quần thể di tích hồ Gươm – đền Ngọc Sơn (Hà Nội) – TOP 10 khu di tích có giá trị lịch sử của Việt Nam được nhiều người biết đến (P.2) – [VIETKINGS-TOPPLUS – Hành trình TOP Việt Nam]

(kyluc.vn) Với người dân Hà Nội, Hồ Gươm, đền Ngọc Sơn là niềm tự hào. Còn với người dân ở các tỉnh, thành phố khác thì từ lâu hình ảnh Hồ Gươm và đền Ngọc Sơn đã gần như trở thành 1 biểu tượng của Hà Nội. Không những thế đây còn là một điểm đến chứa đựng nhiều giá trị văn hóa, lịch sử của thủ đô, là nơi mà bất kỳ du khách nào cũng phải ghé thăm khi đến với Hà Nội. Di tích lịch sử và danh lam thắng cảnh hồ Hoàn Kiếm và đền Ngọc Sơn bao gồm hồ Hoàn Kiếm, đền Ngọc Sơn và khu tưởng niệm vua Lê.

Khởi động Giải thưởng Sáng tạo Nội dung Số Việt Nam 2024 với nhiều điểm mới

Giải thưởng Sáng tạo Nội dung Số Việt Nam 2024 (VCA 2024) bên cạnh 7 hạng mục giải thưởng đã được công bố từ VCA 2023, năm 2024 Ban tổ chức đã bổ sung thêm hạng mục thứ 8.