Sora – ứng dụng tạo video của OpenAI “Khủng” cỡ nào?

Sora hoạt động tương tự như công cụ AI tạo hình ảnh DALL-E của OpenAI. Người dùng nhập câu lệnh về hoạt cảnh mong muốn và Sora sẽ trả về một video clip có độ phân giải cao. Sora cũng có thể tạo các video clip lấy cảm hứng từ hình ảnh tĩnh và mở rộng các video hiện có hoặc điền vào các khung hình còn thiếu.

video-sora-5276.jpg
Một hoạt cảnh do Sora tạo ra

Video là chân trời tiếp theo cho AI sáng tạo, sau khi các chatbot và trình tạo hình ảnh đã trở nên phổ biến trong thời gian gần đây. Mặc dù sự sáng tạo này sẽ kích thích những người đam mê AI, nhưng các công nghệ mới như Sora cũng gây ra mối lo ngại nghiêm trọng về nội dung ảo, thông tin giả mạo. Theo dữ liệu từ Clarity, một công ty máy học, số lượng video và hình ảnh deepfake do AI tạo ra đã tăng 900% so với năm trước.

Với Sora, OpenAI đang tìm cách cạnh tranh với các công cụ AI tạo video từ các công ty như Meta và Google. Các công cụ AI tương tự cũng có sẵn từ các công ty khởi nghiệp khác, chẳng hạn như Stability AI, có sản phẩm có tên là Stable Video Diffusion. Amazon cũng đã phát hành “Create with Alexa”, một mô hình chuyên tạo nội dung hoạt hình dạng ngắn dành cho trẻ em dựa trên câu lệnh (prompt).

Video do Sora tạo ra chân thực như thế nào?

Mặc dù Sora chưa được phát hành rộng rãi mà mới chỉ được lưu hành trong một nhóm những người thử nghiệm an toàn, hay còn gọi là “đội đỏ”, nhưng những video mà OpenAI đưa ra khiến người xem phải kinh ngạc về mức độ chân thực cũng như sức mạnh của phần mềm tạo video.

OpenAI cho biết họ vẫn đang tiến hành cải thiện thuật toán của Sora để các video tạo ra có tính chân thực hơn nữa.

Một số video OpenAI demo tính năng tạo phim Sora

 

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

Tạm dịch: Một người phụ nữ sành điệu đi bộ trên một con phố Tokyo đầy đèn neon phát sáng ấm áp và biển báo thành phố hoạt hình. Cô ấy mặc một chiếc áo khoác da màu đen, một chiếc váy dài màu đỏ, và đôi bốt màu đen, và mang theo một chiếc ví màu đen. Cô ấy đeo kính râm và son môi đỏ. Cô ấy bước đi một cách tự tin và tình cờ. Đường phố ẩm ướt và phản chiếu, tạo hiệu ứng gương của những ánh đèn đầy màu sắc. Nhiều người đi bộ đi bộ.

 

Prompt: The camera directly faces colorful buildings in burano italy. An adorable dalmation looks through a window on a building on the ground floor. Many people are walking and cycling along the canal streets in front of the buildings.

Tạm dịch: Máy ảnh trực tiếp đối mặt với các tòa nhà đầy màu sắc ở burano italy. Một dalmation đáng yêu nhìn qua cửa sổ trên một tòa nhà ở tầng trệt. Nhiều người đang đi bộ và đạp xe dọc theo những con đường kênh phía trước các tòa nhà.

 

Prompt: The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.

Tạm dịch: Máy ảnh theo sau một chiếc SUV cổ điển màu trắng với giá nóc màu đen khi nó tăng tốc một con đường đất dốc được bao quanh bởi những cây thông trên một sườn núi dốc, bụi bốc lên từ lốp xe của nó, ánh sáng mặt trời chiếu vào chiếc SUV khi nó tăng tốc dọc theo con đường đất, tạo ra một ánh sáng ấm áp trên khung cảnh. Con đường đất uốn cong nhẹ nhàng vào khoảng cách, không có ô tô hoặc phương tiện nào khác trong tầm nhìn. Những cái cây ở hai bên đường là những cây gỗ đỏ, với những mảng cây xanh rải rác khắp nơi. Chiếc xe được nhìn từ phía sau theo đường cong một cách dễ dàng, khiến nó có vẻ như đang lái xe hiểm trở qua địa hình gồ ghề. Bản thân con đường đất được bao quanh bởi những ngọn đồi và núi dốc, với bầu trời trong xanh phía trên với những đám mây mỏng.

 

Prompt: Historical footage of California during the gold rush.

Tạm dịch: Cảnh quay lịch sử của California trong cơn sốt vàng.

Cái này là tạo video từ chữ, không phải deepfake – tức là dùng hình ảnh, video người có sẵn để đổi thành người khác nhé. Mà chắc là nó cũng có khả năng đó, tùy người ứng dụng.

Các bạn có thể tìm hiểu thêm ở: https://openai.com/sora. Chúc các bạn tạo nên những thước phim đẹp mắt như ý nhé.