Midjourney v6, thêm một bước tiến mới về công nghệ AI tạo ảnh

-

Trong một năm bị thống trị hoàn toàn bởi sự trỗi dậy của trí tuệ nhân tạo, thật phù hợp khi Midjourney đã quyết định kết thúc năm bằng bản cập nhật có lẽ là tham vọng nhất của họ. Vào ngày 21 tháng 12, Midjourney đã công bố bản phát hành beta của phiên bản mới nhất, v6, trên Discord.Mô hình này đã được đào tạo trong 9 tháng, tuy còn thiếu so sánh benchmark rõ ràng nhưng dựa trên khả năng hiện tại được thể hiện qua các bài kiểm tra của cư dân mạng, có thể gọi đây là mô hình đồ thị Vincentian tiên tiến nhất ở thời điểm hiện tại.

Hãy cùng Ontop.vn xem Midjourney V6 và khám phá những cải tiến mới nhất của nó có thể dự báo cho năm 2024 sắp tới.

Midjourney Version 6

Được phát triển bởi tập thể nghiên cứu Midjourney và được thành lập bởi David Holz, Midjourney đã trở thành một trong những tên tuổi lớn nhất về AI trong năm qua khi AI đã vươn lên dẫn đầu trong hầu hết các tin tức công nghệ. Nhưng phiên bản mới nhất này Midjourney hứa hẹn sẽ “tạo ra hình ảnh chân thực hơn” so với bất kỳ thứ gì họ đã phát hành trước đó, theo một thông báo trên máy chủ Discord của Midjourney từ Holz, người cũng làm rõ rằng phiên bản V6 này là “mô hình thứ ba được đào tạo từ đầu” trên máy chủ của họ. Mô hình này đã được đào tạo trong 9 tháng, tuy còn thiếu so sánh benchmark rõ ràng nhưng dựa trên khả năng hiện tại được thể hiện qua các bài kiểm tra của cư dân mạng, có thể gọi đây là mô hình đồ thị Vincentian tiên tiến nhất ở thời điểm hiện tại.

Hình ảnh khuôn mặt

Midjourney V6 có thể hiểu được các chi tiết nhỏ nếu được hướng dẫn chi tiết, đặc biệt là với các đặc điểm trên khuôn mặt. Hình ảnh bên dưới được tạo ra với các hướng dẫn cụ thể về mắt và ánh sáng.

image 12
Nguồn: X

Thêm văn bản vào hình ảnh

Phiên bản mới nhất cho phép người dùng đặt văn bản tùy chỉnh vào hình ảnh được tạo, cho phép họ tinh chỉnh đầu ra theo yêu cầu chính xác của họ.

image 13
Nguồn: X

Độ chính xác đối với ẩm thực

Tính chi tiết về các lời nhắc liên quan đến ẩm thực và thực phẩm được nâng cao ở phiên bản mới nhất. Nó thậm chí có thể thêm văn bản theo yêu cầu.

image 41.png
Nguồn: X

Tăng cường màu sắc

Bất kể số lượng prompts được cung cấp cho công cụ tạo AI là bao nhiêu, kết quả đầu ra đều gần với mong đợi nhất. Prompt bên dưới tập trung vào nhiều hướng dẫn màu đã được tạo ra một cách chính xác.

image 14
Nguồn: X

Cartoon and Design

Khi so sánh với phiên bản trước, thiết kế được tạo ra bởi Midjourney V6 gần nhất với ngữ cảnh được nhập vào. Trong ví dụ dưới đây, kết quả đầu ra làm nổi bật một logo chi tiết hơn.

Prompts: Thiết kế logo ứng dụng iOS hiện đại hình vuông của trò chơi chiến lược thời gian thực, cậu bé, biểu tượng ứng dụng iOS, giao diện người dùng đơn giản, thiết kế phẳng, nền trắng.

image 15
Nguồn: X

Tiến bộ về Cinematic

Khi được yêu cầu tạo hình ảnh có nền cinematic, mặc dù đầu ra của V5.2 khá tiên tiến nhưng đầu ra của V6 sẽ nâng cao chất lượng cho cảm giác ấn tượng hơn.

Cảm nhận về kiến trúc

Các prompts liên quan đến thiết kế nội thất và kiến trúc được tạo ra một cách chính xác, đảm bảo duy trì màu sắc và chủ đề của các lời nhắc.

Prompts: Một phòng ăn có cửa lớn kiểu Pháp và đồ nội thất bằng gỗ tối màu, trang nhã, được trang trí với tông màu đen trắng tinh xảo, gợi lên phong cách Art Deco cổ điển.

image 16
Nguồn: X

Người nổi tiếng và nhân vật của công chúng

Vì hình ảnh chính xác và gần như hoàn hảo, Midjourney V6 cũng tạo ra các hình ảnh của công chúng và người nổi tiếng, điều này có thể dẫn đến các vấn đề về bản quyền. Mặt khác, các mô hình tạo hình ảnh AI như DALL E.3, không tạo ra người nổi tiếng, logo hay bất kỳ dạng nội dung thương hiệu nào.

Images of Leonardo Dicaprio and Elon Musk created using Midjourney V6

Cách Dùng Midjourney V6

Cũng giống như các phiên bản trước, bạn sẽ cần khởi động trên máy chủ Discord bằng Bot Midjourney. Khi bạn ở đó, chỉ cần nhập “/settings” vào thanh trò chuyện và bạn sẽ được nhắc với danh sách các phiên bản Midjourney mà bạn có thể chuyển đổi. Phiên bản Midjourney mặc định của bạn có thể là V5.2, nhưng bạn có thể chuyển sang V6 trong một thời gian giới hạn. Sau đó, bạn có thể tạo prompts như bình thường chỉ bằng cách nhập “/imagine”, sau đó là bất cứ điều gì bạn.

Một cách khác để truy cập Midjourney V6 là làm theo tất cả prompts của bạn với “—v 6” ở cuối. Mình thấy cách này phức tạp hơn một chút, nhưng nó hoạt động giống nhau.

image 7
Hình ảnh do Midjourney V6 tạo ra về John Lennon chơi violin trên cánh đồng dâu tây
image 10
Hình ảnh do Midjourney V6 tạo ra của Donald Trump và Hillary Clinton trong một cuộc tranh cãi.

Các bạn lưu ý rằng Midjourney V6 yêu cầu bạn đưa ra các prompts khác với các phiên bản trước. V6 hiểu bạn tốt hơn nhiều, vì vậy hãy đưa ra lời nhắc rõ ràng nhất có thể. Nếu bạn muốn điều gì đó thực tế hơn, hãy kết thúc prompts của bạn bằng “—style raw”.

image 11
Hình ảnh do Midjourney tạo ra về Elon Musk bị mắc kẹt trong một cơn mưa ở Tokyo.

Tổng kết

Phiên bản Midjourney V6 đã công bố bản cập nhật đầu tiên nửa giờ sau khi phát hành và tốc độ tạo đã tăng 2,7 lần. Những bức ảnh họ tạo ra rất chân thực đến nỗi Midjourney đã bật nút xoay trên hệ thống kiểm duyệt của mình. Các nhà phát triển cho biết họ sẽ thực thi các tiêu chuẩn cộng đồng của mình một cách chặt chẽ và khắt khe hơn, vì vậy “đừng trở thành kẻ ngốc hoặc tạo ra những hình ảnh gây drama”. Tuy nhiên, những bức ảnh này thuyết phục đến mức khó có thể tưởng tượng chúng sẽ không được sử dụng để đánh lừa.

Bài liên quan