Tạo sự ổn định nhất quán hình ảnh các tuyến nhân vật với ChatGPT4 và Dall-E 3

Bùi Thế Hiển
Admin October 30, 2023

Như các bạn đã biết, mỗi lần chúng ta tạo ảnh với Dall E thì có thể sẽ có các kết quả mặt người là khác nhau, nhưng vậy nếu chúng ta muốn tạo nhiều bức ảnh khác nhau với cùng một nhân vật thì mặc định sẽ không được. Vì vậy bài viết này sẽ chia sẻ với các bạn về cách tạo nhân vật xuyên suốt quá trình tạo ảnh. Bài viết tham khảo nội dung của Tony Duc AI. 

Xây dựng chân dung 1 nhân vật và setup luồng thông tin cho 1 nhân vật

Bước 1: Giả định cần tạo 1 nhân vật nữ, mái tóc xoăn gợn sóng được búi cao,

  • Đầu tiên cần đặt tên cho nhân vật đó, ví dụ là TonyDucAI, đó sẽ là mỏ nèo để sau giúp chúng ta cố định nhân vật 1 phần.
  • Đồng thời chúng ta sẽ tạo 1 Prompt nền tảng, bổ sung 1 đoạn văn bản: "Trong luồng này luôn gán một mã định danh duy nhất cho mỗi hình ảnh. hiển thị nó bên dưới hình ảnh. sử dụng định dạng như X theo sau là số dưới dạng chuỗi "  ở  cuối Prompt nền tảng với mục đích sau linh động sự dụng ảnh nào thay đổi các biến số như Seed hạt giống bên Midjourney ( Cái này Dall E vừa có những ko cần thiết lắm, dùng X này được rồi )

Khởi tạo 1 đoạn chat với Dall E 3  với Prompt nền tảng như sau: 

 Bây h chúng ta sẽ xây dựng 1 tuyến nhân vật ổn định trong line chat này 
bạn có thể điều chỉnh lại lời nhắc theo cách sau:
Cấu trúc lời nhắc là: [Dấu nhắc cơ bản] + [chi tiết bổ sung / thông tin biến thể]
Lời nhắc cơ bản: "Minh họa semi-realistic 3d engine  chân dung của một phụ nữ châu Á 20 tuổi tên TonyDucAI với mái tóc xoăn gợn sóng được búi cao, mặc áo phông màu xanh lá cây"
Nếu tôi nói yêu cầu TonyDucAI làm điều gì đó thì lời nhắc cơ bản sẽ ở trên lời nhắc mà tôi đã cung cấp.
Nếu tôi nói bây giờ hãy bắt TonyDucAI làm điều gì đó, lời nhắc cơ bản sẽ là trạng thái Hy vọng hiện tại với mã định danh cuối cùng.
Đối với bất kỳ chi tiết hoặc biến thể bổ sung nào không liên quan đến tóc, hãy thêm chúng vào danh mục "chi tiết bổ sung/thông tin biến thể" rồi thêm mã nhận dạng ở cuối.
Ví dụ 1: Thay đổi kiểu tóc
Nếu tôi yêu cầu làm cho tóc chảy dài, bạn có thể thay đổi lời nhắc thành:
"Minh họa semi-realistic 3d engine  chân dung của một phụ nữ châu Á 20 tuổi tên TonyDucAI với mái tóc xoăn gợn sóng được búi cao, mặc áo phông màu xanh lá cây 
Ví dụ 2: Cà phê
Nếu tôi yêu cầu TonyDucAI uống cà phê thì bạn có thể thay đổi lời nhắc thành:
"Minh họa semi-realistic 3d engine  chân dung của một phụ nữ châu Á 20 tuổi tên TonyDucAI với mái tóc xoăn gợn sóng được búi cao, mặc áo phông màu xanh lá cây và uống cà phê"
Cách tiếp cận này giữ nguyên Lời nhắc cơ sở trong khi cho phép các biến thể cụ thể nếu cần. Mã nhận dạng ở cuối có thể giúp theo dõi các biến thể. 
Trong luồng này, tôi cần bạn làm theo tất cả các hướng dẫn này một cách hoàn hảo.  Trong  luồng này luôn luôn gán một mã định danh duy nhất cho mỗi hình ảnh. hiển thị nó bên dưới hình ảnh. sử dụng định dạng như X theo sau là số dưới dạng chuỗi. Trong luồng này luôn gán một mã định danh duy nhất cho mỗi hình ảnh. hiển thị nó bên dưới hình ảnh. sử dụng định dạng như X theo sau là số dưới dạng chuỗi.  Trà lời bằng tiếng việt 

 

Bước 2 : Yêu cầu chọn 1 ảnh làm anh mặc đinh nhắc : 

Trong luồng chat này, chúng ta sẽ chọn tạo hình X2 LÀ TẠO HÌNH MẶC ĐỊNH, HÃY NHỚ KỸ ĐIỀU ĐÓ  cho tất cả các hình ảnh về sau. Bạn hiểu rõ ràng rồi chứ?

Bước 3: Bây giờ tôi sẽ gõ các yêu cầu tương đối đơn giản thể hiện nhân vật này trong cách cảm xúc, hành động khác nhau với tư thế chân dung mặc định như bên dưới mà không cần yêu cầu quá rõ ràng nữa do đã có néo yêu cầu phía trên Prompt nền tảng. 
Ví dụ:
TonyDucAi đang uống cafe starbuck 
TonyDucAI đang đặt tên lên môi, ra ý giữa im lặng, ánh mắt tinh nghịch
TonyDucAI đang cảm thấy giẫn dỗi cáu gắt bực mình  
TonyDucAI mặc áo hoodie trắng đeo ba lô đỏ , đeo kính
Trên đây là phần cơ bản giúp chúng ta định hình được nhân vật ổn định với nhiều góc máy, cảm xúc..vv khác nhau

Bước 4. Có thể yêu cầu Dall E gen 1 charactersheet để dùng làm ảnh nhắc cho toàn thể luồng chat. 

Xây dựng hình ảnh hoàn thiện nhân vật trong các bối cảnh mở với môi trường/ hành động khác nhau.

Bước 1:  Chúng ta sẽ tạo thêm 1 prompt nhắc lại cho những ảnh sắp tới. ChatGPT có bộ nhớ hạn chế, do đó hãy thường xuyên nhắc lại các yêu cầu tổng thể , ko quên các nhắc nhở nhỏ khi nhân kết quả không như ý: 

Được rồi tôi có một số hướng dẫn cho bạn:
bạn có thể điều chỉnh lại lời nhắc theo cách sau:
Cấu trúc lời nhắc là: [Dấu nhắc cơ bản] + [chi tiết bổ sung / thông tin biến thể]
Lời nhắc cơ bản: "Minh họa semi-realistic 3d engine  chân dung của một phụ nữ châu Á 20 tuổi tên TonyDucAI với mái tóc xoăn gợn sóng được búi cao, mặc áo phông màu xanh lá cây"
Nếu tôi nói hãy bắt TonyDucAI làm điều gì đó thì lời nhắc cơ bản sẽ ở trên lời nhắc mà tôi đã cung cấp.
Nếu tôi nói bây giờ hãy bắt TonyDucAI làm điều gì đó, dấu nhắc cơ sở sẽ là trạng thái hiện tại của TonyDucAI với mã định danh cuối cùng.
Đối với bất kỳ chi tiết hoặc biến thể bổ sung nào không liên quan đến tóc, hãy thêm chúng vào danh mục "chi tiết bổ sung/thông tin biến thể" 
Ví dụ 1: Đạp xe đạp trên  đường quê Ninh Binh 
Nếu tôi yêu cầu làm cho tóc chảy dài, bạn có thể thay đổi lời nhắc thành:
"Minh họa semi-realistic 3d engine  chân dung của một phụ nữ châu Á 20 tuổi tên TonyDucAI với mái tóc xoăn gợn sóng được búi cao, mặc áo phông màu xanh lá cây đang  Đạp xe đạp trên  đường quê Ninh Binh"
Ví dụ 2: Chụp ảnh selfie tại Sapa 
Nếu tôi yêu cầu TonyDucAI chụp ảnh selfie tại Sapa  thì bạn có thể thay đổi lời nhắc thành:
"Minh họa semi-realistic 3d engine  chân dung của một phụ nữ châu Á 20 tuổi tên TonyDucAI với mái tóc xoăn gợn sóng được búi cao, mặc áo phông màu xanh lá cây Chụp ảnh selfie tại Sapa "
Cách tiếp cận này giữ nguyên Lời nhắc cơ sở trong khi cho phép các biến thể cụ thể nếu cần. Mã nhận dạng ở cuối có thể giúp theo dõi các biến thể. Đồng thời hãy bổ sung cả thông tin về mã nhận dạng khi trả kết quả . Nhớ là vẫn lấy hình ảnh X9 làm gốc. 
Bạn có rõ ràng với điều này?

Bước 2: Yêu cầu ChatGPT tạo các hình theo yêu cầu với cú pháp đơn giản : 
TonyDucAI + HÀNH ĐỘNG + BIỂU CẢM + MÔI TRƯỜNG + MÔ TẢ CHI TIẾT 
 

Ví dụ : 
- TonyDucAI đi uống cafe, lơ đãng nhìn của sổ ngoài trời mưa rơi, lãng  mạn , góc nhìn từ sau vai qua 
- TonyDucAI đang ngồi ở ban công của quán Starbucks, ngắm nhìn tòa nhà Landmark 81 ở thành phố Sài Gòn. 
-TonyDucAI  đi leo núi Sapa, hôm nay TonyDucAI  mặc hoodie Xanh nhạt , đeo túi chéo thời trang, đi giày Balenciaga , tạo dạng năng động với phía sau là ruộng bậc thang và mây trời đẹp 
Hãy hình dung chính xác bối cảnh, chủ thể, môi trường và mô tả nó cụ thể để hình ảnh đầu ra như ý bạn nhé. Trong quá trình gen, không phải hình nào cũng đạt kết quả yêu cầu ngay: 
- Thứ nhất la hãy gen lại 2-3 lần. 
- Thứ 2 là nhắc nhờ ChatGPT về các sai lệch ko mong muốn và yêu cầu bám sát yêu cầu chung từ đầu. Ví dụ như 1 số hình trên tóc sẽ không giống i chang , nhưng mình vẫn thấy vẫn ok thi ko cần nhắc, còn nếu tóc xoăn thành tóc thẳng và khuôn mặt ko đồng nhất thi nhắc nhở ChatGPT lại . 
- Thứ 3 là chúng ta có thể chủ động set ảnh mặc định nhắc một cách tùy biến, ví dụ mình đang muốn gen hình mặc hoodie trắng ba lô đỏ, mình yêu cầu lấy ảnh gần nhất đẹp làm ảnh gốc ( ví dụ X15 cho những ảnh tiếp theo. Sau đó ko muốn nữa, mình sẽ  lại copy paste lại đoạn Prompt nền tảng dài ban đầu, yêu cầu nó X9 là hình ảnh nhắc gốc. 

Cre: Tony Duc AI