Imagen 3 โมเดล AI น้องใหม่จาก Google ใช้สร้างภาพจากข้อความสุดเจ๋ง

หน้าแรก » AI Marketing » Imagen 3 โมเดล AI น้องใหม่จาก Google ใช้สร้างภาพจากข้อความสุดเจ๋ง

หมวดหมู่: AI Marketing, Marketing AI
October 3, 2024
12:00 pm

ปฏิเสธไม่ได้ว่ายุคนี้คือยุคของ AI อย่างแท้จริง เพราะมีเครื่องมือ AI มากมายทยอยเปิดตัวมาให้สายเทคโนโลยีได้ยลโฉมกัน และล่าสุดกับ ‘Imagen 3’ เครื่องมือ AI น้องใหม่จาก Google ที่รับประกันเรื่องความล้ำหน้า ไม่เหมือนใคร พร้อมเปิดให้ทดลองใช้แล้วเดือนนี้ที่สหรัฐอเมริกา!

>> อ่านเพิ่มเติม: Machine Learning คืออะไร แตกต่างกับ AI แค่ไหน พร้อมสรุปหลักการทำงาน

Imagen 3 คืออะไร?

ที่มา: https://www.zeniteq.com/blog/googles-new-imagen-3-with-midjourney-v6-which-is-better

Imagen 3 คือ เครื่องมือ AI ที่พัฒนาโดย Google เปิดตัวครั้งแรกในงาน Google I/O 2024 มีไว้สำหรับให้ใช้งานบน ImageFX โดย Google ยืนยันประสิทธิภาพของ Imagen 3 เอาไว้ว่า เป็น AI สร้างรูปภาพจากข้อความที่ล้ำหน้าที่สุดเท่าที่เคยมี สามารถสร้างรูปภาพตามคำสั่งได้ภายในระยะเวลาไม่กี่วินาที และยังสามารถออกแบบแสง สี รวมทั้งรายละเอียดต่าง ๆ ของภาพได้อย่างสมจริง

Imagen 3 มีจุดเด่นอย่างไร?

บางท่านอาจคุ้นเคยกับ AI สร้างภาพอย่าง MidJourney หรือแม้แต่การใช้ Gemini และ ChatGPT แต่สำหรับ Imagen 3 ที่ Google พัฒนาขึ้นใหม่ มีคุณสมบัติที่โดดเด่นแตกต่างออกไป ดังนี้

ที่มา: https://deepmind.google/technologies/imagen-3/

เป็น AI ที่สร้างภาพความละเอียดสูงได้

Imagen 3 สร้างภาพที่มีคุณภาพสูงและมีสีสันสวยงาม พร้อมทั้งมีการจัดแสงและองค์ประกอบที่ดี สามารถแสดงรายละเอียดเล็ก ๆ น้อย ๆ ได้อย่างแม่นยำ เช่น รอยย่นเล็ก ๆ บนมือของบุคคล และพื้นผิวที่ซับซ้อน เช่น ตุ๊กตาช้างถัก แบบเห็นดีเทลของไหมพรมที่ใช้ถัก

สร้างข้อความบนภาพได้

ทีมพัฒนา Imagen 3 ปรับปรุงความสามารถในการแสดงข้อความจาก Imagen 2 ให้ดีขึ้นอย่างมาก ซึ่งเปิดโอกาสใหม่ ๆ ให้กับกรณีการใช้งานต่าง ๆ เช่น การ์ดวันเกิดแบบมีสไตล์ งานนำเสนอ และอื่น ๆ อีกมากมาย

ให้ความสำคัญกับนวัตกรรมเรื่องความปลอดภัยของข้อมูล

Imagen 3 ถูกสร้างขึ้นด้วยนวัตกรรมด้านความปลอดภัยและความรับผิดชอบล่าสุดของทีมพัฒนา ตั้งแต่การพัฒนาข้อมูลและแบบจำลองไปจนถึงการผลิต โดยใช้การกรองและการติดฉลากข้อมูลอย่างครอบคลุมเพื่อลดเนื้อหาที่เป็นอันตรายในชุดข้อมูลและลดโอกาสที่ผลลัพธ์จะเป็นอันตราย นอกจากนี้ เรายังดำเนินการประเมินและทำงานเป็นทีมสีแดงในหัวข้อต่างๆ เช่น ความเป็นธรรม อคติ และความปลอดภัยของเนื้อหา

Imagen 3 เหมาะกับใคร?

นักออกแบบกราฟิก: สามารถใช้สร้างภาพต้นแบบ (mockup) หรือไอเดียใหม่ๆ สำหรับงานออกแบบได้อย่างรวดเร็วและมีประสิทธิภาพ
นักวาดภาพประกอบ: ใช้สร้างภาพประกอบสำหรับหนังสือ, วารสาร, หรือสื่อสิ่งพิมพ์อื่นๆ ได้อย่างหลากหลาย
นักสร้างสรรค์คอนเทนต์: ใช้สร้างภาพประกอบสำหรับโพสต์โซเชียลมีเดีย, โฆษณา, หรือวิดีโอได้อย่างสวยงามและน่าสนใจ
นักพัฒนาเกม: ใช้สร้างภาพประกอบตัวละคร, ฉากหลัง, หรือไอเทมต่างๆ ในเกมได้อย่างรวดเร็ว
นักศึกษาและอาจารย์: ใช้ในการเรียนการสอนเกี่ยวกับศิลปะ, การออกแบบ, หรือเทคโนโลยี AI
ผู้ที่สนใจศิลปะ: ใช้สร้างงานศิลปะในรูปแบบต่างๆ ได้อย่างอิสระ ไม่จำเป็นต้องมีความรู้ด้านศิลปะมาก่อน
ผู้ที่ต้องการสร้างภาพสำหรับงานส่วนตัว: เช่น การทำโปสเตอร์, การ์ดอวยพร, หรือภาพประกอบสำหรับงานนำเสนอ

Imagen 3 ต่างกับโมเดลก่อนหน้าอย่าง Imagen 2 อย่างไร?

ที่มา: https://cloud.google.com/blog/products/ai-machine-learning/imagen-2-on-vertex-ai-is-now-generally-available

คุณภาพของภาพ: Imagen 3 สร้างภาพที่มีความละเอียดสูงขึ้น รายละเอียดปลีกย่อยชัดเจนมากขึ้น และมีความสมจริงใกล้เคียงกับภาพถ่ายจริงมากยิ่งขึ้น
ความหลากหลายของสไตล์: Imagen 3 สามารถสร้างภาพได้หลากหลายสไตล์มากขึ้น ไม่ว่าจะเป็นภาพวาดสีน้ำมัน ภาพการ์ตูน หรือภาพถ่ายแนวสตรีท
ความเข้าใจภาษาที่ซับซ้อน: Imagen 3 เข้าใจภาษาที่ใช้ในการบอกคำสั่งได้ดีขึ้น ทำให้สามารถสร้างภาพที่ตรงกับความต้องการของผู้ใช้ได้แม่นยำยิ่งขึ้น
ความสามารถในการสร้างภาพบุคคล: หนึ่งในจุดเด่นของ Imagen 3 คือสามารถสร้างภาพบุคคลได้อย่างสมจริงมากขึ้น โดยมีการปรับปรุงระบบเพื่อป้องกันการสร้างภาพที่ไม่เหมาะสม
การรองรับภาษา: Imagen 3 อาจรองรับภาษาที่หลากหลายมากขึ้นกว่า Imagen 2 ทำให้ผู้ใช้จากทั่วโลกสามารถใช้งานได้สะดวกยิ่งขึ้น

คนไทยสามารถทดลองใช้ Imagen 3 ได้แล้วหรือยัง?

ถึงแม้ว่าตอนนี้ยังไม่มีข้อมูลยืนยันว่าคนไทยสามารถทดลองใช้ Imagen 3 ได้ แต่ก็เป็นเรื่องที่น่าติดตามอย่างยิ่ง แต่คุณสามารถดูข้อมูลเพิ่มเติมและติดตามความเคลื่อนไหวได้ที่ https://deepmind.google/technologies/imagen-3/

สรุป

Imagen 3 ถือเป็นก้าวสำคัญในการพัฒนา AI สร้างภาพ โดยนำเสนอความสามารถที่เหนือกว่ารุ่นก่อนหน้าอย่างเห็นได้ชัด ทำให้การสร้างภาพจากข้อความเป็นเรื่องง่ายและสะดวกมากขึ้น ผู้ที่สนใจสามารถนำไปประยุกต์ใช้ในการสร้างสรรค์งานศิลปะ ออกแบบผลิตภัณฑ์ หรือใช้ในการนำเสนอข้อมูลได้อย่างหลากหลาย

อ้างอิง

Google DeepMind. Imagen 3

Available from: https://deepmind.google/technologies/imagen-3/

Google Research. Imagen

Available from: https://imagen.research.google/