|

Imagen 3 โมเดล AI น้องใหม่จาก Google ใช้สร้างภาพจากข้อความสุดเจ๋ง

ปฏิเสธไม่ได้ว่ายุคนี้คือยุคของ AI อย่างแท้จริง เพราะมีเครื่องมือ AI มากมายทยอยเปิดตัวมาให้สายเทคโนโลยีได้ยลโฉมกัน และล่าสุดกับ ‘Imagen 3’ เครื่องมือ AI น้องใหม่จาก Google ที่รับประกันเรื่องความล้ำหน้า ไม่เหมือนใคร พร้อมเปิดให้ทดลองใช้แล้วเดือนนี้ที่สหรัฐอเมริกา!

>> อ่านเพิ่มเติม: Machine Learning คืออะไร แตกต่างกับ AI แค่ไหน พร้อมสรุปหลักการทำงาน

Imagen 3 คืออะไร?

Imagen 3

ที่มา: https://www.zeniteq.com/blog/googles-new-imagen-3-with-midjourney-v6-which-is-better

Imagen 3 คือ เครื่องมือ AI ที่พัฒนาโดย Google เปิดตัวครั้งแรกในงาน Google I/O 2024 มีไว้สำหรับให้ใช้งานบน ImageFX โดย Google ยืนยันประสิทธิภาพของ Imagen 3 เอาไว้ว่า เป็น AI สร้างรูปภาพจากข้อความที่ล้ำหน้าที่สุดเท่าที่เคยมี สามารถสร้างรูปภาพตามคำสั่งได้ภายในระยะเวลาไม่กี่วินาที และยังสามารถออกแบบแสง สี รวมทั้งรายละเอียดต่าง ๆ ของภาพได้อย่างสมจริง

 

Imagen 3 มีจุดเด่นอย่างไร?

บางท่านอาจคุ้นเคยกับ AI สร้างภาพอย่าง MidJourney หรือแม้แต่การใช้ Gemini และ ChatGPT แต่สำหรับ Imagen 3 ที่ Google พัฒนาขึ้นใหม่ มีคุณสมบัติที่โดดเด่นแตกต่างออกไป ดังนี้

Imagen 3 Pictures

ที่มา: https://deepmind.google/technologies/imagen-3/

เป็น AI ที่สร้างภาพความละเอียดสูงได้

Imagen 3 สร้างภาพที่มีคุณภาพสูงและมีสีสันสวยงาม พร้อมทั้งมีการจัดแสงและองค์ประกอบที่ดี สามารถแสดงรายละเอียดเล็ก ๆ น้อย ๆ ได้อย่างแม่นยำ เช่น รอยย่นเล็ก ๆ บนมือของบุคคล และพื้นผิวที่ซับซ้อน เช่น ตุ๊กตาช้างถัก แบบเห็นดีเทลของไหมพรมที่ใช้ถัก

สร้างข้อความบนภาพได้

ทีมพัฒนา Imagen 3 ปรับปรุงความสามารถในการแสดงข้อความจาก Imagen 2 ให้ดีขึ้นอย่างมาก ซึ่งเปิดโอกาสใหม่ ๆ ให้กับกรณีการใช้งานต่าง ๆ เช่น การ์ดวันเกิดแบบมีสไตล์ งานนำเสนอ และอื่น ๆ อีกมากมาย

ให้ความสำคัญกับนวัตกรรมเรื่องความปลอดภัยของข้อมูล

Imagen 3 ถูกสร้างขึ้นด้วยนวัตกรรมด้านความปลอดภัยและความรับผิดชอบล่าสุดของทีมพัฒนา ตั้งแต่การพัฒนาข้อมูลและแบบจำลองไปจนถึงการผลิต โดยใช้การกรองและการติดฉลากข้อมูลอย่างครอบคลุมเพื่อลดเนื้อหาที่เป็นอันตรายในชุดข้อมูลและลดโอกาสที่ผลลัพธ์จะเป็นอันตราย นอกจากนี้ เรายังดำเนินการประเมินและทำงานเป็นทีมสีแดงในหัวข้อต่างๆ เช่น ความเป็นธรรม อคติ และความปลอดภัยของเนื้อหา

Imagen 3 เหมาะกับใคร?

  • นักออกแบบกราฟิก: สามารถใช้สร้างภาพต้นแบบ (mockup) หรือไอเดียใหม่ๆ สำหรับงานออกแบบได้อย่างรวดเร็วและมีประสิทธิภาพ
  • นักวาดภาพประกอบ: ใช้สร้างภาพประกอบสำหรับหนังสือ, วารสาร, หรือสื่อสิ่งพิมพ์อื่นๆ ได้อย่างหลากหลาย
  • นักสร้างสรรค์คอนเทนต์: ใช้สร้างภาพประกอบสำหรับโพสต์โซเชียลมีเดีย, โฆษณา, หรือวิดีโอได้อย่างสวยงามและน่าสนใจ
  • นักพัฒนาเกม: ใช้สร้างภาพประกอบตัวละคร, ฉากหลัง, หรือไอเทมต่างๆ ในเกมได้อย่างรวดเร็ว
  • นักศึกษาและอาจารย์: ใช้ในการเรียนการสอนเกี่ยวกับศิลปะ, การออกแบบ, หรือเทคโนโลยี AI
  • ผู้ที่สนใจศิลปะ: ใช้สร้างงานศิลปะในรูปแบบต่างๆ ได้อย่างอิสระ ไม่จำเป็นต้องมีความรู้ด้านศิลปะมาก่อน
  • ผู้ที่ต้องการสร้างภาพสำหรับงานส่วนตัว: เช่น การทำโปสเตอร์, การ์ดอวยพร, หรือภาพประกอบสำหรับงานนำเสนอ

Imagen 3 ต่างกับโมเดลก่อนหน้าอย่าง Imagen 2 อย่างไร?

Imagen 2 Vertex

ที่มา: https://cloud.google.com/blog/products/ai-machine-learning/imagen-2-on-vertex-ai-is-now-generally-available

  • คุณภาพของภาพ: Imagen 3 สร้างภาพที่มีความละเอียดสูงขึ้น รายละเอียดปลีกย่อยชัดเจนมากขึ้น และมีความสมจริงใกล้เคียงกับภาพถ่ายจริงมากยิ่งขึ้น
  • ความหลากหลายของสไตล์: Imagen 3 สามารถสร้างภาพได้หลากหลายสไตล์มากขึ้น ไม่ว่าจะเป็นภาพวาดสีน้ำมัน ภาพการ์ตูน หรือภาพถ่ายแนวสตรีท
  • ความเข้าใจภาษาที่ซับซ้อน: Imagen 3 เข้าใจภาษาที่ใช้ในการบอกคำสั่งได้ดีขึ้น ทำให้สามารถสร้างภาพที่ตรงกับความต้องการของผู้ใช้ได้แม่นยำยิ่งขึ้น
  • ความสามารถในการสร้างภาพบุคคล: หนึ่งในจุดเด่นของ Imagen 3 คือสามารถสร้างภาพบุคคลได้อย่างสมจริงมากขึ้น โดยมีการปรับปรุงระบบเพื่อป้องกันการสร้างภาพที่ไม่เหมาะสม
  • การรองรับภาษา: Imagen 3 อาจรองรับภาษาที่หลากหลายมากขึ้นกว่า Imagen 2 ทำให้ผู้ใช้จากทั่วโลกสามารถใช้งานได้สะดวกยิ่งขึ้น

คนไทยสามารถทดลองใช้ Imagen 3 ได้แล้วหรือยัง?

ถึงแม้ว่าตอนนี้ยังไม่มีข้อมูลยืนยันว่าคนไทยสามารถทดลองใช้ Imagen 3 ได้ แต่ก็เป็นเรื่องที่น่าติดตามอย่างยิ่ง แต่คุณสามารถดูข้อมูลเพิ่มเติมและติดตามความเคลื่อนไหวได้ที่ https://deepmind.google/technologies/imagen-3/

สรุป

Imagen 3 ถือเป็นก้าวสำคัญในการพัฒนา AI สร้างภาพ โดยนำเสนอความสามารถที่เหนือกว่ารุ่นก่อนหน้าอย่างเห็นได้ชัด ทำให้การสร้างภาพจากข้อความเป็นเรื่องง่ายและสะดวกมากขึ้น ผู้ที่สนใจสามารถนำไปประยุกต์ใช้ในการสร้างสรรค์งานศิลปะ ออกแบบผลิตภัณฑ์ หรือใช้ในการนำเสนอข้อมูลได้อย่างหลากหลาย

 

อ้างอิง

Google DeepMind. Imagen 3

Available from: https://deepmind.google/technologies/imagen-3/

Google Research. Imagen

Available from: https://imagen.research.google/

การทำ Social Listening คืออะไร
Social Media Strategy
Social Listening หรือการฟังเสียงของลูกค้า มีผลดีต่อแบรนด์อย่างไรบ้าง

เวลาที่แบรนด์ออกผลิตภัณฑ์ใหม่หรือปล่อยแคมเปญออกมา วิธีที่จะสามารถวัดผลลัพธ์และรับฟัง Feedback ของลูกค้าได้ดีที่สุดก็คือ การทำ Social Listening ที่ช่วยให้นักการตลาดรู้ Insight ที่แท้จริง แต่สำหรับใครที่ไม่เคยลองทำมาก่อน อาจไม่เห็นภาพว่า…

รวม 7 เทคนิคบริหารเวลา ช่วยเพิ่มความ Productive
News
มัดรวม 7 เทคนิคบริหารเวลา ช่วยบาลานซ์ได้ทั้งงานและชีวิตประจำวัน

เคยเป็นมั้ย? งานเก่าไม่ทันเสร็จ งานใหม่มาซะแล้ว อยากรีบเคลียร์งานทุกชิ้นให้เสร็จ แต่ก็ลนจนทำอะไรไม่ถูกหรือมัวแต่ชะล่าใจ รู้ตัวอีกทีก็เสียเวลาไปหลายชั่วโมงแล้ว ซึ่งสิ่งสำคัญไม่ใช่แค่การลิสต์งานทั้งหมดออกมา แต่คือการจัดการเวลาแต่ละวินาทีให้มีประสิทธิภาพและ Productive มากที่สุด  บทความนี้ Digital…

ChatGPT-5.1 โมเดลใหม่ล่าสุดแตกต่างจากโมเดลเก่า ChatGPT-5.0 อย่างไรบ้าง
AI Marketing
ChatGPT-5.1 โมเดลใหม่จาก OpenAI มีอะไรแตกต่างจากโมเดลเก่าบ้าง

หลังจากที่คราวก่อนเราได้พูดถึง Browser น้องใหม่อย่าง “ChatGPT Atlas” เมื่อไม่นานมานี้ OpenAI ก็ได้ประกาศเปิดตัว ChatGPT-5.1 ซึ่งเป็นโมเดลเวอร์ชันอัปเกรดจาก ChatGPT-5.0 ซึ่งแน่นอนว่าโมเดลนี้ได้ปรับปรุงเรื่องการใช้ภาษาเป็นพิเศษ…