Kandinsky

คานดินสกี้ เป็นโปรแกรมสร้างภาพจากข้อความ (Text to Image Model) และวีดีโอ (Text to Video) ที่พัฒนาโดยทีมของบริษัท Sber Technologies ส่วนหนึ่งของธนาคาร Sberbank ของรัสเซีย

คานดินสกี้ เป็นเป็นโมเดลที่พัฒนาจากโมเดล a latent diffusion model Deep U-Net

โดยเริ่มเปิดให้คนทั่วไปใช้งานในปี 2021 ในชื่อ ru DALL-E ซึ่งมีพารามิเตอร์ต่างๆ รวม 1.3 พันล้านพารามิเตรอ์ และต่อมาในปี 2022 มีการเปิดตัว Kandinsky 2.0 เพิ่มพารามิเตอร์เข้าไปอีกเป็น 12 พันล้านพารามิเตอร์ และสามารถเข้าใจภาษาต่างๆ ได้ 101 ภาษา

2023 เมษายน, Kandinsky 2.1 โดยพารามิเตอร์ถูกเพิ่มเป็น 3.3 พันล้านพารามิเตอร์

​ กรกฏาคม, Kandinsky 2.2 เพิ่มความสามารถในการสร้างรูปภาพที่มีหลายขนาดมากขึ้น และสามารถสร้างรูปเสมือนภาพถ่าย ต่างจากเวอร์ชั่นก่อนนห้าที่สร้างรูปได้เพียงขนาดเดียว

​ ตุลาคม, คานดินสกี้ สามารถสร้างวิดีโอ ความยาว 4 วินาที ที่ความถึ่ 24 เฟรมต่อวินาที

2024 ธันวาคม, Kandinsky 4.0 เพิ่มความสามารถในการสร้างวิดีโอได้ยาว 12 วินาที

สามารถทดลองใช้ Kandinsky

  1. ได้ผ่าน Telegram ที่ช่อง Kandinsky21_bot

https://t.me/kandinsky21_bot

  1. เว็บไซด์ https://fusionbrain.ai/

https://t.me/kandinsky21_bot