One minute
Kandinsky
คานดินสกี้ เป็นโปรแกรมสร้างภาพจากข้อความ (Text to Image Model) และวีดีโอ (Text to Video) ที่พัฒนาโดยทีมของบริษัท Sber Technologies ส่วนหนึ่งของธนาคาร Sberbank ของรัสเซีย
คานดินสกี้ เป็นเป็นโมเดลที่พัฒนาจากโมเดล a latent diffusion model Deep U-Net
โดยเริ่มเปิดให้คนทั่วไปใช้งานในปี 2021 ในชื่อ ru DALL-E ซึ่งมีพารามิเตอร์ต่างๆ รวม 1.3 พันล้านพารามิเตรอ์ และต่อมาในปี 2022 มีการเปิดตัว Kandinsky 2.0 เพิ่มพารามิเตอร์เข้าไปอีกเป็น 12 พันล้านพารามิเตอร์ และสามารถเข้าใจภาษาต่างๆ ได้ 101 ภาษา
2023 เมษายน, Kandinsky 2.1 โดยพารามิเตอร์ถูกเพิ่มเป็น 3.3 พันล้านพารามิเตอร์
กรกฏาคม, Kandinsky 2.2 เพิ่มความสามารถในการสร้างรูปภาพที่มีหลายขนาดมากขึ้น และสามารถสร้างรูปเสมือนภาพถ่าย ต่างจากเวอร์ชั่นก่อนนห้าที่สร้างรูปได้เพียงขนาดเดียว
ตุลาคม, คานดินสกี้ สามารถสร้างวิดีโอ ความยาว 4 วินาที ที่ความถึ่ 24 เฟรมต่อวินาที
2024 ธันวาคม, Kandinsky 4.0 เพิ่มความสามารถในการสร้างวิดีโอได้ยาว 12 วินาที
สามารถทดลองใช้ Kandinsky
- ได้ผ่าน Telegram ที่ช่อง Kandinsky21_bot
- เว็บไซด์ https://fusionbrain.ai/