Generatiivisen kuvan aikajana by ChatGPT
Tässä on aikajana, joka esittelee tärkeimmät generatiivisen kuvan (eli erityisesti tekstistä kuvaan -mallien) kehitysaskeleet vuosien 2023–2025 aikana. Keskityn erityisesti taiteilijan ja visuaalisen alan asiantuntijan näkökulmaan:
2023 – Generatiivinen kuva mainstreamiin
• Stability AI julkaisee Stable Diffusion 2.1 (2023 alkuvuosi): Laadukkaampi resoluutio, parempi kontrolloitavuus. Malli on avoin, mikä mahdollistaa laajan taiteellisen kokeilun.
• Midjourney v5 (maaliskuu 2023): Dramaattinen parannus valokuvamaisuuteen ja estetiikkaan. Taiteilijoiden suosikki ilmaisullisen tyylinsä vuoksi.
• Adobe Firefly (maaliskuu 2023): Ensimmäinen iso generatiivinen malli, jonka koulutusdata perustuu laillisesti käyttöön sopivaan aineistoon (Adobe Stock). Sisällytetty Photoshopiin.
• DALL·E 3 (lokakuu 2023): OpenAI julkaisee uuden version, joka toimii saumattomasti ChatGPT:n sisällä — käyttäjä voi ohjata luovaa prosessia dialogilla.
2024 – Kontrolli, kompositointi ja yhteistyö ihmisen kanssa
• ControlNet ja ComfyUI yleistyvät (alkuvuosi 2024): Stable Diffusionin käyttäjät voivat nyt kontrolloida sommittelua, muotoja, poseerauksia jne. Uusi vaihe kohti “luotettavaa luovuutta”.
• Runway Gen-2 (kesä 2024): Videon generointi tekstistä ja kuvasta alkaa lähestyä käyttökelpoista tasoa. Taiteellinen liikkuva kuva uusiin ulottuvuuksiin.
• Meta julkaisee Emu-mallin (loppuvuosi 2024): Pienempi, mutta tehokas mallisarja, joka toimii mobiililaitteilla ja mahdollistaa nopean visuaalisen ideoinnin missä vain.
• Generatiivinen fill ja laajennus (“outpainting”) yleistyy: Photoshop, Canva ja Clipdrop integroivat tekoälypohjaisen sisällön täydentämisen. Inspiraatio laajenee kirjaimellisesti kuvan ulkopuolelle.
2025 (tähän asti) – Luova ekosysteemi, yhteistyö ja vastuullisuus
• Open Source -mallien nousu (esim. SDXL, Mistral + ComfyUI): Yhteisöpohjaiset kehitysympäristöt vievät kuvanlaadun, kontrollin ja ympäristöystävällisyyden uudelle tasolle.
• Local AI – tekoäly omalla koneella: Yhä useampi visuaalinen ammattilainen käyttää tekoälyä ilman pilveä, paremmalla yksityisyydellä ja pienemmällä hiilijalanjäljellä.
• Tekoälyn tunnistus ja etiketti yleistyy: Kuvien metatietoihin lisätään automaattisesti AI-tagit. Tämä vaikuttaa taidemarkkinoihin ja luottamukseen.
• Apple ja Meta panostavat visuaaliseen tekoälyyn AR/VR-maailmoissa: Esim. Vision Pro ja Meta Quest 3 tukevat immersiivisiä generatiivisia kuvia — ympäristöä muokataan ajassa ja tilassa.
Kommentit