i

Aktuální číslo:

2023/5

Téma měsíce:

Adaptace

Obálka čísla

Prompt-to-image

Nové výzvy a potenciál AI v architektuře
 |  2. 5. 2023
 |  Vesmír 102, 298, 2023/5

Téma umělé inteligence dlouho zůstávalo pro architekty okrajovou záležitostí. Obor se zdál být příliš komplexní a zároveň příliš subjektivní na to, aby se v něm dalo využít strojového učení či jiné techniky AI kromě velmi specifické oblasti, jako je například simulace vlivu větru na statiku budovy. Avšak nedávný vývoj a obrovská popularita prompt-to-image AI, jako je MidJourney nebo Stable Diffusion, může zásadně změnit situaci.

Prompt-to-image AI je typ strojového učení, které se používá k vytváření obrázků na základě textového popisu. Jde o techniku hlubokého učení, která využívá neuronové sítě. Do té se vloží dvojice obrázek a jemu odpovídající text a síť se učí poznávat vztah mezi nimi. Jakmile je síť vycvičena, lze ji použít ke generování nových obrázků na základě nových textových pokynů. Pro zlepšení kvality generovaných obrázků se neuronová síť obvykle trénuje pomocí velkého souboru dat s obrázky a odpovídajícími textovými popisy. To pochopitelně neznamená, že vygenerované obrázky vždy přesně odrážejí zamýšlený význam textového popisu. Zároveň mohou posilovat existující tendence nebo trendy, pokud je k tomu navádí tréninkový soubor dat.

Nástup prompt-to-image AI v architektuře nepochybně přinesl vzrušující možnosti v oblasti navrhování. Tato technologie umožňuje architektům rychle a efektivně generovat více variant návrhu a představuje agilnější proces navrhování. Jako každou novou technologii i tuto lze využít různě.

Před 60 lety vznikl na MIT program SketchPad, jenž se často považuje za první příklad programů CAD (computer-aided-design). Byl jedním z prvních, který umožňoval vytvářet kresby pomocí počítače, přičemž k interakci se systémem používal lehké pero. Sketchpad zavedl mnoho konceptů a technik, které se v CAD používají dodnes, včetně vektorové grafiky, objektově orientovaného programování a možnosti manipulace s objekty na obrazovce. Jeho autor Ivan Sutherland i další významný průkopník tohoto oboru Nicholas Negroponte měl ambici stvořit budoucnost, ve které architekti a software spolupracují na návrhu, vzájemně se učí a přispívají k lepšímu řešení. Skutečnost byla poněkud banálnější a první programy CAD představovaly digitální kreslicí prkno, které práci architekta principiálně neměnilo (i když částečně usnadnilo).

Na základě této historické zkušenosti se předpokládá, že první masové využití prompt-to-image AI bude též prvoplánové a banální. Nabízí se představa pokročilejší nástěnky, obdoby služby Pinterest, kde si architekti (nebo i klienti) generují množství návrhů, dokud nenarazí na ten „povedený“. I když to vypadá jako pohodlné řešení, je zde několik otazníků. Za prvé není neuronová síť cvičena k tomu, aby měla důkladné znalosti o složitosti architektonického navrhování. Navrhování budov vyžaduje nejen „povedenou“ estetiku, ale také porozumění typologii, urbanismu nebo materiálu. Dále vzniká obava, že prompt-to-image AI bude udržovat stávající předsudky a stereotypy v oblasti architektury. Modely umělé inteligence se spoléhají na soubory dat, které jim slouží jako zdroj, a pokud jsou tyto soubory dat neobjektivní, pak bude neobjektivní i výstup umělé inteligence. Jestliže například tréninková data obsahují především návrhy ze západních kultur, pak může umělá inteligence generovat návrhy, které nezohledňují specifický kulturní kontext, v němž bude budova postavena. Konečně je otázka, zda jsme jako architekti schopni najít společnou řeč s neuronovou sítí, vycvičenou na všeobecném tréninkovém souboru dat. V rámci studijního úkolu, který probíhal na Vysoké škole uměleckoprůmyslové v Praze, se studenti ve svých textových popisech odvolávali na konkrétní nerealizovaný projekt britského architekta Cedrica Price „Fun Palace“ z roku 1961. Nepřekvapivě neměla představa neuronové sítě o tom, co je „fun“ a co je „palace“, nic společného s architektonickým návrhem ze šedesátých let.

Avšak tyto a další problémy, které se jistě objeví při aplikaci prompt-to-image AI v architektuře, jsou samy o sobě potenciálním řešením. Jsou současné neuronové sítě zaměřené pouze na estetiku? Ano, ale možná že stejně, jako umějí kvantifikovat „povedený“ vzhled, by se mohly naučit odhadnout karbonovou stopu návrhu. Jsou neuronové sítě plné předsudků a stereotypů? Jistě, ale zároveň mohou sloužit k odhalení těchto předsudků a stereotypů. Například i těch, o kterých jsme neměli ponětí. Jsou tréninková data příliš obecná a zaměřená na popkulturu? Asi ano, ale snad je to příležitost k diskusi o tom, jaká tréninková data bychom si jako architekti přáli použít. A třeba je to příležitost vytvářet vlastní soubory tréninkových dat, takových, které by o nás vypovídaly přinejmenším stejně jako naše skici.

Ke stažení

OBORY A KLÍČOVÁ SLOVA: Architektura
RUBRIKA: Architektura

O autorovi

Shota Tsikoliya

Doc. MgA. Shota Tsikoliya, Ph.D, M.Sc., (*1991) vystudoval Vysokou školu uměleckoprůmyslovou v Praze a univerzitu ve Stuttgartu. Od roku 2017 je spoluzakladatelem architektonického studia COLLARCH, kde se podílel na několika oceněných projektech a realizacích. Působí jako odborný asistent na Vysoké škole uměleckoprůmyslové v Praze, kde spolu s prof. Imrichem Vaškem vede ateliér Architektura III. Od roku 2020 vede spolu s Ondřejem Janků ateliér architektonického navrhování na škole architektury ARCHIP.

Doporučujeme

Evoluční adaptace

Evoluční adaptace

Jan Toman  |  2. 5. 2023
Adaptaci můžeme zařadit mezi centrální pojmy evoluční biologie. Stejně jako všechny zdánlivě jednoduché koncepty ovšem skrývá netušenou hloubku....
Metabolická flexibilita

Metabolická flexibilita uzamčeno

Jan Gojda, Michal Anděl  |  2. 5. 2023
Lidský organismus je adaptován na měnící se dostupnost a potřebu energetických substrátů.
Komu patří kultura?

Komu patří kultura?

Jaroslav Jiřík, Martin Soukup  |  2. 5. 2023
Získávání exotických předmětů, artefaktů či lidských ostatků bývalo mezi evropskými cestovateli, vědci a muzei běžné. Dnes narůstá snaha narovnat...