Gebruiker:Agubler/Kladblok
AI-kunst verwijst naar beeldende kunst dat gemaakt is met behulp van kunstmatige intelligentie (AI).[1]
Het begin van AI-kunst is te vinden in het midden tot het einde van de 20e eeuw, toen er voor het eerst een generatief AI model werd gemaakt. In de loop van haar geschiedenis heeft kunstmatige intelligentie veel filosofische kwesties[2] opgebracht over menselijk verstand, kunstmatige wezens en wat als kunst beschouwd kan worden in de samenwerking tussen mens en AI. Sinds de 20e eeuw gebruiken kunstenaars regelmatig AI om kunst te maken, waarvan sommige zelfs tentoongesteld worden in musea en prijzen hebben gewonnen.[3]
De toegenomen beschikbaarheid van AI tools voor het algemeen publiek door de AI-boom in de jaren 2020 bood nieuwe mogelijkheden om makkelijk AI gegenereerde beelden buiten de academische wereld en professionele kunstenaars makkelijk te gebruiken. Commentaar over AI-kunst richt zich nu vaak op kwesties met betrekking tot auteursrecht, misleiding, laster en de impact op meer traditionele kunstenaars, waaronder technologische werkloosheid.
Geschiedenis
[bewerken | brontekst bewerken]Vroege geschiedenis
[bewerken | brontekst bewerken]In 1950, met de publicatie van Alan Turing's paper Computing Machinery and Intelligence, vond er een verschuiving plaats van de betekenis van intelligentie met betrekking tot machines in abstracte termen naar het evalueren of een machine menselijk gedrag en reacties overtuigend kan nabootsen.[4] Kort daarna werd de academische discipline van kunstmatige intelligentie opgericht tijdens een onderzoeksworkshop aan het Dartmouth College in 1956 en heeft in de decennia daarna verschillende golven van vooruitgang en optimisme gekend.[5] Sinds de oprichting hebben onderzoekers op dit gebied filosofische en ethische argumenten naar voren gebracht over de aard van de menselijke geest en de gevolgen van het creëren van kunstmatige wezens met een mensachtige intelligentie; deze kwesties zijn eerder onderzocht door mythen, fictie en filosofie sinds de oudheid.[6]
1950 tot 2000: Vroege modellen
[bewerken | brontekst bewerken]Sinds het ontstaan van AI in de jaren 1950 hebben kunstenaars en onderzoekers kunstmatige intelligentie gebruikt om artistieke werken te creëren. Deze werken werden soms algoritmische kunst,[7] computerkunst, digitale kunst of nieuwe media genoemd.[8]
Een van de eerste belangrijke AI-kunstsystemen is AARON, ontwikkeld door Harold Cohen aan het eind van de jaren 1960 aan de Universiteit van Californië in San Diego.[9] AARON gebruikt een symbolische, op regels gebaseerde benadering om technische afbeeldingen te genereren in het tijdperk van GOFAI-programmering, en het werd ontwikkeld door Cohen met het doel om de handeling van het tekenen te kunnen coderen.[10] In zijn vroegste vorm creëerde AARON abstracte zwart-wittekeningen die later door Cohen zouden worden afgewerkt door ze te schilderen. In de loop der jaren begon hij ook een manier te ontwikkelen waarop AARON kon schilderen, met behulp van speciale penselen en kleurstoffen die door het programma zelf werden gekozen, zonder tussenkomst van Cohen. Na jaren werk werd AARON in 1972 tentoongesteld in het Los Angeles County Museum of Art.[11] Van 1973 tot 1975 verfijnde Cohen AARON tijdens een residentie in het Artificial Intelligence Laboratory aan de Stanford-universiteit.[12] In 2024 exposeerde het Whitney Museum of American Art AI-kunst uit de hele carrière van Cohen, waaronder opnieuw gemaakte versies van zijn vroege robotische tekenmachines.[12]
2010: Deep learning
[bewerken | brontekst bewerken]In het deep learning-tijdperk zijn er voornamelijk deze soorten ontwerpen voor generatieve kunst: autoregressieve modellen, diffusiemodellen, GAN's, normaliserende stromen.
In 2014 ontwikkelden Ian Goodfellow en collega's van de Université de Montréal het generative adversarial network (GAN), een type diep neuraal netwerk dat kan leren om de statistische verdeling van invoergegevens zoals afbeeldingen na te bootsen. Het GAN gebruikt een “generator” om nieuwe afbeeldingen te creëren en een “discriminator” om te beslissen welke gecreëerde afbeeldingen als succesvol worden beschouwd.[13] In tegenstelling tot eerdere algoritmische kunst die handgecodeerde regels volgde, konden generative adversarial networks een specifieke esthetiek leren door een dataset van voorbeeldafbeeldingen te analyseren.[14]
In 2017 leerde een voorwaardelijk GAN om 1000 beelden vanuit ImageNet te genereren.[15]
Autoregressieve modellen werden gebruikt voor het genereren van afbeeldingen, zoals PixelRNN (2016), dat autoregressief de ene na de andere pixel genereert met een terugkerend neuraal netwerk.[16] Direct nadat de Transformer-architectuur werd voorgesteld in Attention Is All You Need (2018), werd deze gebruikt voor het autoregressief genereren van afbeeldingen, maar zonder tekstconditionering.[17]
In 2019 won Stephanie Dinkins de Creative Capital award voor haar creatie van een evoluerende kunstmatige intelligentie gebaseerd op de “interesses en cultuur(s) van gekleurde mensen”.[18] Ook in 2019 won Sougwen Chung de Lumenprijs voor haar prestaties met een robotarm die AI gebruikt om te proberen te tekenen op een manier die lijkt op Chung.[19]
2020
[bewerken | brontekst bewerken]In de jaren 2020 werden tekst-naar-beeld modellen, die afbeeldingen genereren op basis van aanwijzingen, op grote schaal gebruikt.[20]
In 2021, met behulp van de invloedrijke grote taal generatieve voorgetrainde transformer taalmodellen die worden gebruikt in GPT-2 en GPT-3, bracht OpenAI een reeks afbeeldingen uit die waren gemaakt met het tekst-naar-beeld AI-model DALL-E 1.[21] Het was een autoregressief generatief model met in wezen dezelfde architectuur als GPT-3.
In 2015 werden diffusiemodellen voorgesteld,[22] maar ze werden pas begin 2021 beter dan GAN's.[23] Latente diffusiemodel werd gepubliceerd in 2021 december, en werd de basis voor de latere Stable Diffusion (augustus 2022)[24]
In 2022 werd Midjourney uitgebracht, gevolgd door Google Brain's Imagen en Parti, die in mei 2022 werden aangekondigd, Microsoft's NUWA-Infinity, en het broncode-beschikbare Stable Diffusion, dat in augustus 2022 werd uitgebracht. DALL-E 2, een opvolger van DALL-E, werd beta-getest en uitgebracht. In tegenstelling tot DALL-E 1 was het een diffusiemodel Stable AI heeft een Stable Diffusion webinterface genaamd DreamStudio, plugins voor Krita, Photoshop, Blender en GIMP, en de Automatic1111 webgebaseerde open source gebruikersinterface. Het belangrijkste voorgetrainde model van Stable Diffusion wordt gedeeld op de Hugging Face Hub.[25]
Referenties
[bewerken | brontekst bewerken]- ↑ Epstein, Ziv, Hertzmann, Aaron, Investigators of Human Creativity,, Akten, Memo, Farid, Hany (16 juni 2023). Art and the science of generative AI. Science (New York, N.Y.) 380 (6650): 1110–1111. ISSN:1095-9203. PMID: 37319193. DOI:10.1126/science.adh4451.
- ↑ (en) Higgs, Jennifer M., Stornaiuolo, Amy (11 juni 2024). Being Human in the Age of Generative AI : Young People's Ethical Concerns about Writing and Living with Machines. Reading Research Quarterly . ISSN:0034-0553. DOI:10.1002/rrq.552.
- ↑ Todorovic, Milos (2024). AI and Heritage: A Discussion on Rethinking Heritage in a Digital World. International Journal of Cultural and Social Studies 10 (1): 1–11. DOI: 10.46442/intjcss.1397403. Geraadpleegd op 4 July 2024.
- ↑ Turing, Alan, Computing Machinery and Intelligence (October 1950). Geraadpleegd op 16 september 2024.
- ↑ Crevier, Daniel (1993). AI: the tumultuous history of the search for artificial intelligence. Basic books, New York. ISBN 978-0-465-02997-6.
- ↑ Newquist, Harvey P. (1994). The brain makers. Sams Publ, Indianapolis, Ind. ISBN 978-0-672-30412-5.
- ↑ (en) Greenfield, Gary (3 april 2015). When the machine made art: the troubled history of computer art, by Grant D. Taylor. Journal of Mathematics and the Arts 9 (1-2): 44–47. ISSN:1751-3472. DOI:10.1080/17513472.2015.1009865.
- ↑ Newquist, Harvey P. (1994). The brain makers. Sams Publ, Indianapolis, Ind. ISBN 978-0-672-30412-5.
- ↑ McCorduck, Pamela (1991). Aaron's code: meta-art, artificial intelligence, and the work of Harold Cohen. W.H. Freeman, New York. ISBN 978-0-7167-2173-4.
- ↑ McCorduck, Pamela (1991). Aaron's code: meta-art, artificial intelligence, and the work of Harold Cohen. W. H. Freeman, New York. ISBN 978-0-7167-2173-4.
- ↑ (en) Desk, News, HAROLD COHEN (1928–2016). Artforum (9 mei 2016). Geraadpleegd op 6 oktober 2024.
- ↑ a b (en) Diehl, Travis, "A.I. Art That's More Than a Gimmick? Meet AARON", The New York Times, 15 februari 2024. Geraadpleegd op 1 juni 2024.
- ↑ Goodfellow, Ian, Pouget-Abadie, Jean, Mirza, Mehdi, Xu, Bing, Warde-Farley, David (22 oktober 2020). Generative adversarial networks. Communications of the ACM 63 (11): 139–144. ISSN:0001-0782. DOI:10.1145/3422622.
- ↑ Elgammal, Ahmed (2019). AI Is Blurring the Definition of Artist. American Scientist 107 (1): 18. ISSN:0003-0996. DOI:10.1511/2019.107.1.18.
- ↑ (en) Odena, Augustus, Olah, Christopher, Shlens, Jonathon (17 juli 2017). Conditional Image Synthesis with Auxiliary Classifier GANs. International Conference on Machine Learning: 2642–2651 (PMLR).
- ↑ (en) Oord, Aäron van den, Kalchbrenner, Nal, Kavukcuoglu, Koray (11 juni 2016). Pixel Recurrent Neural Networks. Proceedings of the 33rd International Conference on Machine Learning: 1747–1756 (PMLR).
- ↑ (en) Parmar, Niki, Vaswani, Ashish, Uszkoreit, Jakob, Kaiser, Lukasz, Shazeer, Noam (3 juli 2018). Image Transformer. Proceedings of the 35th International Conference on Machine Learning: 4055–4064 (PMLR).
- ↑ Rollyson, Carl (2023-06). "It Takes Only One". American Book Review 44 (2): 26–29. ISSN:2153-4578. DOI:10.1353/abr.2023.a906488.
- ↑ Smith, Georgia (1 mei 2024). Lumen Prize. ITNOW 66 (2): 52–53. ISSN:1746-5702. DOI:10.1093/itnow/bwae060.
- ↑ (en) Vincent, James, All these images were generated by Google’s latest text-to-image AI. The Verge (24 mei 2022). Geraadpleegd op 6 oktober 2024.
- ↑ Tewel, Yoad (2022-06). ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (IEEE). DOI: 10.1109/cvpr52688.2022.01739.
- ↑ (en) Sohl-Dickstein, Jascha, Weiss, Eric, Maheswaranathan, Niru, Ganguli, Surya (1 juni 2015). Deep Unsupervised Learning using Nonequilibrium Thermodynamics. Proceedings of the 32nd International Conference on Machine Learning 37: 2256–2265 (PMLR).
- ↑ Dhariwal, Prafulla, Nichol, Alexander (2021). Diffusion Models Beat GANs on Image Synthesis. Advances in Neural Information Processing Systems 34: 8780–8794 (Curran Associates, Inc.).
- ↑ Rombach, Robin; Blattmann, Andreas; Lorenz, Dominik; Esser, Patrick; Ommer, Björn (2021-12-20), High-Resolution Image Synthesis with Latent Diffusion Models, arXiv:2112.10752, bezocht 2024-09-16
- ↑ Prakash, T.Gnana, Anusha, K. (31 oktober 2017). Text Extraction from Image using Python. International Journal of Trend in Scientific Research and Development Volume-1 (Issue-6): 310–317. ISSN:2456-6470. DOI:10.31142/ijtsrd2501.