JON HOEM

Førsteamanuensis ved Institutt for kunstfag, Høgskulen på Vestlandet – Bergen.

Underviser i kunst og håndverk, og forsker på og med nye kunst- og medieformer. Leder forskergruppen MaTecSus.

Jeg er interessert i forholdet mellom medier og fysiske materialer: i 2021 kom boken Digitale medier og materialitet med en grundig diskusjon av denne tematikken. Jeg er særlig interessert i det haptiske (berøring og bevegelse) knyttes til lyd.

Fremover jobber jeg særlig med den telematiske operaen Zosimos (2023-26) og (støy)instrumentet Sonic Greenhouse.

Nylig avsluttede prosjekter er Sonus (2023), Sampling av lyd og bærekraft (2022-), "Auditomosjon" (2021-23) og "Aquafoni" (2022).

Videre sfæriske medier, ulike former for roboter, mm.

Min Dr.-avhandling om personlig publisering (2009).

Siterte artikler og publikasjoner i Cristin.

14. desember 2024

Godt fra Grok

Grok kom så vidt jeg kan se til alle X-brukere nylig. Jeg har brukt fullversjonen Av Open AI sin Dall-E et års tid. Dall-E er imponerende, men førsteinntrykket av Grok er på noen områder bedre. En enkelt test, men ganske betegnende.

Først et bilde fra Grok. Jeg ber om et bilde av en Mercedes SLC fra 1970-tallet. Bildet til venstre (nedenfor) ble svært bra, med et mulig unntak av felgene, innertaket og bakre vindu. Bildene til høyre viser ekte fotografier av denne bilmodellen:


Dall-E leverer en SL coupe, men en SL fra 1960-tallet. Når jeg forsøker å korrigere, og laster opp et bilde av riktig modell, gjenkjenner KIen bilmodellen (Mercedes-Benz 107 SLC), men genererer likevel feil modell:


Selv om C107 SLC var en nisjebil, ble den produsert med omtrent samme utforming i 10 år – fra 1971 til 1981. Mange havnet riktig nok i USA, da med et litt annet design. Tross dette burde det være en tydelig definert bilmodell.

Jeg lurer på om forskjellene henger sammen med at Grok har færre restriksjoner enn Dall-E, og at dette får konsekvenser på tvers av helt ulike bilder. Et nevralt nettverk er ikke helt forutsigbart, noe som kan bety at dersom en legger inn begrensninger kan det få konsekvenser på andre områder enn det opprinnelig var tiltenkt. Et trekk ved Grok, som henger sammen med eieren Elon Musk sitt liberale syn på ytringsfrihet, er at tjenesten tillater å generere tullete bilder av eksisterende personer. Bildet av Musk i rosa kjole får tjene som et eksempel på ting en skal være ytterst forsiktig med å gjøre. Akkurat i denne sammenhengen (Musk som hovedeier i XAI og Grok) er det kanskje OK. Poenget er at noen KI-tjenester kommer med begrensninger, som ikke finnes i Grok. Det er mange potensielle problemer med dette, som fortjener en annen post - deep fakes, bedrag, digital mobbing osv. Denne mangelen på begrensninger kan muligens også føre til mer realistisk gjengivelse av objekter – jeg spekulerer her.

Apropos Musk. En kan mene mye om mannen, men hans evner til å løse problemer på tvers av tekniske områder må en bare beundre. Tesla (Musk er største eier og teknisk sjef) utviklet en egen versjon av TCP/IP : Tesla Transport Protocol over Ethernet (TTPoE). Denne løsningen fikser et problem knyttet til å knytte sammen enormt mange prosessorer for KI-trening, noe som har gjort det mulig for X-AI å bygge verdens største datasenter for KI-trening.


Ingen kommentarer:

Legg inn en kommentar

Kommentarer er svært velkommen. På grunn av problemer med spam må jeg imidlertid godkjenne kommentarer før de publiseres. Vanligvis skjer dette i løpet av noen timer.

 
◄ Free Blogger Templates by The Blog Templates | Design by Pocket