Stäng

User del 3, Psykologin bakom vår upplevelse

Hej läsare!

För den som föredrar finns detta inlägg även att lyssna på via min Podcast. Om du uppskattar mitt arbete - som jag delar med mig av i sin helhet - kan du stötta det genom en Donation.

Angående ett tåg, en stol och en katt

Mycket av den här boken är skriven på ett tåg. Det förklarar kanske delvis mina återkommande paralleller dragna till just tåg. En annan förklaring skulle också kunna vara att jag ser på interaktionen som en resa med en destination, eller i varje fall riktning, dit alla resenärer är på väg. Detta är egentligen ologiskt, irrationellt, nästan lite galet. Vi pratar om att klicka och scrolla, inte om att resa? Men det är symboliken som gör relationen mellan det subjektiva och objektiva möjlig. En kundresa resonerar, känns rimligt och kanske till och med självklar, eller hur?

En inledningsvis viktig distinktion är att vi tekniskt sett inte riktigt är användare, utan verktygsanvändare. Det är inbäddat i vår natur och hur vi ser och förlänger oss själva genom vår omvärld. Bad dig välja ut något i rummet skulle du antagligen inte att välja en ojämnhet i golvet, eller en missfärgning i trät, utan kanske exempelvis en stol—eftersom du kan sitta på den. Vad är, objektivt sett, en stol egentligen? Två saker är sant om stolen 1) den är designad, såsom allt artificiellt är och 2) den är materia. En stol har en relation till sitt syfte, men samtidigt kan vi också sitta på en sten vilket vi normalt sett inte kallar för ”stol”. Trots att vår uppfattning är närmast helt och hållet subjektiv ser vi alla tydligt, oavsett material, färg eller form, en stol när vi ser en. Vi ser dess syfte och vad den designats för, inte objektet för att sedan härleda vad vi kan ha det till.

En snabb sökning efter ”Cats VS. Cucumbers” kan ge oss ett ytterligare exempel på hur olika sinnen samarbetar och integrerar information: en gurka placeras bakom en ovetande katt, som när den får syn på gurkan instinktivt kategoriserar den som fara (giftorm) och hoppar rakt upp i luften. Reaktionen är omedelbar och bortom den fria viljan, hade katten behövt vänta ytterligare 200–500 millisekunder för att se gurkan för vad den faktiskt är, kan vi också ur ett evolutionärt perspektiv dra vissa slutsatser kring den ekologiska utvecklingen av vår momentana perception. Det är såklart ingen skillnad från hur vi upplever och ser saker på en skärm. Skulle vi lägga in en motsvarande fördröjning på 200–500 millisekunder efter varje klick- eller scrollevent på en webbplats hade det ganska snart blivit väldigt frustrerande. Vad kan vi lära oss av tåget, stolen och katten? I detta kapitel kommer vi gå in lite närmare på just de psykologiska processer som föreligger vår upplevelse—däremot alltså inte såsom steg i en informationsprocess, utan som delar av en integrerad process.

Det är inte lätt, men enkelt

En interaktion implicerar en relation till någon, eller något. I denna bok syftar jag främst på människa-datorinteraktion, även om begreppet MDI i sin tur innefattar både interaktionen med ett medium, samt den interaktion som sker via det. Vår uppfattning av verkligheten är begränsad och realiseras i inkrementella steg när vi interagerar med den, vilket också är den fundamentala principen för hur vi lär: ny information transformeras till kunskap som i sin tur påverkar hur vi tänker för att kringgå problem i en föränderlig domän.

Att något upplevs vara på ett visst sätt beror till stor del på hur vi ser på det: vi kan titta på samma fotografi och se två helt olika saker. Vi kan titta på det igen om 20 år och det kan ha fått ytterligare en helt annan betydelse för oss. Bilden i sig är bara en behållare, vad vi faktiskt ser när vi tittar på den är vilken mening vi projicerar på den—den är vårt medium mellan berättelsen och den propositionella tanken.

Vi har en medfödd benägenhet att uppfatta den materiella världen såsom skild från intellektets, varpå det är lätt hänt att vi metaforisk konceptualiserar människa-datorinteraktion som en dialog mellan ”det levande och det döda”. Vi tenderar att se saker såsom själen, potential och tur såsom verkliga och vi hör även andra säga ”Vilken tur du har!” när vi lyckas med något osannolikt—motsatsen är logisk inom ramen för metafysiskt eller religiöst tänkande, där föremål och varelser tros ha en ”essens”.

Att vi är olika och att vår interaktion därför behöver ett medium, en adapter, vore dock ett mer vetenskapligt sätt att se på det. Inom detta yrkesområde kallar vi dessa adaptrar för Gränssnitt. Istället för att behöva förstå hur allt från hur koden som utgör en applikation exekveras, till hur kretsarna inuti en dator kommunicerar, förenklar gränssnitten det för oss att kontrollera vår uppfattning av vad som sker genom ikoniska representationer på datorns skärm. Vi skulle kunna likna detta med hur en barnteckning kan ge oss förenklade representationer av olika ting och typiska beteendemönster, vilka vår hjärna sedan kan tolka och vidareutveckla. Bara genom att titta på en teckning skapar vi oss snart en sanningsenlig bild av något som varken finns, eller aldrig har hänt! Vi har en minst sagt ganska märklig relation till vad som är verklighet och sanning, vad gäller just gränssnitten har de heller aldrig varit där för att hjälpa oss finna den—utan alltså tvärtom, för att dölja den. Vad som sker bakom datorns skärm förblir ovisst medan de sammanhang vi upplever i huvudsak speglar hur vår kognition och perception, de två psykologiska processer som ligger till grund för våra sinnesintryck, arbetar.

En biljett från A till B

Vare sig vi navigerar på en webbplats, arbetar i ett administrationsgränssnitt eller tar en paus från arbetet för att hämta en kopp kaffe; vad vår hjärna hela tiden gör att räkna ut den enklast möjliga planen, men som ändå är tillräckligt detaljerad för att leda oss igenom vårt event: att ta oss från A till B. Vanligtvis kvällstid, om jag frågar min sambo om hon vill ha en kopp kaffe, brukar jag ofta få svaret ”En halv kopp, tack!”. Detta är, i typfallet ska jag väl tillägga, inte ens något vi reflekterar över eller missförstår, trots att hennes svar inte överensstämmer med varken vad hon menar, eller vad jag uppfattar det som. På samma sätt vi per automatik ger en barnteckning kontext, komprimerar vi också lika intuitivt det komplexa.

Per definition menas med ordet Kognition de processer där våra sensoriska intryck både utvecklas och reduceras, men också transformeras, lagras, återställs eller används. Även om detta sker i avsaknaden av relevans (stimulus) är kognitionen ändå en del av allt en människa gör. Skulle vi be en röststyrd kaffeautomat (en enhet) om ”en halv kopp” skulle den först behöva acceptera ett visst villkor, vilken den sedan också skulle behöva kunna associera. Det betyder att den måste kunna missförstå, men också redogöra för missförståndet för att kunna förstå. Några sociala normer faller sig inte naturligt för en kaffebryggare.

Låt oss ta detta som vidare exempel för vår frågeställning som designer: är det nu människan eller kaffebryggaren som begränsar? Är lösningen teknisk, att komplexa mönster av samband ska hjälpa vår maskin att associera? Eller, är det att sänka tröskeln för det beteende vi vill uppmana, i detta fall tala (mata in information) korrekt? Ska vi förenkla för användaren genom att avancera produkten, eller ska vi civilisera användaren? Hur uppnår vi effektivast vårt resultatmål? Nu, men också över tid?

Design is storytelling

Vi frågar våra användare hur pass användbart och välanpassat för uppgiften vårt gränssnitt är: hur lätt är det att använda, lära sig att använda och komma ihåg hur det ska användas? Vi ifrågasätter också vår artefakt och i vilken grad den avhjälper våra användarens behov, begär, uppfattningar och tvivel för att de ska bli så effektiva i sin uppgift som möjligt? för att de ska uppnå specifika mål på ett ändamålsenligt och tillfredställande sätt? Vi måste ta hänsyn till båda de motsatta positionerna i den enkelsinnade splittringen mellan det levande och det döda, vilket kulminerar i ett gränssnittsproblem: hur ska vi nu ur ett tredje perspektiv se på gränssnittet? Svaret: är som manipulationen av representationen av informationen, våra berättelser om fakta.

Filmen Toy Story tar sin början med att Buzz, en av leksakerna i filmen ramlar ut genom ett fönster. Trots sin svartsjuka och oro att bli ersatt av Buzz som favoritleksak ger sig Sheriffen Woody ut i den okända världen för att hjälpa honom att återvända hem. Varför är Woody en cowboy och varför har han just fått detta namn? Varför är Buzz en rymdjägare och vad är Buzz för namn egentligen? Genom att ta ett litet stickprov i berättelsen inser vi snart att namnet Woody är något som vi förknippar med gamla leksaker av trä. Han är dessutom sheriff och hör till Amerikas historia. Buzz däremot, av ”buzzword”, ett trendord ofta förekommande inom det tekniska området, är rymdjägare, har en laser och ”kan” flyga. Detta förknippar vi såklart med det framtiden, med himlen och det outforskade. Att det är Buzz som ersätter Woody och inte tvärtom är förstås det som känns mest logiskt för oss som följer berättelsen, vi ersätter det gamla med det nya.

Berättar jag för dig innan nästa filmvisning börjar att i den här filmen går alla baklänges, kommer du antagligen ifrågasätta om någon helt plötsligt skulle gå framlänges. Trots att detta är vad vi normalt sett gör var det inte premissen för filmen, utan i kontexten avvikande. När något orimligt verkar rimligt för oss, eller något rimligt orimligt, är frågan vi ska ställa oss i vilken metaforisk kontext det faktiskt kan vara sant? Vår fakta är kort en reducering av en värdering vi håller utifrån en premiss som vi först accepterat såsom sann, såsom de berättelser (retoriska ramverk) vi fötts in i, eller något så trivialt som ett påstående att gräs skulle vara grönt. Objektivitet är bara ordet för den lägsta grad av subjektivitet vi kan förmå.

Gräset kan av många olika anledningar inte upplevas som grönt, det kan skina som guld i solnedgången, ha torkat och mattats av, vara bildmanipulerat och blått som en himmel (som egentligen kanske borde vara svart, såvida det inte var ljuset vi avbildade), eller för individen omöjligt att utgöra eftersom färgen först realiseras i vår hjärna. Ska vi förenkla och utgå från att världen är svartvit? Utesluta de färgblinda? Nej, det ska vi inte och det gör vanligtvis inte heller.

Rosor kan vara röda, violer är inte blå

Inom kognitionsvetenskapen har man börjat frångå det propositionella narrativet, vilken är att säga vetskapen om att någonting är kanoniskt sant. Dagens utveckling av AI (Artificiell Intelligens) förlitar sig inte heller på samma statiska regelverk för hur vi ser på omvärlden längre. Likt vår högra hjärnhalvas uppfattningsförmåga ser AI mönster i ett inmatningsdata som sedan kan härleda till en uppfattning baserad på dess djupinlärning om ett särskilt ämne (vänster hjärnhalva). Detta skulle kunna ses som strukturen för dess ”medvetande” som istället för att ha ett systematisk fördefinierat utfall, såsom en if/else-sats vilket traditionellt används inom programmeringen, lär sig vilket resultat som kan åstadkommas genom att interagera med något på ett särskilt sätt. Man ser alltså inte längre enbart till rationalitet som avgörande för vad som är verklig för oss eller inte, vilket vore att förbise hur vi är grundade i vår natur och att skilja på kognition som insikt och på funktionell kognitiv förmåga att behandla information. Försöker vi reducera ned allt vetande till det propositionella, hamnar vi i ett rekursivt läge med oändligt många if/else-satser: Är gräs grönt? Om sol; om under sol, eller om över sol, eller om inte under tak; om inte på datorskärm som är färgkalibrerad i sRGB färgrymd” och så vidare…

Att gräs är grönt är ett så kallat heuristiskt svar, vilket betyder att påståendet fortfarande kan vara falskt, men är ett generellt och någorlunda korrekt svar, tillräckligt sant för sitt sammanhang. Design är inte heller någon exakt vetenskap i den bemärkelsen att det finns empiriskt stöd för några fasta värden, oavsett område eller sammanhang. Design är av naturen kontextuell, vilket innebär att vi heller aldrig kommer kunna enas kring någon generisk praxis utan att först ha en given kontext. Vi måste först specificera villkoren under vilka en observation ska ske innan det är möjligt för oss att lägga fram några hållbara och testbara hypoteser. Kanske kan jag illustrera detta med hjälp av en välkänd paradox:

Identitet över tid

I den grekiska myten om Theseusskeppet berättas det om hur gamla brädor på skeppet successivt byts ut mot nya vartefter de inte längre är i tillräckligt gott skick. Tillslut kommer dagen då alla brädorna på skeppet har blivit utbytta och frågan uppstår då om det fortfarande är Theseusskeppet—eller om det är ansamlingen av de gamla brädorna längst strandkanten som är? I en variant av paradoxen ställs också följdfrågan vad som skulle hända om de gamla brädorna återanvändes till att bygga ett nytt skepp? Skulle det då plötsligt finnas två Theseusskepp? och i så fall, när började då det andra skeppet att existera? Et möjligt svar på paradoxen skulle alltså kunna vara att ett objekt bara uppenbarar sig för oss i relation till hur vi interagerar med det. Vi kan med andra ord inte definiera objektet utan att först ange en referensram – hur vi ska se på det – eftersom objektet i sig har en mångfacetterad potential. Beroende på hur vi interagerar med det (vår metod) kommer det att anta vissa egenskaper. När exempelvis internet kom under 90-talet var det en revolutionerande potential, utan vare sig gränser eller styrning. Idag kan vi säga närmast det motsatta: det är det mest totala kontrollsystemet i mänsklighetens historia. Våra skärmar är fönstren vi ser ut på – och till stor del även lär känna – världen genom. Applikationerna vi använder kan läsa våra tankar, förutse våra handlingar, analysera oss ideologisk och temperamentmässigt. Är internet fortfarande samma sak? Det beror alltså på i vad vi menar med ”samma sak”. Vi interagerar inte längre med det på samma sätt, så vad vi då kan lära oss av Theseusskeppet är att vi inte heller kan förvänta oss att ha samma relation till det längre.

Ett exempel på ett minimalistiskt gränssnitt

I vår begränsning kan vi här se endera en svart prick på en vit bakgrund, eller en vit förgrund med ett svart hål i:

Black dot

Våra idéer om båda dessa koncept är ömsesidiga, vi kan växla snabbt emellan hur vi väljer att se på det, men däremot inte se det på båda sätten samtidigt. Visst är det väl retligt? Såväl det svarta som det vita är nödvändigt för att vi ska kunna uppleva pricken, de är alltså en helhet tillsammans och utan det ena eller det andra hade pricken inte kunnat existera. Om vi istället för att bry oss om gränsen mellan det objektiva och subjektiva låter vår helhetsupplevelse av denna prick avgöra vad som är verkligt för oss, inser vi snart att de klasser och modeller vi använder oss av inom programmeringen inte kan definiera vad det är vi upplever? Finns det någon som helst grund för denna illusion måste vi först begränsa den till en definition som förgrund eller bakgrund, svart eller vit, insida eller utsida—frånskilt den verklighet vi upplever, som är subjektiv, inte objektiv.

Nedsidan med vetenskapen är att den helt saknar subjektivitet, som ur ett vetenskapligt perspektiv endast kan ses som fördomar eller fel. Sedan upplysningstiden har vi därför tenderat att se oss själva som subjekt i en objektiv värld, vilket i sin tur lett till vissa följdproblem: det betyder indirekt att vi som individer inte nödvändigtvis har någon anknytning till den objektiva världens verklighet. Det är precis här vår konceptuella tvist mellan det själsliga och det materiella har sin rot och där vår kognition också lämnar oss isolerade.

Ni som försökt vet redan, men för er andra kan jag berätta att det inte alltid så lätt att få en dator att förstå vad vi menar och tänker; eftersom rationella representationer av våra upplevelser alltför ofta är otillräckliga. ”Jag är avfärdande av dem dygdiga, omedveten om det vackra och står oförstående inför dem lyckliga.” säger Sherlock Holmes om sig själv, men kunde alltså lika gärna kunnat ha pratat om en maskin.

Utgångspunkten för vad vi lär oss idag, vår vetenskap, bygger på upplysningstidens teori att vårt val av metod är avgörande, samt att strukturen för vad som är verkligt vore rationell. Länge godtogs även grundföreställningen att människan vore rationell och logisk, men vi är inte särskilt rationella, exempelvis i vad vi ser när vi tittar på en teckning, eller hur vi tackar Ja till en halvfull hel kopp kaffe. Vårt medvetande strukturerar sig på samma sätt som vilken berättelse som helst: det har en identitet, en kärna, gränser och undantag. Denna berättelse spelar en avgörande roll för våra beslut och vi motiveras av helt andra drivkrafter och impulser än vad som skulle kunna anses vara rationellt.

Sluta se på världen som saker du gillar och inte gillar

Prof. Donald Hoffman föreslår i The Interface Theory of Perception att vi genom naturligt urval anpassats för att inte se den faktiska verkligheten på samma sätt som vi inte ser vad som försiggår inuti en dator när vi använder den. Att våra A-till-B-beräkningar, som i slutänden är mätvärdet på vår framgång och överlevnad, med fördel inte tar hänsyn till någon faktisk verklighet överhuvudtaget, utan istället till organismen, dess tillstånd och dess handling. Detta är att säga att evolutionen inte tycks ha premierat vårt förhållande till någon reell verklighet överhuvudtaget, framför den vi har åtkomst till via våra perceptuella ramverk. Det är tämligen enkelt att avgöra var vår telefon avgränsar till vår hand när vi håller i den, vi kan lägga ifrån oss den för att göra detta ännu mer uppenbart. Det är däremot inte lika uppenbart var du slutar och telefonen börjar när du interagerar den? Vad är den mänskliga faktorn när vi vill kunna förutsäga utfallet av en sådan process? Det är frågan jag försöker besvara varje dag.

Vi tar oss ett steg närmare ett vetenskapligt svar genom att separera personen, den subjektiva meningen, från problemet. Som jag redan tidigare nämnt finns det i denna bok ingen individuell användare, utan bara typanvändare. Personliga åsikter kan vi därför anse inte längre spela någon större roll, det är istället meningsskiljaktigheter kring fakta som allt handlar om—och då pratar vi om perception, eller varseblivning, i den bemärkelse som Professor Hoffman syftar på.

Vi upplever den objektiva världen ur perspektivet av vilken betydelse den har för oss. Eftersom världen ter sig för oss i relation till vilken nytta den har för oss, innebär det också att den affekteras av olika subjektiva faktorer. Dessa brukar delas in i tre huvudgrupper:

  1. vår situation, hur vi i stunden påverkas av den miljö vi befinner oss i

  2. vår erfarenhet, vad vi förväntar oss ska ske

  3. våra mål, vad vi vill ska ske

Vad som fångar vår uppmärksamhet och intresse, är nära korrelerat med den potential vi också kan konceptualisera. Det är inte särskilt konstigt att vi ibland har olika syn på saker, hur de bör se ut, eller fungera. Vore vi identiska krashtest-dockor hade våra gränssnitt varit betydligt enklare att standardisera, men vi är komplexa och omges dessutom av en oändlig mängd komplexitet, långt bortom vår förmåga att behandla och ta hänsyn till. En bekant till mig berättade hur han efter att ha varit i kontakt med en psykedelisk drog upplevt just detta fenomen, hur han sett sina händer i en högre upplösning, varje liten detalj av dem. Detta är som tur är inte det vardag vi lever i, den värld vi upplever är vår begränsade uppfattning av allt det vi ser omkring oss. Vår värld äger rum inuti våra huvuden; vad vi känner, tror, förstår och kallar för ”verkligheten”. Vad detta betyder är att vi i slutänden förhåller oss till världen på ett abstrakt plan—sant nog. Vi identifierar med subjektet och vår perception organiseras av våra mål; vi ser verktyg som hjälper oss nå dem, eller problem som står i vår väg. Allt annat, det som varken hjälper eller hindrar oss, sorteras bort från vår uppmärksamhet.