Rådata, temperaturjusteringar och mygel

Tycker du det vore en bra idé att uppskatta hur stor andel av Sveriges befolkning som lider av Alzheimers genom att enbart kontrollera människor i åldersspannet 65-85 år utan att justera för hur antalet förhåller sig till den totala populationen?

Nej, förmodligen inte. I klimatdebatten verkar många tycka det är okej dock …

Som jag beskrev i förra inlägget så konstaterade Staffan Mörner (som har sidan Klimathotet.com)  att mycket av hans skepsis angående klimatforskningen berodde på att man inte kan lita på temperaturmätningarna. Det är för mycket ovetenskapliga justeringar och joxande för att få fram de data man vill ha. Efter upprepade inlägg av andra på Twitter om att man ska använda rådata och inte justerade temperaturserier tänkte jag bara skjuta in en kommentar om det.

Det är förstås ingen hemlighet att mätresultaten bakom temperaturserierna justeras/homogeniseras innan de används i den ”officiella statistiken” (du kan själv ladda ner rådata). Varför använder de inte temperaturerna rakt av? Som en gästkrönikör på SvD:s ledarsida uttryckte det: Det är ingen vetenskap att mäta temperaturen.

(nej, eller hur…)

 

  Absolut temperatur eller anomalier?

OLYMPUS DIGITAL CAMERA
På väg nerför Yalung Ri, berg i Nepal. Foto Annelie Pompe

 

För att ta ett extremt och helt teoretiskt exempel [uppdaterade det 12/6 för att tydliggöra].

Man har tre olika mätstationer i landet Fylke, en på toppen av ett berg, en på bergssidan och en i dalen nedanför. Medelvärdet för år 2017 var 10°C på toppen, 20°C på bergssidan och 30°C i dalen. För hela Fylke blir medelvärdet från alla tre stationerna då 20°C. År 2018 steg temperaturen 1°C på alla stationerna och medeltemperaturen i Fylke blev då 21°C.

Men budgetåtstramningar, förlåt, effektiviseringar ska det heta, gjorde att man blev tvungen att flytta ner toppstationen till bergssidan. Medeltemperaturen för 2018 blev då (21+21+31)/3) = 24,3°C istället för det riktiga 21°C. Panik! Eller kanske inte, vi vet ju att det sannolikt inte stämmer då man bara flyttat en station.

Finns det något sätt att minska den här typen av felkällor?

Ta en titt på denna mätserie från NASA, jordens medeltemperatur är ju knappast 1°C som graderingen på y-axeln säger. Men notera att det inte står absolut temperatur utan temperatur-anomali, det vill säga temperatur-avvikelse. Från vadå kan man fråga sig?

GlobalTemp (2)

Åter till Fylkes tre olika mätstationer. Om man istället räknar ut ett medelvärde för varje station över, säg 30 år, så kan man sätta det som en baslinje (”nollpunkt”), en för varje mätstation och sedan jämföra framtida temperaturer med denna. Vi kan säga att medelvärdet för åren 1960-89 var: topp: 10°C, mellan: 20°C, dal: 30°C (men det spelar ingen roll vilka årsintervall man tar som baslinje bara man jämför med samma).

Låt säga att medeltemperaturen för de olika stationerna år 2018 blev en grad varmare dvs precis som ovan:

  • topp: 11°C
  • mellan: 21°C
  • dal: 31°C 

Jämför vi dessa värden med nollpunkten/baslinjen får man fram de så kallade anomalierna (avvikelserna):

  • topp: 11 – 10 = +1°C
  • mellan: 21 – 20 = +1°C
  • dal: 31 – 30 = +1°C

Det går nu att jämföra förändringarna vid de olika stationerna med varandra på ett mycket bättre sätt. Och det är den vi är intresserad av, inte absoluttemperaturen. Beräknar man ett nytt medelvärde för hela Fylke utifrån avvikelserna/anomalierna för de tre stationerna blir det (1+1+1)/3 = 1°C. Tar vi nu återigen och flyttar ner toppstationen blir det nya medelvärdet fortfarande 1°C.

Nu är mitt exempel grovt tillyxat för att visa effekten och som alltid är det aningen mer komplext än så här även om principen är den samma. Genom att använda anomalier minskar effekten av att ändra på mätstationer.

Man inser också att om ett område har åtta mätstationer på bergstoppar men bara en vid havsnivån och man tar ett medelvärde av absoluttemperaturerna rakt av så är risken stor att det sanna medelvärdet för området inte stämmer (det blir för kallt). Använder man sig av anomalierna är sannolikheten att man uppskattar förändringen rätt betydligt större.

Likaså om Fylke har 50% av alla mätstationer i världen men bara upptar 3% av jordens totala yta kommer de värdena få ett för stort genomslag i jordens globala medelvärde om man inte justerar för det.

Att göra den här typen av homogenisering av dataserier är inget kontroversiellt i sig, även ”klimathotskeptiker” som Judith Curry och Anthony Watts använder sig av det (se t ex kommentarer till detta inlägg). Som Zeke Hausfather uttrycker det på Judith Currys websida, hade mätstationer och tekniker etc varit konstanta över tid hade det inte varit något problem att använda absolutdata:

”Absolute temperatures work fine if and only if the composition of the station network remains unchanged over time.”

Men i den verkliga världen är det långt ifrån sanningen, stationer flyttas, det växer upp städer och så vidare:

Nearly every single station in the network has been moved at least once over the last century, with many having 3 or more distinct moves. Most of the stations have changed from using liquid in glass thermometers (LiG) in Stevenson screens to electronic Minimum Maximum Temperature Systems (MMTS) or Automated Surface Observing Systems (ASOS). Observation times have shifted from afternoon to morning at most stations since 1960, as part of an effort by the National Weather Service to improve precipitation measurements.

There is a very obvious cooling bias in the record associated with the conversion of most co-op stations from LiG to MMTS in the 1980s, and even folks deeply skeptical of the temperature network like Anthony Watts and his coauthors add an explicit correction for this in their paper.

Steve Goddard, alias Tony Heller, köper ändå inte detta och vill använda rådata precis som de är. Likaså verkar Mörner på Klimathotet.com inte se någon relevans i att justera för dessa kända felkällor då han till exempel tar upp Heller/Goddards graf som säger att det blivit kallare i USA (istället för den officiella till höger):

 

Bilder från Tamino.

 

För att komma dit har han fått sålla ganska rejält bland tillgängliga data. Istället för årsmedelvärden har han enbart använt maxtemperaturerna, dessutom enbart från somrarna och skippat resten av året. Han har kapat grafen vid 1918 istället för att ta med hela mätserien (från 1895) och ovanpå det bara använt rådata och inte de justerade värdena från kända felkällor som de jag berättat om ovan.

Det här är som sagt ett förfarande som kritiseras hårt och det inte enbart av ”IPCC-gänget”. Men som så ofta mynnar det ändå ut i att de som inte köper Goddars/Mörners slutsatser ”saknar kritiskt tänkande” i klimatfrågan.

Här reder Nick Stokes ut ett nyare fall där Heller anser sig ha avslöjat fusk med temperaturserier. Skillnaderna mellan två olik agrafer han säger vara fusk är i själva verket två olika mätserier som inte representerar samma sak. And on it goes …

Zombiestationer

Man använder sig även av algoritmer som bevakar mätstationer angående ändringar av GPS-data (=ändring av plats) och jämförelse med närliggande stationer; är det någon station som börjar avvika på ett onormalt sätt skippas dessa resultat och istället används approximationer från omkringliggande stationer. Det är förstås också är en evig källa till kontroverser och påståenden om att en stor del av de mätdata som finns är påhittade.

Ett kabelfel till en mätstation i Texas ledde till exempel till en hel del uppståndelse 2014, ”algoritmen” upptäckte att stationen gav onormala mätvärden och skippade dessa och ”fyllde” därför istället i med värden approximerade från närliggande stationer. Rådata (som finns tillgängliga för alla) för den stationen visade alltså kallare än vad som användes i de ”officiella mätserierna”.

Det var förstås ett fel (även om algoritmen justerade för uppenbara fel som den skulle) men som genast växte till absurda proportioner. Här finns mer att läsa om dessa korrektioner och justeringar och hur man inte ska beräkna temperaturer, del I, del II, del III. (Av Zeke Hausfather, som även skrivit om detta på Judith Currys hemsida).

I mitt förra inlägg har jag gett fler exempel på hur ovanstående justeringar används som bevis på fusk.

MNIL6751
Nej, jag har inte koll på allt i den här frågan (heller), det är förstås mer komplext än vad jag kan beskriva här och jag har definitivt inte koll på alla mättekniker, statistiska beräkningar och allt vad det nu är. Allt jag ville visa var att alla dessa justeringar inte är något påhittat hokus-pokus, det finns resonemang och motiveringar bakom. Naturligtvis måste man få kritisera och det har alldeles säkert begåtts fel (och kommer fortsätta att göras), men att ständigt tjata om konspiration och att man ska använda rådata utan justeringar blir bara löjligt.

(Och ja, jag tycker även det blir löjligt att höra att höra från SvD:s ledarsidesskribent att temperaturmätningar inte involverar vetenskap …)