Less mindless drift, more flavor

True elegance is often found in deducing striking and sound conclusions from very simple observations – observations that are accessible to all. Michael J Sandel’s “What Money Can’t Buy – The moral limits of markets” seems to me a case in point. Sandel starts off with a couple of simple premisses and takes it from there, going roughly along the following lines: 1) The pre-2008 era of market triumphalism has come to an end. The financial crisis did more than cast doubt on the ability of markets to allocate risks efficiently, it also prompted a widespread sense that markets have become detached from morals – and that something needs to be done. 2) While some argue that (an increase in) greed is the cause, the most fateful change that unfolded during the past three decades was not an increase in greed, but the expansion of markets and market values into spheres of life where they do not belong. 3) Inveighing against greed would therefore be a symptomatic treatment at best, we need to rethink the role that markets should play in our society. We need to think through the moral limits of markets, to ask whether there are things that money should not buy, because 4) the more money can buy, the more affluence or the lack thereof matters. 5) This can be expressed in terms of inequality, as experienced by lower and middle class families over the past decades, but also in terms of corruption. Markets are not inert as economists often assume, markets leave their mark. They can crowd out nonmarket values worth caring about. 6) Some of the good things in life can and have been corrupted or degraded into commodities. 7) The discussion of where the market belongs and where it does not has not taken place during the era of market triumphalism, as a result we have drifted from having a market economy to a being market society without realising it or deciding to do so.

until here and no further

Consider the proliferation of for profit schools, hospitals, and prisons; the outsourcing of war and security to private military contractors and private security firms, respectively. Consider pharma’s aggressive marketing and prescription of drugs to consumers in first world countries. Continue reading “Less mindless drift, more flavor”

It’s not education, stupid!

Ah, La perfide Albion, wanting to be left alone by that pesky old continent again, will it ever be any different? Not in a while, I suppose. Of the innumerable opinion articles that were written in the wake of the actual Brexit vote, some I found a very good read. A discussion on Zuckerberg’s medium prompted me to do some writing of my own, so below a slightly modified version.

histoire se repète

An 1870 map depicting Brittain as an old woman, turning her back on ‘the continent’. Via 1843magazine.

As most probably have witnessed over the past days, the quite strong correlation between average education level and Brexit leanings of a region was often condescendingly used as an ‘Eurosceptics are (racist) morons’ statement by Bremainers/pro-Europeans. In my view, nothing is more nonconstructive, dangerous, and – frankly – stupid than that. If anything, this referendum should be a wake up call to the higher educated, pro-EU slice of the population (I am implying yours truly as well). Continue reading “It’s not education, stupid!”

2½. Dwelltimedistributies

Dacht je naar punt 3 door te kunnen, krijg je dit! Toch eerst maar even kijken wat ik precies bedoel met de dwelltimedistributies. Stel je hebt een dataset die alle verkregen dwelltimes van een experiment bevat, een lange lijst met tijden dus. De set die ik hier heb bestaat uit 15417 tijden verkregen door 60 trajecten op te knippen in stukken van 10 baseparen. Op die 10 baseparen kom ik aan het eind weer terug, nu eerst de tijden. Het minimum ligt bij 0.08 seconden: de polymerase vestigde een snelheidsrecord in dat stuk. De langste tijd – met andere woorden langste pauze – duurde 98.8 seconden. Alle andere 15415 punten liggen dus daar ergens tussenin. Je kijkt hoe de verdeling van tijden eruitziet door de data in een histogram te stoppen. Hierbij verdeel je die kleine 100 seconden in tijdsintervallen van gelijke grootte (bins) en tel je hoeveel van de tijden er binnen elk tijdsinterval liggen:

Abnormaal verdeeld: Als je het zo bekijkt lijkt er nauwelijks een dwelltime boven de 5 seconden te liggen..
Ondergesneeuwde data: Maar als je inzoomt zie je dat er toch nog wel wat datapunten bij hogere tijden liggen!

Daar is niet veel anders over te zeggen dat de overweldigende meerderheid van de dwelltimes niet veel langer is dan zo’n 5 seconden. Tijd voor een logaritmisch geschaalde histogram (log-histogram):

Dezelfde data op een logaritmische tijdschaal.

Continue reading “2½. Dwelltimedistributies”

3. Bayesiaanse statistiek en maximum likelihood estimation.

Een van de meest vernieuwende stappen in het wetenschappelijke veld die dit artikel met zich meebrengt is het fitten van een kinetisch model aan de complexe dwelltimedistributie waarover ik in mijn vorige punt uitwijdde. We hebben een distributie aan tijden die niet voor een gat te vangen is, dus het lijkt erop dat er een combinatie van verschillende verdelingen nodig is om de data te beschrijven. Waarom we dit doen leg ik in het laatste punt uit, maar we doen dit met behulp van een methode ontleend uit de Bayesiaanse statistiek: de maximum likelihood estimation.

Dit behoeft wat uitleg. Of nou ja, ik zou het model ook zonder deze andere vorm van statistiek uit kunnen leggen, maar het toepassen van deze statistische methode in de single-molecule biofysica is vernieuwend en verdient daarom een afzonderlijke post. Daarnaast, waarom zou ik iemand uitleg over een mooie statistische stroming willen onthouden? Mocht u bij het lezen van het woord ‘statistiek’ een aanval van blinde paniek krijgen: ga dan door naar het volgende punt.

Het overgrote deel van de statistiek die tegenwoordig toegepast wordt is de klassieke of frequentistische (is dat een woord?) interpretatie van kansrekening. Ze is gebaseerd op de aanname dat je uit een eerder gemeten dataset kunt afleiden of een nieuw gemeten datapunt afwijkt en hoe groot de kans (de p-waarde) is dat dit gebeurt. Hoe ver het punt afwijkt wordt getoetst aan een nulhypothese die zegt: je nieuwe datapunt hoort bij de verzameling oude datapunten. De nulhypothese wordt vervolgens al dan niet verworpen op basis van een vooraf bepaald criterium en een de p-waarde die aangeeft hoe zeker je van je zaak kunt zijn. Er wordt verder geen enkele aanname gemaakt, er wordt alleen gekeken of de nulhypothese klopt, met soms absurde conclusies als resultaat. Een mooi voorbeeld hiervan is octopus Paul, de duitse ongewervelde die zo beroemd werd tijdens het WK van 2010 omdat hij een hoop wedstrijden achter elkaar goed voorspeld had. De nulhypothese – Paul is niet helderziend – werd volgens de klassieke statistiek verworpen, met een officieel als helderziend bestempelde octopus als gevolg.*

Continue reading “3. Bayesiaanse statistiek en maximum likelihood estimation.”

3½. Bootstrapping

Voordat we doorgaan naar de climax van het verhaal toch nog een klein intermezzo: bootstrapping! Boot-wat? Boot-waarom? Een betrouwbaar wetenschappelijk verhaal is gebaseerd op betrouwbare data, dat klinkt logisch. Maar hoe betrouwbaar is betrouwbaar? Om de betrouwbaarheid van data aan te geven zie je soms error bars en soms betrouwbaarheidsintervallen op datapunten. Voorbeeld: In het laatste figuur van deel 2 (de polymerasesnelheid versus kracht) steken aan weerszijde van elk datapunt horizontale balkjes uit die eindigen met een balkje dat daar haaks op staat. Dit zijn error bars en ze geven aan waar het datapunt met nog een vrij grote waarschijnlijkheid ook zou kunnen liggen. Horizontaal betekent dat we het over de x-as hebben, ofwel de onzekerheid in de kracht die we uitoefenen.*

Virtueel de meting herhalen. Dataset x (blauw) en een gebootstrapte set r1 (rood), de verdelingen lijken erg op elkaar maar willekeurigheid maakt ze niet identiek.

Stel nu je hebt een dataset met een bepaalde verdeling, zoals ik in punt 2½ had. Hoe betrouwbaar is deze dataset? Moet ik dan nog een aantal keer opnieuw die 15417 punten bij elkaar meten en kijken wat de variatie is die ik krijg? Dat zou wel eens lang kunnen gaan duren. In veel gevallen is dit zelfs niet te doen. Enter bootstrapping. Waarom het beestje deze naam gekregen heeft zal me een raadsel zijn en google heeft hier vast een antwoord op, maar mooi en belangrijk is weten hoe het werkt.

Continue reading “3½. Bootstrapping”