Beviser statistikk felles avstamning?
Emily Reeves, 3.jan. 2022. Oversatt herfra.


Bilde 1: Tysk schäferhund

Schaefer
I løpet av det siste året har forskjellige Discovery Institute-ansatte, stipendiater og sommerseminaralumner deltatt i en journalklubb som har lest artikler relatert til systematikk og fylogenetikk. En av artiklene vi leste var av Baum et al. (2016), "Statistisk bevis for vanlige aner: Anvendt på primater." Ideen bak artikkelen oppsto i 2014 da David A. Baum, Cecile Ane og Bret Larget underviste på et kandidatseminar ved University of Wisconsin, Madison, hvor de alle er fakultetsmedlemmer. Gitt viktigheten av felles aner for evolusjonsteorien, var motivasjonen deres å sette sammen og konvertere støttende bevis for felles aner, til kvantifisert statistikk. De fokuserte på primater fordi de mener dette er et fokuspunkt i evolusjonsdebatten.
En rekke forskere, inkludert meg selv, analyserte metodene deres og hadde en gruppediskusjon angående konklusjonen deres: "Primate felles aner er en overveldende godt støttet hypotese."


Generelle tanker
Vår gruppe valgte denne artikkelen fordi forslaget - å teste to alternative modeller av felles aner - både er uvanlig i litteraturen og fascinerende. De undersøkte to versjoner av Separate Aner, som de definerte som "art SA (den separate opprinnelsen til hver navngitte art) og familie SA (den separate opprinnelsen til hver familie)." Vi var ikke enige i alt i artikkelen, men vi satte pris på at det var lett å følge, innsiktsfullt og respektfullt. Noen gruppemedlemmer satte også pris på at både morfologiske og molekylære karakterer ble vurdert. Selv om ikke alle var enige i konklusjonen, mente de fleste at artikkelens statistiske metodikk for å "kvantifisere" historisk vitenskap var nyttig.
Før vi graver dypere inn, vil jeg også merke meg at intelligent design ikke nødvendigvis er uforenlig med felles aner. Faktisk hadde journalklubben vår ID-tilhengere med en rekke perspektiver på felles aner - noen støttende, noen skeptiske og noen agnostiske.

 

Separat forfedremodell representerer ikke "den andre sidens" syn
Det største problemet vi så med artikkelen var at de alternative modellene for felles aner - arters aner og familieforfedre - ikke er nøyaktige representasjoner av "den andre siden av debatten", det vil si forkjempere for intelligent design som stiller spørsmål ved felles aner. Her er hvorfor.
I hovedsak spurte deres sammenligninger om likhetene mellom organismer som danner grunnlaget for fylogenetiske sammenligninger kunne ha oppstått ved en tilfeldighet eller felles aner. Hvis felles aner var en mer sannsynlig forklaring enn tilfeldighet, så konkluderte de med at felles aner ble støttet. Men ingen antyder at tilfeldigheter vil produsere likhetene. For ID-tilhengeren som stiller spørsmål ved felles aner, vil likheter bli produsert fra design. Selv forfatterne bemerket at en slik test er partisk til fordel for felles aner:
De fleste av de statistiske testene vi diskuterer er epistemologisk asymmetriske. De innebærer å identifisere et mønster som forventes under CA [felles avstamning] og deretter kvantifisere sannsynligheten for at de observerte dataene kunne ha oppstått ved en tilfeldighet under SA [Separate Aner].


Det som kom frem fra vår diskusjon er at denne modellen med separate aner ikke støttes av noen i ID-miljøet og, for å si det rett ut, er vilt urealistisk av alle slags biologiske årsaker. For eksempel ville denne separate aner-modellen ha kommet som en stor overraskelse for Carl Linnaeus, Georges Cuvier eller Luis Agassiz, som organiserte taksonomiske grupper rundt felles likheter, uten noe nødvendig årsakskrav for evolusjonær avstamning.
Konklusjonen deres - "Vi avviste overveldende både arter og familie SA med uendelig små P-verdier" - er ikke overraskende og representerer en ikke-test av en faktisk SA-modell. Følgelig gir denne konklusjonen ingen utfordring for ID-tilhengere som stiller spørsmål ved felles aner, og diskusjonen kan best oppsummeres som "å snakke forbi hverandre." En viktig løsning for ID-tilhengere er at de trenger å avklare hva deres modell av separate aner faktisk er, slik at andre kan teste den. Jeg skal prøve å gjøre litt av det, konseptuelt, akkurat nå.

 

Hva kan likhet fortelle oss om historie? Hint: Ikke mye
Forfatterne antar at likheter mellom primater innebærer historiske forhold. "Organismer [som] deler likheter, spesielt likheter som ville være svært usannsynlig å oppstå uavhengig, gir ... bevis til fordel for CA (Sober and Steel 2015)." Denne antakelsen er standard for historisk fylogenetikk og førte til at forfatterne utformet den arts separate forfedremodellen med alle likheter som oppstår uavhengig: "Et nøkkeltrekk ved Spesifikk-Arts (SA) modellen er at for hver karakter er staten tegnet av hver art, uavhengig av den som er tegnet av andre arter."
Denne modellen og antakelsen er svært problematisk fra ID-perspektivet. Design kan forårsake slående likheter, uten noen historisk eller evolusjonær sammenheng.
Tenk på et scenario der det er tre schäferhunder: en mor, hennes sønn, og en tredje som er en genmanipulert klon av sønnen, født i en laboratorieliv. Den genetisk konstruerte schäferhunden i dette imaginære scenariet er genetisk identisk med den virkelige sønnen og fenotypisk lik, men har ingen historisk relasjon til moren. I stedet er han et produkt av menneskelig genteknologi.


Jeg beskriver dette scenariet, fordi hvis det er mekanismer utover historiske forhold som kan forklare genetisk likhet, dvs. genteknologi, så er det ikke lenger mulig å anta at likhet må utlede historisk slektskap. Selv om mors eksistens i dette tilfellet er nødvendig for klonen, er det ikke tilstrekkelig å forklare klonens eksistens eller dens likheter. Det ville være feil å beskrive den tredje schäferhunden som den historiske etterkommeren av moren, akkurat som Craig Venters Syn3.0-celle, basert på en Mycoplasma-stamme, ikke ville eksistere uten den nøye utformingen av menneskelige molekylærbiologer og genetikere.
Dermed holdes ikke antagelsen om at aner er den eneste mekanismen eller beste forklaringen på karakterlikhet av ID-tilhengeren. I stedet mener ID-tilhengere at en designer kan produsere likheter, omtrent som forskjellige Gucci-vesker viser likheter. En mer teknisk forklaring av én ID-modell for separate aner finner du her.

 

Kirsebærplukking?
Før de utøvde statistikk, valgte forfatterne hvilke karakterer (gener og morfologiske egenskaper) de ville bruke for analysen. Hvordan valgte de? For det molekylære datasettet er det ikke tydelig angitt i artikkelen deres. Men fra lesing andre steder (Perelman et al. 2011; Murphy et al. 2001) oppdaget vi at primere fra tidligere studier ble brukt så vel som noen nye. Da vi sjekket ut det første sitatet, fant vi følgende.
Vi undersøkte sekvensvariasjon i 18 homologe gensegmenter (inkludert nesten 10 000 basepar) som ble valgt for maksimal fylogenetisk informativitet for å løse hierarkiet til tidlig pattedyrdivergens.
-PERELMAN ET AL. 2011; MURPHY ET AL. 2001
Hvorfor er disse sekvensene fylogenetisk informative? Fordi de løser hierarkiet til tidlig pattedyrdivergens på måten modellen forutser. Flere deltakere tok opp problemer med denne tilnærmingen under diskusjonen. De hevdet at datavalg eller ekskludering, basert på oppløsning mot en forventet modell, stokker kortstokken. En deltaker sa at hvis du skal bruke genetisk likhet for å argumentere for et historisk forhold, må det tas hensyn til alt DNA (som reiser andre problemer) og en straff for feiltilpasninger som ikke passer til det forventede rammeverket. Med andre ord bør foreldreløse (orfan) gener motvirke hypotesen om historisk slektskap.

 

Konklusjon
For å oppsummere er metodikken og ønsket om å teste alternativer til felles aner som er tatt opp i denne artikkelen beundringsverdig. Imidlertid ble det gjort en rekke vanlige antakelser som tilhengere av separate aner med et designperspektiv ikke ville støtte. Artikkelen klarer nemlig ikke å erkjenne at design kan generere likheter, uavhengig av felles aner. Dette gjør at flertallet av artikler er et tilfelle av å "snakke forbi hverandre" mens man unngår de virkelige problemene om hvorvidt en designbasert modell faktisk passer bedre for dataene. Hva bør skje videre? Mer dialog mellom disse to leirene ville være nyttig slik at passende modeller kan lages og deretter statistiske tester brukes.

 

Kritikk fra en YouTuber (Gutsick Gibbion)
Emily Reeves; 4. august 2022 Oversatt herfra.

Bilde 2. Gibbon-ape

Gibbon-ape
Tidligere i år laget en populær evolusjons-youtuber, Gutsick Gibbon eller Erika, et videosvar på innlegget mitt her på Evolution News, "Do Statistics Prove Common Ancestry?" -lenke. Jeg hadde anmeldt en artikkel av Baum et al. (2016), "Statistical evidence for common ancestry: Application to primates," og hvordan det presenterer et mangelfullt og svakt argument for separate aner som ignorerer muligheten for felles design.
Erika tar for tiden sin mastergrad i forskning i primatbiologi, atferd og bevaring og er skaperen av hundrevis av punchy, underholdende YouTube-videoer. Kanalens hovedfokus ser ut til å være å avvise Darwin-skeptikere. Dessverre ser hun ikke ut til å bruke et like kritisk blikk til evolusjonsteorien.
Mens Erika selvsikkert bekrefter konklusjonene til Baum et al. (2016) i flere videoer ... - avkrefter ikke hennes svar argumentene som ble reist i mitt første innlegg.

 

En innledende ansvarsfraskrivelse
Før jeg går videre vil jeg minne deg på at intelligent design (ID) er kompatibel med både vanlige aner og ikke-felles anervisninger. Noen av kollegene mine her ved Discovery Institute støtter felles aner, mens andre (som meg selv) er mer skeptiske. Det er greit! Vi er alle enige om at det er bevis for design i naturen. Noen av oss skeptikere er interessert i å utforske potensielle modeller der ID og ikke-felles forfedres historier om livet krysser hverandre. Design stiger eller faller ikke med disse modellene, men de er interessante spørsmål å utforske.

 

Kritikk av kritikken
Erikas første kritikk kan oppsummeres som en fullstendig misforståelse av ID-tilhengernes innvendinger mot artikkelen. Det skal vi ta for oss i et innlegg i morgen.
Hennes andre kritikk er at ID-tilhengere ikke bør forvente at andre skal teste modellene deres, men bør teste modellene selv. Alle er velkomne til å teste ID-konsepter hvis de vil, men jeg tror ikke at ID-tilhengere ventet Baum et al. (2016) for å teste hypotesen om separate aner. Snarere utførte artikkelen den normale vitenskapelige prosessen der en gruppe forskere tester en annen gruppes vitenskapelige hypotese uavhengig. Bare i dette tilfellet testet de en hypotese ingen støtter - mer om det senere. Kanskje viktigst, ID-tilhengere er involvert i å teste modeller av separate aner, og eksemplet her ble gitt i det opprinnelige innlegget.
Hennes tredje kritikk svarte på hovedpoenget mitt - det er to kjente mekanismer (design og aner) som kan produsere genetisk likhet. Derfor bør genetisk likhet ikke alltid brukes til å gi eksklusiv støtte for forfedres slektskap når andre forklaringer er mulige.


For å utdype sin tredje kritikk, argumenterer Erika for at det ikke er noen genetisk avgrensning eller separasjon som vil markere et stoppested for sammenligning mellom arter og høyere ordener av phyla. Hun ignorerer tydeligvis reproduktive barrierer her. Selv om jeg ikke tror dette argumentet tar for seg det uthevede poenget ovenfor, er jeg ganske nysgjerrig på hvordan hun forestiller seg at dette stoppepunktet ville se ut hvis separate aner faktisk var riktige? Jeg spekulerer i at i slike tilfeller forventer folk at det eneste beviset for en diskontinuitet i biologisk slektskap vil være en vidt forskjellig genetisk kode for hver organisme eller art. Dette virker for meg som en falsk forventning, fordi menneskelig teknologi viser at selv separat utformede strukturer kan ha dype likheter som går ned til selve skisser eller kodingsinformasjon. Gitt det, vil en designhypotese føre til at vi forventer funksjonelle likheter. Jeg vil også si at det er grunner til at et godt design vil gjøre bruk av en svært lik genetisk kode for alle organismer.
Mer om denne kildetekstenKildeteksten er nødvendig for å få mer informasjon om oversettelsen

 

"Sist torsdagisme"
I denne delen av argumentasjonen hennes diskuterer Erika også "Last Thursdayism". Hun sier at fordi et tilsynelatende hierarkisk forfedres mønster eksisterer, hvis separate aner var riktige, må designeren være villedende for å etterlate oss et slikt mønster. I tilfelle du ikke er kjent med Last Thursdayism, er det et konsept at en skaper eller Gud kan få ting til å se ut på en bestemt måte (milliarder år gamle for eksempel) selv om han hadde skapt alt sist torsdag. Selv om jeg er enig i at det er problemer med Last Thursdayism, er Last Thursdayism ikke relevant i dette tilfellet. Det er enkle grunner til å forvente en viss grad av trelignende mønstre selv i et datasett som ikke er relatert til felles aner.

 

Hvis det tilsynelatende "villedende mønsteret" eksisterer av en funksjonell grunn og har en "god design"-forklaring, så er det egentlig ikke et "villedende mønster." Det "villedende mønsteret" påtvinges kun av materialistiske linser og en dårlig forståelse av funksjonelle årsaker til likhetene.
For å oppsummere problemene med hennes tredje kritikk, som understreket i mitt opprinnelige innlegg, kjenner og observerer vi to mekanismer som kan resultere i genetisk likhet. Design er den ene (tenk genteknologi) og aner (tenk reproduksjon) den andre. Fordi to kjente mekanismer eksisterer for å produsere genetisk likhet, betyr det i seg selv at genetisk likhet ikke gir bevis for forfedres slektskap. Visse mønstre av genetisk likhet kan gjøre dette, men et designmønster, som ikke er tilfeldighet, ble ikke vurdert i Baum et al. (2016) papir og blir ikke vurdert av mange i det akademiske miljøet. Det er det ID-tilhengere prøver å endre.


Erikas fjerde kritikk er at Winston Ewerts avhengighetsgraf (Ewert 2018) ikke er en faktisk modell av separate aner. Winstons sentrale tese er at det nestede hierarkiske mønsteret observert i undergrupper av gener er bedre redegjort for av en avhengighetsgraf. Erika erkjenner at dette er utenfor feltet hennes, men hun siterer Joshua Swamidass for å avfeie det som en modell. Jeg vil snakke mer om hennes spesifikke poeng i et senere innlegg.
Til slutt er Erikas siste poeng å ta opp argumentet mitt om at Baum et al. (2016) "kirsebærplukket" hvilke gener de ville bruke når de konstruerte fylogenien: de brukte bare gener de hevdet var "fylogenetisk informative", noe som kan innebære en manipulert kortstokk. Hun tok virkelig ikke opp argumentet mitt og kom i stedet med en kommentar om foreldreløse gener.


Oppsummert
Jeg følte ikke at Erika ga bevis for hvordan (eksperimentelt) eller hvorfor (konseptuell) felles design ikke kunne resultere i genetiske likheter mellom arter. I stedet er det bevis på designavhengig genetisk likhet som eksploderer rundt meg. Jeg ser det i det kunstige utvalget for hunder (avl for spesifikke egenskaper). Jeg utførte det selv i laboratoriet ved hjelp av rekombinant DNA-teknologi. Og jeg ser at det blir drømt om for fremtiden, som å bringe utrolige fremskritt innen menneskers helse ved å bruke CRISPR-Cas9. Dette er alle bevis-av-prinsipp eksempler på at design kan og vil produsere genetisk likhet i forskjellige organismer. Fordi denne mekanismen er godt etablert, når vi observerer genetisk likhet, kan vi ikke nekte å inkludere design i samtalen.

I mitt neste innlegg vil jeg forklare hvorfor jeg tror Gutsick var forvirret over innvendingen jeg reiste tidligere mot den separate forfedremodellen i Baum et al. (2016) papir og forsøk å forklare ID-posisjonen tydeligere.

Hvorfor denne separate forfedremodellen er "helt urealistisk"
Emily Reeves; 5. august 2022 Oversatt herfra.

Bilde 3. Øgle

øgle
I et innlegg i går skisserte jeg hvordan Erika, også kjent som den populære evolusjons-youtuberen "Gutsick Gibbon", kritiserte mitt tidligere innlegg, som kommenterte en viktig artikkel innen fylogenetikk, Baum et al. (2016), som påsto å teste separate aner. Mellom 7:55 og 9:24 i responsvideoen hennes viser Erika et diagram for å svare på poenget mitt om at Baum et al. (2016) testet en modell av separate aner som ikke er godkjent av noen i ID-samfunnet.

 


Her er hva Erika, aka Gutsick Gibbon, sier. I diagrammet har hun to forskjellige modeller for hva kreasjonister (til venstre) og tilhengere av intelligent design (ID) (til høyre) kan si. (Merk at hun er uenig i begge; hun prøver bare å beskrive hva hun tror gruppene sier.) Hver "finger" i diagrammet er ment å representere et tilfelle der designeren handlet for å påvirke forløpet av biologisk historie. Det venstre treet skal vise hva hun tror kreasjonistens modell er som ble testet av Baum et al. (2016). Hun tror feilaktig at ID-tilhengere er sinte fordi vi virkelig legger frem en modell som diagrammet til høyre - der en designer oppretter en gruppe, men deretter tillater evolusjonær triksing. Så hun tror vi er opprørt fordi Baum et al. (2016) inkluderte ikke triksing i modellen deres. Dette er faktisk ikke tilfelle.


Da jeg argumenterte for at Baum et al. (2016) mislyktes i å teste separate aner på riktig måte, noe som ikke har noe å gjøre med en unnlatelse av å inkorporere "flikking" i modellen. Som en sidebemerkning er det heller ikke mange eller de fleste ID-tilhengere som tar til orde for en "flikkende" hypotese. Dette er en vanlig misforståelse om ID-synet. I stedet er den primære innvendingen fra ID-tilhengere mot Baum et al. (2016) artikelen skyldes hvordan de separate herkomst- og familiemodellene ble opprettet i utgangspunktet. Kort sagt, Baum et al. (2016) antar at stokking av synapomorfiene er en nøyaktig modell for separate aner. ID-tilhengere og andre som har et designbasert perspektiv vil på det sterkeste avvise det, av grunner jeg skal forklare.

 

Et delsett av data for den separate Ancestry-modellen
Baum et al. (2016) bruker flere forskjellige datasett for å teste separate aner. Deres molekylære datasett, vårt fokus her, er fra en artikkel fra 2011 av Perelman et al. hvor 54 gener ble brukt til å konstruere en molekylær fylogeni av levende primater. (Vi vil kalle dette "Perelman-datasettet.") Primater har alle rundt 30 000 gener, så det første spørsmålet er hvordan forfatterne kom fra 30 000 gener til 54. Legg merke til detaljene gitt fra Perelman et al. (2011):
En komplett liste over 54 primersett brukt i denne studien er presentert i tabell S2. Denne listen inkluderer primere fra tidligere studier (Murphy et al. 2001), samt de som er utviklet spesielt for denne studien ved bruk av en unik bioinformatikktilnærming (Pontius, upubliserte data). (Perelman et al. 2011)
Hvis du ser på tabell S2 i kan du se at majoriteten (38 av de 54 genene) kom enten fra Murphy et al. (2001) (9 gener) eller ble spesialdesignet for studien og ingen detaljer er gitt (29 gener). For vårt formål, la oss bare se på de 9 hentet fra Murphy et al. (2001) som beskrives som valgt på følgende måte:
GenBank- og UniGene-databasene (NCBI) ble søkt etter gener med eksoner med tilstrekkelig lengde (>200 bp) og variabilitet (80-95 % nukleotididentitet mellom mus og menneske), og ga dermed tilstrekkelig variasjon for formålet med fylogenetisk og somatisk celle/ strålingshybridkartlegging. (Murphy et al. 2001)

Hva skjer her?
To typer seleksjon eller filtrering foregår når de velger gener for studien. Det første utvalget er å fjerne gener som ikke finnes i alle artene de studerte. Med andre ord måtte genene være innenfor databasene, være av tilstrekkelig størrelse og eksistere i alle artene som vurderes. Dette utelukker artsspesifikke gener som foreldreløse gener. Det andre utvalget er at gener med det største antallet fylogenetisk informative steder eller synapomorfier ble valgt. (En synapomorfi er en variant/egenskap som deles av minst to etterkommertaxa og antas å være arvet fra en siste felles stamfar, der den utviklet seg.) For å vinne ved dette andre utvalget, bør et gen ha det største antallet av varianter som er forskjellige mellom minst to taxa, men på samme måte (dvs. på sted 1 har to taxa 'A'er mens forfedrestedet var en 'G'). En enklere måte å si dette på er at de plukket gener som varierte mest mellom arter, men på en sannsynlig funksjonell måte. Hvis du ser på tabell 1 fra Murphy et al (2001) kan du se at ADORA3-genet har 191 fylogenetisk informative steder av 330 basepar. Det betyr at det ved 191 stillinger skiller seg mellom minst to av sammenligningstaksaene på en konsistent måte. For å hjelpe bedre å forstå hvorfor disse filtrene manipulerer kortene fra et designperspektiv, vil jeg gi en analogi.


La oss gjøre et tankeeksperiment der vi ønsker å lage et avstandstre som demonstrerer utviklingen av husholdningsstoler. Vi velger fem egenskaper å sammenligne. Disse fem egenskapene må vises av alle stolene, og de fem egenskapene må variere mellom minst to stoler. Denne typen valg eliminerer effektivt unike egenskaper til stolene som skinn fordi ikke alle stoler har dette. I stedet prioriteres spesifikke deler av stoler som ble gjort med vilje forskjellige av funksjonelle eller økonomiske årsaker. Denne typen valg på et designet objekt, for eksempel en stol, vil skape et intuitivt hierarkisk tre selv om stolene egentlig ikke er relatert. Hvordan? Les videre.


For eksempel, skruer, som holder stoler sammen, er sannsynligvis en egenskap som deles av alle stoler (første kriterium bestått), men skruer vil sannsynligvis ikke variere mye mellom stoler og vil derfor ikke bli valgt som en egenskap. På den annen side er ben en egenskap som deles av alle stoler og disse vil sannsynligvis variere ganske mye mellom ulike stoler basert på stolens funksjon. Barnestoler vil ha kortere ben. Dekorative stoler vil ha estetisk tiltalende ben. Sammenleggbare stoler vil ha sammenleggbare ben. Noen stoler kan ha fire ben mens andre fem eller enda flere. Seter er et annet eksempel på en egenskap som vil være felles for alle, men som varierer mye. Barneseter på stoler vil være mindre. Dekorative stoler vil ha estetisk tiltalende seter. Sammenleggbare stoler vil ha mobile seter. Dermed beriker et utvalg for "annerledeshet" med designet objekter for egenskaper som grupperer seg på grunn av funksjonelle begrensninger eller kompatibilitet, ikke aner. Hvis organismer faktisk er utformet, kan et veldig lignende fenomen forekomme i disse fylogenetiske sammenligningene.

Temaet fortsetter her.

 

EMILY REEVES

Emily Reeves
Emily Reeves er en biokjemiker, metabolsk ernæringsfysiolog og aspirerende systembiolog. Doktorgradsstudiene hennes ble fullført ved Texas A&M University i biokjemi og biofysikk. Emily er for tiden en aktiv kliniker for metabolsk ernæring og ernæringsgenomikk ved Nutriplexity. Hun liker å identifisere og designe ernæringsintervensjon for subtile medfødte feil i stoffskiftet. Hun jobber også med stipendiater fra Discovery Institute og det større vitenskapelige samfunnet for å fremme integrering av ingeniørvitenskap og biologi. Hun tilbringer helgene sine på eventyr med mannen sin, brygger kombucha og løper i nærheten av Puget Sound.

 

Oversettelse og bilder ved Asbjørn E. Lund