Quellen

Die erste Pipeline ist auf AADR v66.0 ausgerichtet. Jede exportierte Kartenzeile trägt die AADR-Version, die Sample-ID und, wenn in den Metadaten vorhanden, Publikation, DOI oder URL.

AADR

Allen Ancient DNA Resource, Dataverse DOI 10.7910/DVN/FFIDCW. GeoGen nutzt AADR v66.0 aus Dataverse-Version 10.0, Release 2026-04-13T04:33:11Z. Die verwendete Metadatendatei ist v66.1240K.aadr.PUB.anno, Dataverse File ID 13663706.

Das Importmanifest unter data/import_manifest/aadr-v66-metadata.json hält Download-URL, lokale Rohdatei, Dateigröße und SHA256-Prüfsumme fest. Die Rohdatei liegt nur lokal unter data/raw und wird nicht committed.

Dateiv66.1240K.aadr.PUB.anno
File ID13663706
Rohdatei SHA256a2b204a4d1bedb9d2e2930c1402f8414c1176afb2a1634ad3d6c7b38aaf288b3
GeoJSON SHA2563dbaf4d7c250bddf79091761c1d1f8253d2be02add4d5a22ee5f1389e5367680
Report SHA25687f9d52f200fbe79e00f2fb78d60c3dbee01efe591187434452b12a07171dc9f

Zitationsregel

AADR ist eine kuratierte Sekundärressource. GeoGen bewahrt deshalb neben der AADR-Version auch die Originalstudie, damit spätere Detailansichten die primären Publikationen zitieren können.

Importbericht

AADR-Versionv66.0
Quellzeilen23250
Exportiert12935
Ausgeschlossen10315
Timeline12931
Außerhalb Timeline4

Der Importbericht wird bei jedem Pipeline-Lauf neu geschrieben. Er zählt verworfene Zeilen nach Grund und zeigt, welche Qualitäts- und Quellenfelder in den exportierten Kartenpunkten vorhanden sind.

Assessment100%12935 vorhanden, 0 fehlt
Assessment Warnings15%1997 vorhanden, 10938 fehlt
Coverage96%12356 vorhanden, 579 fehlt
Date Range100%12935 vorhanden, 0 fehlt
Dating Method100%12935 vorhanden, 0 fehlt
Genetic Id100%12935 vorhanden, 0 fehlt
Individual Id100%12935 vorhanden, 0 fehlt
Locality100%12935 vorhanden, 0 fehlt
Original Date100%12935 vorhanden, 0 fehlt
Sex100%12935 vorhanden, 0 fehlt
Snp Count100%12935 vorhanden, 0 fehlt
Source Citation100%12935 vorhanden, 0 fehlt
missing coordinates178Zeilen ausgeschlossen
non european or missing country8890Zeilen ausgeschlossen
outside europe bounds1247Zeilen ausgeschlossen

Qualitätsverteilung

CRITICAL224exportierte Zeilen
MERGE_CRITICAL2exportierte Zeilen
MERGE_PASS99exportierte Zeilen
MERGE_QUESTIONABLE4exportierte Zeilen
PROVISIONAL_CRITICAL54exportierte Zeilen
PROVISIONAL_PASS1128exportierte Zeilen
PROVISIONAL_QUESTIONABLE7exportierte Zeilen
Pass10825exportierte Zeilen
Questionable592exportierte Zeilen
0 1 to lt 0 52681Samples
0 5 to lt 11611Samples
gte 16070Samples
lt 0 11994Samples
missing579Samples

Keine Genotypdaten im ersten Meilenstein

Rohdaten und große Genotypdateien bleiben außerhalb von Git und werden nicht auf den App-Server geladen. Der Import erzeugt nur kleine Metadatenartefakte für Karte, Filter und Quellenanzeige.

Laktaseanalyse

Die erste Analyseartefakt-Datei ist public/data/lactase-persistence-alpha.json. Sie enthält keine großen Genotypdaten, sondern pro Karten-Individuum nur den abgeleiteten Markerstatus für `rs4988235`, Missingness und wenige methodische Felder. Die wissenschaftliche Markerbegrenzung ist in docs/LACTASE_MARKER_REVIEW.md dokumentiert.

Haarpigmentierung

Die vorbereitete Haarpigmentierungsansicht nutzt als Startpunkt das HIrisPlex-Haarmarker-Set. Die erste öffentliche Review-Datei public/data/hair-marker-presence-alpha.json dokumentiert, welche Marker im AADR-v66-1240K-Panel vorhanden sind. Das zweite Artefakt public/data/hair-pigmentation-alpha.json enthält pro Individuum Markerabdeckung und den direkt beobachteten KITLG-rs12821256-Status. Eine Haarfarbkarte wird erst nach gesondertem Score-Review veröffentlicht.

Landmaske

Für die Flächenfärbung nutzt GeoGen Natural Earth `ne_50m_land` als lokale Landmaske unter public/data/ne-50m-land.geojson. Die Laktasefläche wird dynamisch im Kartenlayer berechnet und mit dieser Maske auf Land begrenzt; es wird kein statisches Flächenartefakt mehr ausgeliefert.