Quellen
Die erste Pipeline ist auf AADR v66.0 ausgerichtet. Jede exportierte Kartenzeile trägt die AADR-Version, die Sample-ID und, wenn in den Metadaten vorhanden, Publikation, DOI oder URL.
AADR
Allen Ancient DNA Resource, Dataverse DOI 10.7910/DVN/FFIDCW. GeoGen nutzt AADR v66.0 aus Dataverse-Version 10.0, Release 2026-04-13T04:33:11Z. Die verwendete Metadatendatei ist v66.1240K.aadr.PUB.anno, Dataverse File ID 13663706.
Das Importmanifest unter data/import_manifest/aadr-v66-metadata.json hält Download-URL, lokale Rohdatei, Dateigröße und SHA256-Prüfsumme fest. Die Rohdatei liegt nur lokal unter data/raw und wird nicht committed.
Zitationsregel
AADR ist eine kuratierte Sekundärressource. GeoGen bewahrt deshalb neben der AADR-Version auch die Originalstudie, damit spätere Detailansichten die primären Publikationen zitieren können.
Importbericht
Der Importbericht wird bei jedem Pipeline-Lauf neu geschrieben. Er zählt verworfene Zeilen nach Grund und zeigt, welche Qualitäts- und Quellenfelder in den exportierten Kartenpunkten vorhanden sind.
Qualitätsverteilung
Keine Genotypdaten im ersten Meilenstein
Rohdaten und große Genotypdateien bleiben außerhalb von Git und werden nicht auf den App-Server geladen. Der Import erzeugt nur kleine Metadatenartefakte für Karte, Filter und Quellenanzeige.
Laktaseanalyse
Die erste Analyseartefakt-Datei ist public/data/lactase-persistence-alpha.json. Sie enthält keine großen Genotypdaten, sondern pro Karten-Individuum nur den abgeleiteten Markerstatus für `rs4988235`, Missingness und wenige methodische Felder. Die wissenschaftliche Markerbegrenzung ist in docs/LACTASE_MARKER_REVIEW.md dokumentiert.
Haarpigmentierung
Die vorbereitete Haarpigmentierungsansicht nutzt als Startpunkt das HIrisPlex-Haarmarker-Set. Die erste öffentliche Review-Datei public/data/hair-marker-presence-alpha.json dokumentiert, welche Marker im AADR-v66-1240K-Panel vorhanden sind. Das zweite Artefakt public/data/hair-pigmentation-alpha.json enthält pro Individuum Markerabdeckung und den direkt beobachteten KITLG-rs12821256-Status. Eine Haarfarbkarte wird erst nach gesondertem Score-Review veröffentlicht.
Landmaske
Für die Flächenfärbung nutzt GeoGen Natural Earth `ne_50m_land` als lokale Landmaske unter public/data/ne-50m-land.geojson. Die Laktasefläche wird dynamisch im Kartenlayer berechnet und mit dieser Maske auf Land begrenzt; es wird kein statisches Flächenartefakt mehr ausgeliefert.