SuperTreeBASE

SuperTreeBase source code

Background & context
TreeBASE (treebase.org) is de publieke database waarin gepubliceerde fylogenieen worden opgeslagen. Om een overzicht te krijgen van de taxonomische compositie en de consensus van het fylogenetische signaal in de database moet er een "supertree" gebouwd worden, d.w.z. een fylogenetische boom die gebaseerd is op kleinere, overlappende bomen. In het geval van TreeBASE is dit een grote technische uitdaging aangezien de database meer dan 3000 bomen omvat die in totaal ongeveer 40.000 soorten beslaan. De resulterende supertree zal gepubliceerd worden en weergegeven worden op de homepage van TreeBASE met behulp van het visualisatieprogramma OneZoom (http://www.onezoom.org/).

Super tree base details

Objectives & goals
Doel is de oplevering van een grote fylogenie waarvan de kwaliteit uitgedrukt kan worden en de onderliggende data herleid kan worden.

Methods, tasks & approach
Integratie en analyse van bestaande data. Een pipeline hiervoor is al gebouwd (http://github.com/rvosa/supertreebase), de grootste uitdaging die nog uitstaat is het analyseren van de gecombineerde data in het programma TNT (http://tnt.insectmuseum.org/). Eerste tests wijzen uit dat de T7600 workstation in principe voldoende geheugen heeft, maar onderdeel van het project zal zijn om de analyse op juiste manier op te zetten en de resultaten te verifieren, inclusief visualisatie m.b.v. OneZoom (http://www.onezoom.org/).

Requirements
Kennis van en ervaring met: Linux omgeving, uitvoeren van programma's op de command line. Ervaring met programmeren in scripting talen (Perl of Python). Ervaring met build tools ("make") en version control ("git") is een pre. De kandidaat moet beschikken over zelf-motivatie en inventiviteit om uitdagingen die zich aandienen op te lossen, onder begeleiding.

Supervisor
Rutger Vos

Contact
rutger.vos@naturalis.nl

Period & duration
Doorlopend. Om dit project in goede orde af te ronden zijn een aantal maanden (bv.: 6+) nodig, bijvoorbeeld een HBO afstudeerstage.

Study & level
Bioinformatics / computational biology / evolutionary biology. HBO/WO