Eine DNA-Sequenzanalyse ist in der Molekularbiologie und Bioinformatik die automatisierte, computergestützte Bestimmung von charakteristischen Abschnitten, insbesondere von bekannten Genen und vermuteten Genen, auf einer DNA-Sequenz. Untersucht werden die bei der DNA-Sequenzierung gewonnenen Informationen über die Abfolge und Position der Basenpaare. Die Resultate dieser Tätigkeit werden auch Annotationen genannt, wobei sich die Sequenzanalyse nicht nur auf Annotationsmethoden beschränkt.
Die Analyse von DNA-Sequenzen wurde durch die Verfügbarkeit großer genomischer Datenmengen und der Notwendigkeit ihrer Interpretation bedingt. Viele der für Nukleotid-Sequenzen entwickelten Methoden lassen sich auch genauso oder mit geringfügigen Modifikationen auf Aminosäure-Sequenzen, also die Primärstruktur von Proteinen anwenden. Die Methoden, die zum überwiegenden Teil den so genannten Stringalgorithmen zuzurechnen sind, lassen sich – bei Vernachlässigung der Biologie-spezifischen Einschränkungen – sogar auf beliebige Symbolsequenzen übertragen.
Sequenzanalysen können durch folgende Probleme motiviert werden: