Um gene sobreposto (ou overlapping gene - OLG)[1][2] é um gene cuja sequência de nucleotídeos expressáveis se sobrepõe parcialmente à sequência de nucleotídeos expressáveis de outro gene.[3] Dessa forma, uma sequência de nucleotídeos pode contribuir para a função de um ou mais produtos gênicos. Os genes sobrepostos estão presentes e são uma característica fundamental dos genomas celulares e virais.[2] A definição atual de um gene sobreposto varia significativamente entre eucariotos, procariotos e vírus.[2] Em procariotos e vírus, a sobreposição deve ser entre regiões de codificação, mas não entre transcritos de mRNA, e é definida quando essas sequências de codificação compartilham um nucleotídeo na mesma fita ou em fitas opostas. Em eucariotos, a sobreposição de genes é quase sempre definida como sobreposição de transcrição de mRNA. Especificamente, uma sobreposição gênica em eucariotos é definida quando pelo menos um nucleotídeo é compartilhado entre os limites das transcrições primárias de mRNA de dois ou mais genes, de modo que uma mutação na base do DNA em qualquer ponto da região sobreposta afetaria as transcrições de todos os genes envolvidos. Essa definição inclui regiões não codificantes (untranslated region - UTRs) de 5′ e 3′, além de íntrons.
O overprinting refere-se a um tipo de sobreposição em que toda ou parte da sequência de um gene é lida em um quadro de leitura alternativo de outro gene no mesmo locus.[4] Acredita-se que as fases de leitura abertas (open reading frame - ORF) alternativos sejam criados por substituições críticas de nucleotídeos em um gene preexistente expressável, que pode ser induzido a expressar uma nova proteína, preservando a função do gene original.[5] A hipótese de overprinting foi levantada como um mecanismo para o surgimento de novos genes a partir de sequências de novo, sejam elas genes mais antigos ou regiões anteriormente não codificantes do genoma.[6] Acredita-se que a maioria dos genes sobrepostos, ou genes cujas sequências de nucleotídeos expressáveis se sobrepõem parcialmente umas às outras, evoluiu em parte devido a esse mecanismo, sugerindo que cada sobreposição é composta por um gene ancestral e um gene novo.[7] Posteriormente, acredita-se que o overprinting também seja uma fonte de novas proteínas, pois as proteínas de novo codificadas por esses novos genes geralmente não têm homólogos remotos nos bancos de dados.[8] Os genes impressos em excesso são características particularmente comuns da organização genômica dos vírus, o que provavelmente aumenta muito o número de genes potencialmente expressáveis a partir de um pequeno conjunto de informações genéticas virais.[9] É provável que a impressão em excesso seja responsável pela geração de várias proteínas novas pelos vírus no decorrer de sua história evolutiva.