En estadística y campos relacionados, una medida de similitud o función de semejanza o la semejanza métrica es un función real-valuada que cuantifica la semejanza entre dos objetos, aunque no existe una definición única de similitud. Normalmente tales medidas son en algún sentido el inverso de las distancias métricas: toman valores grandes para objetos similares y toman el valor cero o un valor negativo para objetos muy disímiles. Aun así, en términos generales, una función de semejanza también puede satisfacer axiomas métricos.
La similitud coseno es una similitud generalmente utilizada para vectores real-valuados, utilizada en (entre otros campos) la búsqueda de información para puntuar la semejanza de documentos en el modelo de espacio vectorial. En aprendizaje automático, funciones kernel comunes como el kernel RBF pueden ser vistas como funciones de semejanza.[1]