- similar_text: documentation ( source)
<?php
$arrErros = array('teste de log 1','log vermelho com preto','log amarelo e roxo','quatro paredes em azul','azul eh a cor do oceano','no ocenano tem peixes marinhos','vermelho nao combina com azul',);
//THRESHOLD PARA CĂLCULO DE SIMILARIDADE
$threshold = 60;
//INDEXAR VETOR DE PESQUISA
$matriz_indexada = array();
$matriz_resultado = array();
foreach ($arrErros as $chave => $valor){
$matriz_indexada[$chave]['valor'] = $valor;
$matriz_indexada[$chave]['chave'] = $chave;
$matriz_indexada[$chave]['used'] = 0;
}
//CONSTRUIR VETOR DE SIMILARIDADE
$totallinha = count($matriz_indexada);
for ($i=0; $i<$totallinha-1; $i++){
$matriz_resultado[$i]['mensagem'] = $matriz_indexada[$i]['valor'];
$matriz_resultado[$i]['count'] = 1;
if ($matriz_indexada[$i]['used'] != 1){
for ($j=$i+1; $j<$totallinha; $j++){
similar_text($matriz_indexada[$i]['valor'], $matriz_indexada[$j]['valor'], $percent);
if (($percent >= $threshold)){
$matriz_indexada[$j]['used'] = 1;
//$matriz_resultado[$i]['mensagem'] = $matriz_resultado[$i]['mensagem']."<BR>".$matriz_indexada[$j]['valor'];
$matriz_resultado[$i]['mensagem'] = $matriz_resultado[$i]['mensagem'];
$matriz_resultado[$i]['count']++;
}
}
}
}
//ORDENAR VETOR COM BUBBLE SORT
$totallinha = count($matriz_resultado);
for ($i=0; $i<$totallinha-1; $i++){
for ($j=0; $j<$totallinha-1; $j++){
if ($matriz_resultado[$i]['count'] > $matriz_resultado[$j]['count']){
$mensagem = $matriz_resultado[$i]['mensagem'];
$count = $matriz_resultado[$i]['count'];
$matriz_resultado[$i]['mensagem'] = $matriz_resultado[$j]['mensagem'];
$matriz_resultado[$i]['count'] = $matriz_resultado[$j]['count'];
$matriz_resultado[$j]['mensagem'] = $mensagem;
$matriz_resultado[$j]['count'] = $count;
}
}
}