Расстояние Jaro является мерой сходства между двумя строками. Чем выше расстояние Jaro для двух строк, тем более похожи строки. Оценка нормализуется так, что 0 не приравнивается к подобию, а 1 - точное совпадение. Определение Расстояние Jaro \ (d_j \) двух заданных строк \ (s_1 \) и \ (s_2 \) - это \ begin {align} d_j = \ begin {cases} 0 & & \ text {if} m = 0 \\\ \ {\ frac {1} {3}} \ left ({\ frac {m} {| s_ {1} |}} + {\ frac {m} {| s_ {2} |}} + {\ frac { mt} {m}} \ right) & & \ text {other} \ end {cases} \ end {align} Где:
- \ (m \) - количество совпадающих символов ;
- \ (t \) - половина числа транспозиций .
Два символа из \ (s_1 \) и \ (s_2 \) соответственно, считаются совпадающими, только если они одинаковы, а не дальше \ (\ left \ lfloor \ frac {\ max (| s_1 |, | s_2 |)} {2} \ право \ rfloor-1 \). Каждый символ \ (s_1 \) сравнивается со всеми его совпадающими символами в \ (s_2 \). Количество совпадающих (но разных порядковых порядков) символов, деленное на 2, определяет количество транспозиций . Пример. С учетом строк \ (s_1 \) DWAYNE и \ (s_2 \) DUANE находим: - \ (т = 4 \)
- \ (| s_1 | = 6 \)
- \ (| s_2 | = 5 \)
- \ (t = 0 \)
Мы находим оценку Джаро: \ (d_j = \ frac {1} {3} \ left (\ frac {4} {6} + \ frac {4} {5} + \ frac {4-0} {4} \ right) = 0.822 \). Напишите функцию a, которая принимает две строки в качестве параметров и возвращает связанное расстояние Jaro.