string-similarity · GitHub Topics

rapidfuzz / RapidFuzz

Rapid fuzzy string matching in Python using various string metrics

翻译 - 使用Levenshtein距离的Python和C ++快速模糊字符串匹配

string-matching string-similarity string-comparison levenshtein Python C++levenshtein-distance

Python 3.02 k

1 天前

aceakash / string-similarity

Finds degree of similarity between two strings, based on Dice's Coefficient, which is mostly better than Levenshtein distance.

翻译 - 根据Dice系数找出两个字符串之间的相似度，该相似度通常比Levenshtein距离更好。

JavaScript dice-coefficient string-comparison string-similarity strings

JavaScript 2.53 k

2 年前

adrg / strutil

Go metrics for calculating string similarity and other string utility functions

string levenshtein jaro jaro-winkler string-similarity string-matching dice-coefficient hamming-distance Go

Go 371

19 天前

rapidfuzz / Levenshtein

The Levenshtein Python C extension module contains functions for fast computation of Levenshtein distance and string similarity

Python levenshtein levenshtein-distance string-matching string-similarity string-comparison Hacktoberfest

C++ 312

2 天前

rapidfuzz / rapidfuzz-cpp

Rapid fuzzy string matching in C++ using the Levenshtein Distance

C++levenshtein string-matching string-similarity string-comparison Hacktoberfest

C++ 289

2 个月前

rieck / harry

#计算机科学#A Tool for Measuring String Similarity

机器学习 string-similarity

C 116

6 年前

rapidfuzz / python-Levenshtein

The Levenshtein Python C extension module contains functions for fast computation of Levenshtein distance and string similarity

levenshtein levenshtein-distance Python string-matching string-similarity Hacktoberfest

113

1 个月前

usc-isi-i2 / rltk

Record Linkage ToolKit (Find and link entities)

Python 110

2 年前

Daniel-Liu-c0deb0t / triple_accel

#算法刷题#Rust edit distance routines accelerated using SIMD. Supports fast Hamming, Levenshtein, restricted Damerau-Levenshtein, etc. distance calculations and string search.

Rust simd avx2 levenshtein hamming 算法 string-matching string-search string-similarity sse dynamic-programming

Rust 108

2 年前

stephenjjbrown / string-similarity-js

Lightweight string similarity function for javascript

TypeScript JavaScript string fuzzy search fuzzy-search string-similarity misspell

JavaScript 100

1 年前

agext / levenshtein

Levenshtein distance and similarity metrics with customizable edit costs and Winkler-like bonus for common prefix.

levenshtein levenshtein-distance string-similarity awesome-go

Go 87

4 年前

searchhub / preDict

Lightning fast spell correction / fuzzy search library based on SymSpell by Commerce-Experts

spellcheck fuzzy-search fuzzy-matching approximate-string-matching spell-check string-similarity spellchecker spelling-correction spelling-checker spell-checker

Java 81

7 年前

vickumar1981 / stringdistance

A fuzzy matching string distance library for Scala and Java that includes Levenshtein distance, Jaro distance, Jaro-Winkler distance, Dice coefficient, N-Gram similarity, Cosine similarity, Jaccard si...

levenshtein-distance levenshtein ngram jaro jaro-winkler dice-coefficient hamming-distance string-similarity cosine-similarity fuzzy-matching Hacktoberfest

Scala 78

3 年前

Daniel-Liu-c0deb0t / UMICollapse

Accelerating the deduplication and collapsing process for reads with Unique Molecular Identifiers (UMI). Heavily optimized for scalability and orders of magnitude faster than a previous tool.

Java hamming string-similarity string-search Entity resolution fastq 数据结构

Java 72

1 年前

rapidfuzz / JaroWinkler

Python library for fast approximate string matching using Jaro and Jaro-Winkler similarity

jaro jaro-winkler Python string-similarity string-matching string-comparison C++Hacktoberfest

Python 70

1 年前