Techniques d'apprentissage automatique : le sentence embedding et autres stratégies de pondération

par

Dans notre dernier article de blog medium.com, notre Data Scientist Jan Paulus illustre, à l'aide d'exemples de code, comment utiliser le concept d'apprentissage automatique de sentence embedding (ou plongement lexical en francais) et quels types de stratégies de pondération peuvent être utilisés.

Trouver des caractéristiques significatives pour enrichir les modèles d'apprentissage automatique est un élément fondamental du travail de l'équipe chargée des données chez snapADDY. L'une des approches les plus réussies est le word embedding (ou plongement de mots), qui permet d'attribuer des valeurs similaires à des mots ayant des significations similaires. La même fonction est recherchée dans de nombreux cas d'utilisation, non seulement avec des mots isolés mais aussi avec des phrases entières. Le nouvel article sur le blog technique de snapADDY explique comment calculer les sentences embeddings à partir des word embeddings préalablement formés et quels types de stratégies peuvent être utilisés pour l'agrégation.

Note :L'article est disponible uniquement en anglais.