Techniken aus dem Machine Learning: Sentence Embeddings und andere Gewichtungsstrategien

In unserem neuesten Blogpost auf medium.com veranschaulicht unser Data Scientist Jan Paulus anhand von Code-Beispielen, wie man das Machine-Learning-Konzept der Sentence Embeddings in der Praxis einsetzt und welche unterschiedlichen Gewichtungsstrategien dabei verwendet werden können.

Die Suche nach signifikanten Features als Input für Machine-Learning-Modelle ist ein wichtiger Teil der Arbeit des Data Teams bei snapADDY. Einer der erfolgreichsten Ansätze sind sogenannte Word Embeddings, die es ermöglichen, Wörter mit ähnlichen Bedeutungen auf ähnliche Weise darzustellen. Die gleiche Funktionalität wünscht man sich in vielen Anwendungsfällen nicht nur auf der Ebene von einzelnen Wörtern, sondern von ganzen Sätzen. Im neuen Artikel im snapADDY Tech-Blog geht es darum, wie man Sentence Embeddings auf Grundlage von vortrainierten Word Embeddings berechnen kann und welche verschiedenen Strategien für die Aggregation verwendet werden können.