Arbeitsort dieser Stelle Lausanne

Cross-lingual Toxicity Detection (Diploma Thesis/Internship)



Online interaction is nowadays prevalent in the life of many people, and the youngest who use social media and instant messaging platforms the most are also the most vulnerable. As discussions can sometimes get heated, users might face personal insults, harassment or other kinds of hate messages.

Several solutions to this problem are already in use: manual or keyword-based censorship, moderators or user flagging toxic messages, etc. But these systems either need constant surveillance by human moderators or can be abused (users flagging a message for no reason or using new non-blacklisted words to prevent censorship).

The goal of this project is to guarantee users a safe and healthy experience in online chats by implementing an intelligent moderating system able to detect and identify toxic messages to assist moderators in their task.


Challenges: In this project, it is necessary to identify correctly and in a timely manner different classes of toxicity in online discussions, where the messages can be produced in large volumes and variety. It is also important that this internship aims towards cross-lingual models, namely using aligned datasets to train a model on multiple languages will be necessary. Moreover, the annotated datasets available might come from different sources, and thus contain different labels. Being able to merge these datasets will be required as well.


Project applications: Social media/online discussions/chatbots

What you will learn: You will be a junior data scientist, developing your skills in machine learning (deep learning, natural language processing).


Possible extensions: Integrating the model with a moderating chatbot to test it with users online.

Keywords: NLP, toxicity detection, multi-label classification, cross-lingual models, transfer learning, text embeddings

In this role

In this project, the goal is to:

  • Build a model able to detect and identify toxic messages
  • Use transfer learning to train the model on several languages

What we offer

Diploma Thesis / Internship in Lausanne. Join our team as intern and you will find a young, dynamic and culturally diverse working environment.

    About your profile

    • Required: machine learning and deep learning, NLP
    • Software engineering, Python, deep leaning/ML libraries (keras, tensorflow, scikit-learn, nltk, spaCy, etc.)

    If you are INTERESTED in applying for this position, please send us your complete application (CV, cover letter, letter of reference, diplomas and certificates).

    Wenn Sie auf dieser Website weitersurfen, akzeptieren Sie die Nutzung von Cookies oder ähnlichen Technologien, welche die Erstellung von Zugriffstatistiken für unsere Website bezwecken (Tests und Messungen von Zielgruppen, Besuchen, Surfverhalten und Performance), die Ihnen aber auch gezielt auf Ihre Interessen abgestimmte Inhalte und Inserate anbieten.

    Wir haben unsere Cookies aktualisiert. Zögern Sie nicht, Ihre Präferenzen ebenfalls zu aktualisieren.


    Ihre Cookie-Präferenzen setzen

    Ihre Cookie-Präferenzen aktualisieren

    Sie können sich über die Art der hinterlegten Cookies informieren, sie akzeptieren oder ablehnen, sei es für die gesamte Website und alle Services oder einzeln für jeden Service.

    OK, alles annehmen


    Diese cookies verschaffen uns Einblick in Traffic-Quellen und ermöglichen uns ein besseres, anonymisiertes Verständnis unserer Besucher.

    (Google Analytics und CrazyEgg).



    Cookies von sozialen Medien erlauben ein Teilen von Inhalten in Ihren bevorzugten Netzen.



    Verständnis der Besucher

    Diese cookies werden verwendet, um Besucher über verschiedene Websites hinaus zu verfolgen.

    Dadurch wollen wir relevantere, zielgerichtete Inhalte für bestehende Kontakte anbieten (ClickDimensions) und Inserate anzeigen können, die für die Benutzer nützlich und ansprechend sind (Facebook Pixels).


    Weitere Angaben zu diesen Cookies und unserer Cookie-Richtlinie finden Sie hier.