Cette opportunité est basée à Lausanne et Zurich

Information extraction from structured and unstructured documents

Appliquer

Companies handle high volume of unstructured documents such as letters, forms or ID scans on a daily basis. A lot of manual work is invested to manually extract from these documents the information necessary to perform a business process (dates, contract number, addresses etc). This internship will focus on automatically extracting information from those unstructured and structured documents. To do so, the student will design and build machine learning and deep learning pipelines, using state of the art libraries. The final goal is to integrate those pipelines into one of our existing NLP services.

In this role

The goal of this internship is to:

  • Build machine learning and deep learning pipelines to extract information from documents written in English, with a possibility to extend it to other languages (e.g. French and German). The intern will be responsible for pre-processing the documents, selecting features, building and evaluating models.
  • Integrate the best models to one of our existing products. The student will have the opportunity to sharpen his software development skills.

Ce que nous proposons

Join our team as intern and you will find a young, dynamic and culturally diverse working environment.

About your profile

  • Interest and strong knowledge in Machine Learning and Natural Language Processing
  • Programming language: Python 3+
  • Deployment: Knowing Docker is a plus

If you are INTERESTED in applying for this position, please send us your complete application (CV, cover letter, letter of reference, diplomas and certificates).

En continuant votre navigation sur ce site, vous acceptez l'utilisation de cookies ou technologies similaires ayant pour finalité la réalisation de statistiques de visites sur notre site (tests et mesures d'audience, de fréquentation, de navigation, de performance), mais également de vous proposer des contenus et annonces ciblés et adaptés à vos centres d'intérêt.

Nos cookies ont été mis à jour. N'hésitez pas à mettre à jour vos préférences.

fermer
save

Gérer vos préférences cookies

Mettre à jour vos préférences cookies

Vous pouvez vous informer sur la nature des cookies déposés, les accepter ou les refuser soit globalement pour l'ensemble du site et l'ensemble des services, soit service par service.

OK, tout accepter

Flux de visiteur

Ces cookies nous offrent un aperçu des sources de trafic et nous permettent de mieux comprendre nos visiteurs, tout en garantissant leur anonymat.

(Google Analytics et CrazyEgg)

Nouveau

Outils de partage

Les cookies de médias sociaux permettent de partager des contenus sur vos réseaux préférés.

(ShareThis)

Nouveau

Connaissance du visiteur

Ces cookies sont utilisés pour suivre les visiteurs sur les sites Internet.

Ils doivent nous permettre d’offrir à nos visiteurs identifiés davantage de contenus pertinents et ciblés (ClickDimensions) et d’afficher des publicités susceptibles d’intéresser les utilisateurs (Facebook Pixels).

 

Nouveau
Pour plus d'informations relatives à la protection de données, cliquez ici.