3 sur 7

Sword Career

Offres d’emploi

Votre sélection


Reconnaissance d’entités

Métier
Localité
Rémunération
Selon profil
Contrat
Stage
Référence de l'offre
SSLST07

Reconnaissance d’entités grâce à l’arbre syntaxique

 

Contexte

Il existe deux techniques de reconnaissance d’entités nommées (NER), l’une statistique par Machine Learning et l’autre basée sur des règles grammaticales.

L’approche Machine Learning est exigeante en terme de jeux d’apprentissage (volume important, annotation harmonisée).

Afin d’accélérer les intégrations et de libérer du temps d’annotation, une méthode par règles grammaticales est en cours de développement.

L’objectif du stage est d’approfondir cette méthodologie, en couplant les résultats issus de SpaCy avec l’outil Sinequa et en catégorisant les relations des entités extraites.

L’objectif fonctionnel du stage est d’accélérer une tâche de vérification documentaire en analysant des documents de travail puis en proposant les extraits pertinents aux auditeurs.

Missions

  • État de l’art sur le sujet
  • Interface entre Sinequa et le service de NER
    de SpaCy
  • Exploitation graphique des résultats dans Sinequa
  • Missions potentielles :
    • Renforcement de la méthodologie grâce
      à la similitude sémantique (vecteur de mot)
    • Gestion des coréférences via neural coref
    • Gestion de coréférences non pronominales
    • Utilisation des résultats pour de l’apprentissage semi-supervisé en Machine Learning

Technologies

 

Encadrement

  • Architecte Search & Sémantique
  • Chef de projet spécialisé

Compétences

  • Autonomie, méthode, sens de l’organisation
  • Rigueur de tests
  • Intuition
  • Développement objet
  • Python

 

 

Mettez à jour votre navigateur pour consulter ce site