3 sur 7

Sword Career

Offres d’emploi

Votre sélection


DataAnalytics

Métier
Localité
Rémunération
Selon profil
Contrat
Stage
Référence de l'offre
SSLST05

Analyses et DataVisualization autour d’un corpus de données médicales

 

Contexte

Une des grandes difficultés des applications mettant en œuvre des technologies de Traitement Automatique du Langage Naturel est de mesurer la qualité obtenue sur le corpus pouvant comprendre des dizaines de millions de comptes rendus.

Les applications que nous développons permettent d’extraire des informations inconnues de nos clients, il est souvent impossible de confronter les résultats obtenus avec ceux attendus.

L’idée des travaux proposés est de mettre en place un panoplie de mesures statistiques couvrant toutes les informations extraites et d’observer, non pas de manière absolue les valeurs relevées mais  leurs variations au fil de l’évolution de nos traitements.

Missions

La mission intègre du développement et de l’analyse de données :

  • Constitution d’une base de statistiques à partir des variables extraites d’un corpus à chaque exécution d’une chaîne de traitement : nb de cancers par localisation, nb de traitements par chimiothérapie, nb de lignes de traitements, nb de séquences de tels type,
  • Collecte des concepts élémentaires extraits par les Traitements Automatiques du Langage Naturel
  • Réalisation de tableaux de bord et visualisation des données collectées
  • Analyse des variations entre chaque exécution

Technologies

  • Elastic Search + Logstash + Kibana, Beats
  • Spacy NLP
  • Python, Gensim Topic Modeling

Encadrement

  • Architecte Machine Learning & Data Analytics
  • Chef de projet spécialisé

Compétences

  • Autonomie, méthode, sens de l’organisation
  • Développement
  • Analyse de données

Mettez à jour votre navigateur pour consulter ce site