Aller au contenu principal

Compétences

TAL

  • chaine de traitement de langage:
    • segmentation
    • tokenisation
    • lemmatisation
    • analyse morpho-syntaxique
    • analyse syntaxique (en dépendances et en constituants)
    • analyse sémantique (avec FrameNet)
    • détection d'entités nommées
    • résolution de coréférence
    • résumé automatique (principalement extractif)
  • Théorie de graphes
  • chaines de markov
  • Programmation en nombres entiers

Dev

Langages et librairies

  • Python - langage principal depuis 2014
    • Spacy - 2019-aujourd'hui
    • pytest - 2022-aujourd'hui (oui j'ai découvert le TDD sur le tard)
    • Flask - à petites doses depuis 2020
    • NLTK - 2017-2018
    • Scikit - 2014-aujourd'hui
    • Tensorflow - à petites doses depuis 2017
    • keras - utilisé pendant ma thèse quand torch et tensorflow n'étaient pas encore facilement utilisables
  • bash : pratiqué depuis 2008
  • LaTeX : plus utilisé depuis la fin de la rédaction de ma thèse en 2017!
  • Rust : j'essaye de temps à autres de m'y mettre depuis 2020
  • Go : pareil que Rust
  • C : Langage avec lequel j'ai appris la programmation. Je ne l'utilise plus depuis 2014, mais ne serait pas contre m'y remettre.

APIs

  • OpenAI
  • Wikimedia (Wikipedia)
  • Google Cloud

Méthodes utilisés

  • agile scrum
  • TDD
  • Clean Code

Ops

  • Docker
  • Google Cloud
    • Firebase
    • Cloud Functions
    • Cloud Run
    • Cloud Build
    • Cloud Storage
    • IAM
  • gitlab-ci

Outillage

  • systèmes linux
  • emacs
  • visual studio code
  • github copilot
  • ChatGPT