Compétences
TAL
- chaine de traitement de langage:
- segmentation
- tokenisation
- lemmatisation
- analyse morpho-syntaxique
- analyse syntaxique (en dépendances et en constituants)
- analyse sémantique (avec FrameNet)
- détection d'entités nommées
- résolution de coréférence
- résumé automatique (principalement extractif)
- Théorie de graphes
- chaines de markov
- Programmation en nombres entiers
Dev
Langages et librairies
Python - langage principal depuis 2014
Spacy - 2019-aujourd'hui
pytest - 2022-aujourd'hui (oui j'ai découvert le TDD sur le tard)
Flask - à petites doses depuis 2020
NLTK - 2017-2018
Scikit - 2014-aujourd'hui
Tensorflow - à petites doses depuis 2017
keras - utilisé pendant ma thèse quand torch et tensorflow n'étaient pas encore facilement utilisables
bash : pratiqué depuis 2008
LaTeX : plus utilisé depuis la fin de la rédaction de ma thèse en 2017!
Rust : j'essaye de temps à autres de m'y mettre depuis 2020
Go : pareil que Rust
C : Langage avec lequel j'ai appris la programmation. Je ne l'utilise plus depuis 2014, mais ne serait pas contre m'y remettre.
APIs
- OpenAI
- Wikimedia (Wikipedia)
- Google Cloud
Méthodes utilisés
- agile scrum
- TDD
- Clean Code
Ops
Docker
Google Cloud
Firebase
Cloud Functions
Cloud Run
Cloud Build
Cloud Storage
IAM
gitlab-ci
Outillage
- systèmes linux
- emacs
- visual studio code
- github copilot
- ChatGPT