Chargement...
Des plateformes
data souveraines, prêtes pour la production.
Bridging the gap between complex infrastructure and actionable business
insights.
Founding role: designed and delivered a sovereign, production-ready, and durable Lakehouse platform. Implemented Python, Dagster, dbt, SQLMesh, DuckDB, and Polars for fast analytical processing. Set up Apache Airflow pipelines and continuous deployment. Defined technical standards, led code reviews, and delivered an autonomous business platform.
Conducted market studies targeting 450k customers. Achieved 42% conversion rate on campaigns. Bridged business requirements with technical feasibility.
Trained 150+ international students from Audencia in Data Visualization (Power BI) and Python coding.
Built ETL/ELT pipelines with dbt and Dagster orchestration. Developed customer segmentation models (RFM) and logistics performance dashboards. Analyzed 10M+ transactions.
Performed Open-Source Intelligence (OSINT) investigations for international press organizations.
Managed high-availability server infrastructure (bare metal & cloud).
Extraction de données open source à but de data journalisme.
Lecture rapide: d'abord les realisations professionnelles anonymisees, puis les projets personnels R&D.
Une architecture de données souveraine et découplée. Remplacement d'un monolithe SQL Server coûteux par une stack Docker agile.
Gestion de la fraîcheur des données (SLA) et lignage automatique avec Dagster.
Applications métiers sur-mesure développées avec NiceGUI (Auth, RBAC, Real-time).
Outils interactifs basés sur des réalisations pro anonymisées.
Démo anonymisée d'outils métiers de pilotage data/finance conçus en contexte réel.
Démo anonymisée d'un portail métier orienté pilotage opérationnel, inspirée d'un contexte réel d'entreprise.
Démo anonymisée d'un environnement d'analyse local inspiré de cas réels en production.
J'aime innover sur internet, prototyper vite et tester mes limites techniques sur des idées ambitieuses.
Moteur JDR narratif web en solo/co-op : mode génératif avec MJ IA, mémoire narrative persistante via LLM + Pinecone (RAG), jets de dés et mode hors-ligne. FastAPI + WebSockets.
Plateforme d'intelligence géopolitique : ingestion RSS, cartographie d'entités, timeline d'événements et corrélation de signaux faibles via recherche vectorielle Pinecone en temps réel.
"Avec le tableau de bord et le datalake, nous pouvons désormais suivre l'évolution de l'impact dans la commercialisation des producteurs via notre application, ainsi que l'autonomie générée par l'outil auprès de ces derniers."
Client
"L'expertise de Paul sur dbt et l'orchestration de nos pipelines avec Dagster a structuré notre équipe Data. Ses dashboards de performance logistique sont aujourd'hui indispensables au quotidien."
Client
La plupart des ingénieurs empilent des services Cloud par réflexe. Moi, je choisis l'architecture qui maximise le ROI.
Depuis 2015, j'explore la donnée sous toutes ses formes — extraction, infrastructure, analyse et enseignement. Aujourd'hui, je concentre cette expertise sur l'ingénierie data souveraine. Mon solide bagage d'administrateur serveur est un avantage concret : je comprends et maîtrise l'infrastructure sous-jacente à la data.
Des missions long terme ou poste cle pour structurer une plateforme data utile, sobre et maintenable, avec un lien fort au produit.
Alternatives open-source souveraines pour diviser par 10 les coûts d'infrastructure.
Une stack conteneurisée standardisée pour livrer de l'architecture à la prod en une semaine.
Hébergement sur vos serveurs ou cloud privé pour une conformité RGPD native et un contrôle total.
Orchestration orientée assets avec lignage natif et SLAs.
Scheduling par DAG pour workflows complexes et grand écosystème.
Cliquer pour jouer
Moteur OLAP embarqué. 100x plus rapide que Pandas.
Transformation SQL versionnée, testable et data contracts.
DataFrames Rust très haute performance avec exécution lazy.
Object storage S3-compatible. 0€ de licence vs AWS S3.
Couche de serving avec extensions (pgvector) pour APIs et BI.
Infrastructure conteneurisée et déployée via GitLab CI / GitHub Actions.
Base de données vectorielle pour RAG et recherche sémantique.
Backends Python sécurisés (FastAPI) et interfaces full-stack (NiceGUI).
Rotate pipes to connect the Source to the Destination.