Ik ben een Deep Learning engineer die gespecialiseerd is in Model Compressie en Edge Deployment. Ik transformeer je high-accuracy research modellen naar productieklare assets die geoptimaliseerd zijn voor mobile, web en IoT apparaten.
Wat ik bied:
- Modelconversie: Naadloos converteren tussen frameworks zoals PyTorch naar ONNX, Keras naar TFLite of TensorFlow naar CoreML.
- Inference optimalisatie: Versnel je model met TensorRT, OpenVINO of ONNX Runtime.
- Modelcompressie: Verklein de footprint met Post-Training Quantization (INT8/Float16) en Weight Pruning zonder grote verlies in nauwkeurigheid.
- Edge deployment: Optimalisatie voor hardware zoals Raspberry Pi, Android (TFLite), iOS (CoreML) en NVIDIA Jetson.
- Architectuur verfijning: Toepassen van Knowledge Distillation om efficiënte "student" modellen te maken.
Waarom kiezen voor deze service?
- Expertise in SOTA architecturen: Ervaring met YOLO (v8-v11), Transformers (ViT), MobileNet en EfficientNet.
- Prestatie benchmarking: Je ontvangt een gedetailleerd rapport met Latency, Throughput en Memory gebruik voor en na optimalisatie.
- Net geïmplementeerd: Volledig gedocumenteerde Python- of C++-scripts voor integratie.
Tools & Frameworks:
PyTorch | TensorFlow | Keras | ONNX | TFLite