مهندس قابلیت اطمینان سایت (SRE)
فناوری اطلاعاتتماموقتدورکاری / تهران
شرح موقعیت
به دنبال یک مهندس SRE با تجربه در تضمین قابلیت اطمینان و عملکرد سیستمها هستیم که بتواند زیرساختهای با دسترسی بالا برای پلتفرم FinAI ایجاد و نگهداری کند.
مسئولیتها
- طراحی و پیادهسازی سیستمهای با دسترسی بالا (High Availability)
- نظارت و مانیتورینگ سیستمها و سرویسها
- مدیریت Incident Response و Troubleshooting
- بهینهسازی عملکرد و Latency
- تعریف و پیادهسازی SLAs و SLOs
- همکاری با تیم توسعه برای بهبود Reliability
- مدیریت Capacity Planning و Scaling
مهارتهای مورد نیاز
- تجربه حداقل 2 سال در SRE یا DevOps
- تسلط به Linux و System Administration
- تجربه کار با Monitoring Tools (Prometheus, Grafana, Datadog)
- آشنایی با Container Orchestration (Kubernetes, Docker Swarm)
- تجربه کار با Cloud Platforms (AWS, GCP, Azure)
- توانایی Scripting (Python, Bash, Go)
- تجربه کار با Logging و Tracing Tools
- توانایی حل مسئله و عیبیابی سریع
مزایا (اختیاری)
- تجربه کار در حوزه Fintech
- آشنایی با Chaos Engineering
- تجربه کار با Service Mesh
- مدارک معتبر Cloud و SRE
ارسال درخواست
برای ارسال درخواست، لطفاً رزومه خود را به همراه نام موقعیت شغلی در موضوع ایمیل به آدرس زیر ارسال کنید:
لطفاً در موضوع ایمیل، نام موقعیت شغلی را ذکر کنید: مهندس قابلیت اطمینان سایت (SRE)