System Administrator / L’administratrice De Systèmes Informatiques

Montréal, QC, CA, Canada

Job Description

We are the world's sports analytics leader, using cutting-edge AI technology to produce unique sports data and performance insights. These insights provide an edge to teams, leagues, media organizations, and rights holders of all sizes. We use a variety of techniques to collect and analyze sports data, allowing our partners to discover contextual insights and derive value from them in brand new ways.

The IT Systems Administrator plays a crucial role in managing and maintaining an organization's IT infrastructure. This position involves ensuring the reliability and security of the organization's systems, networks, and servers. The IT Systems Administrator is responsible for troubleshooting technical issues, implementing system upgrades, and collaborating with other departments to optimize the overall performance of the IT environment

What you'll do:



HPC Cluster Management, Monitoring, and System Administration:

Maintain and optimize high-performance computing clusters of GPU and CPU servers Configure, manage and maintain Linux servers, NAS storage, internal infrastructure network, VPN, firewall, ensuring optimal performance, reliability, and security Monitor and manage workload manager software (e.g., Slurm) for efficient resource allocation on the HPC cluster Perform routine system updates, patches, and upgrades. Troubleshoot and optimize network performance for low-latency communication in HPC clusters.
Security:

Understand best practice security and monitoring, reporting, and mitigating security risks Conduct regular security audits and vulnerability assessments. Respond promptly to security incidents and perform root cause analysis.
Scripting and Automation:

Develop and maintain shell scripts for system automation and routine tasks. Implement automation solutions for provisioning, configuration, and monitoring of the internal systems. Backup and Disaster Recovery: Implement and manage backup and recovery solutions for critical systems and data. Develop and maintain disaster recovery plans and participate in regular test
Collaboration:

Work closely with research and development and stakeholders to support their requirements. Document configurations, procedures, and changes, ensuring knowledge sharing within the IT team.

What you need:



10+ years experience as a Linux System Administrator. Familiarity with IT change management practices and maintaining related documentation Proficiency in managing HPC clusters, workload manager software (slurm), and networking. Shell scripting expertise (Bash, Python, etc.) and experience in DevOps environments In depth knowledge of network concepts and protocols and their performance issues Familiarity with AWS services and cloud-based solutions. Excellent communication skills and ability to document complex configurations.

Nice to have:



Experience working in a startup environment Experience with high throughput 24/7 production environments Experience working with video data Passion for sports

What we offer:



Sportlogiq brings a challenging and inspiring work environment. This position will have you collaborating with every department within the company and offers ample learning opportunities.

A comprehensive compensation package, including competitive salary, bonuses and comprehensive benefits program A cooperative and fun work environment, supportive leadership for your personal growth. Flexible work schedule, hybrid with 1-2 days in office per week, some weekends and evenings required.
*

Nous sommes le leader mondial de l'analyse sportive, utilisant une technologie de pointe de l'IA pour produire des donnees sportives uniques et des informations sur les performances. Ces informations offrent un avantage aux equipes, aux ligues, aux medias, aux operateurs de paris sportifs et aux titulaires de droits de toutes tailles. Nous utilisons une variete de techniques pour collecter et analyser les donnees sportives, ce qui permet a nos partenaires de decouvrir des informations contextuelles et de les exploiter de maniere inedite.

L'administrateur ou l'administratrice de systemes informatiques joue un role essentiel dans la gestion et la maintenance de l'infrastructure informatique d'une organisation. Ce poste implique de veiller a la fiabilite et a la securite des systemes, des reseaux et des serveurs de l'organisation. L'administrateur ou l'administratrice de systemes informatiques doit resoudre les problemes techniques, effectuer les mises a niveau des systemes et collaborer avec d'autres services afin d'optimiser les performances globales de l'environnement informatique.

Vos responsabilites :



Gestion, surveillance et administration systeme des clusters HPC :

Maintenir et optimiser les clusters de calcul haute performance des serveurs GPU et CPU Configurer, gerer et maintenir les serveurs Linux, le serveur de stockage NAS, le reseau d'infrastructure interne, le RPV et le pare-feu, en garantissant des performances, une fiabilite et une securite optimales. Surveiller et gerer le logiciel de gestion de la charge de travail (p. ex., Slurm) pour une allocation efficace des ressources sur le cluster HPC. Effectuer les mises a jour, les correctifs et les mises a niveau regulieres des systemes. Depanner et optimiser les performances du reseau pour une communication a faible latence dans les clusters HPC.
Securite :

Comprendre les meilleures pratiques en matiere de securite, de surveillance, de signalement et d'attenuation des risques de securite. Effectuer regulierement des audits de securite et des evaluations de la vulnerabilite. Repondre rapidement aux incidents de securite et effectuer une analyse des causes profondes.
Scripts et automatisation :

Developper et maintenir les sequences de commandes en langage naturel (ou shell scripts ) pour l'automatisation du systeme et les taches courantes. Mettre en oeuvre des solutions d'automatisation pour le provisionnement, la configuration et la surveillance des systemes internes.
Sauvegarde et reprise d'activite :

Mettre en oeuvre et gerer des solutions de sauvegarde et de recuperation pour les systemes et les donnees critiques. Elaborer et tenir a jour des plans de reprise d'activite et participer a des tests reguliers.
Collaboration :

Travailler en etroite collaboration avec la recherche et le developpement et les parties prenantes pour repondre a leurs besoins. Documenter les configurations, les procedures et les changements, en assurant le partage des connaissances au sein de l'equipe informatique.

Ce qu'il vous faut :



10 ans et plus d'experience en tant qu'administrateur ou administratrice systeme Linux. Familiarite avec les pratiques de gestion des changements informatiques et la tenue de la documentation correspondante. Une maitrise de la gestion des clusters HPC, du logiciel de gestion de la charge de travail (Slurm) et de la mise en reseau. Une expertise en matiere de sequence de commandes en langage naturel (ou shell scripting ) (Bash, Python, etc.) et une experience dans des environnements DevOps. Une connaissance approfondie des concepts et des protocoles de reseau et de leurs problemes de performance. Une bonne connaissance des services AWS et des solutions basees sur l'infonuagique. D'excellentes competences en communication et une capacite a documenter des configurations complexes.

Un atout :



Une experience de travail dans un environnement d'entreprise en demarrage. Une experience des environnements de production 24/7 a haut debit. Une experience de travail avec des donnees video. Une passion pour le sport.

Ce que nous offrons :



Sportlogiq propose un milieu de travail stimulant et inspirant. Ce poste vous amenera a collaborer avec tous les services de l'entreprise et vous offrira de nombreuses possibilites d'apprentissage.

Un regime de remuneration complet, y compris un salaire concurrentiel, des primes et un excellent programme d'avantages sociaux. Un environnement de travail cooperatif et agreable, une direction qui vous soutient et qui s'engage pour votre developpement personnel. Un horaire de travail flexible, hybride avec 1 a 2 jours au bureau par semaine, certains week-ends et soirees requis.
Job Type: Full-time

Pay: $85,000.00-$110,000.00 per year

Additional pay:

Bonus pay
Benefits:

Casual dress Company events Dental care Employee assistance program Extended health care Flexible schedule Language training provided Life insurance Paid time off Tuition reimbursement Vision care VRSP Work from home
Schedule:

Monday to Friday
Work Location: Hybrid remote in Montreal, QC H3Z 3C1

Beware of fraud agents! do not pay money to get a job

MNCJobz.com will not be responsible for any payment made to a third-party. All Terms of Use are applicable.


Related Jobs

Job Detail

  • Job Id
    JD2454731
  • Industry
    Not mentioned
  • Total Positions
    1
  • Job Type:
    Full Time
  • Salary:
    Not mentioned
  • Employment Status
    Permanent
  • Job Location
    Montréal, QC, CA, Canada
  • Education
    Not mentioned