Equinix

Senior Director Operations Engineering , Risk & Problem Management

Equinix Sunnyvale, CA
No longer accepting applications

Pay found in job post

Retrieved from the description.

Base pay range

$159,000.00/yr - $304,000.00/yr
Who are we?

Equinix is the world’s digital infrastructure company®, operating over 250 data centers across the globe. Digital leaders harness Equinix's trusted platform to bring together and interconnect foundational infrastructure at software speed. Equinix enables organizations to access all the right places, partners and possibilities to scale with agility, speed the launch of digital services, deliver world-class experiences and multiply their value, while supporting their sustainability goals.

Joining our operations team means that you will be at the forefront of all we do, maintaining critical facilities infrastructure as part of a close-knit team delivering best-in-class service to our data center customers. We embrace diversity in thought and contribution and are committed to providing an equitable work environment that is foundational to our core values as a company and is vital to our success.

Senior Director Operations Engineering , Risk & Problem Management

Job Sumarry

The Senior Director of Engineering, Problem & Risk Management, will be responsible for leading the Problem Management and Risk Management function within the Engineering department. This role is vital in ensuring the operational resilience, stability, reliability and availability of our technology platforms by proactively identifying, analyzing, and mitigating risks, as well as identifying and resolving (recurring) technical issues.

The Senior Director will work closely with cross-functional teams including Incident, Change and Asset Management, (Data Center) Operational Excellence, company-wide Equinix Enterprise Risk, Compliance and Field Operations teams in all three regions, to drive continuous improvement and safeguard the organization’s critical facility assets.

Responsibilities

Leadership & Strategy

  • Develop and execute the strategic vision for the Problem & Risk Management functions within the Engineering department
  • Lead and mentor a team of problem managers, risk managers, and engineers, fostering a culture of accountability, innovation, and continuous improvement
  • Collaborate with executive leadership to ensure alignment of problem and risk management strategies with overall business objectives

Problem Management

  • Oversee the identification, analysis, and resolution of (recurring) issues across the critical facility assets in all our data centers
  • Ensure thorough root cause analysis (RCA), utilizing structured methodologies (e.g. 5-Whys, Ishikawa) is conducted for incidents and the identification of systemic issues, and that permanent corrective actions are implemented effectively
  • Manage the entire lifecycle of problems, from detection and prioritization to documentation and resolution, minimizing impact on business operations

Risk Management

  • Identify, assess, and mitigate risks related to technology and operations, ensuring the protection of the organization’s assets and operations
  • Develop and implement risk management frameworks, policies, and procedures in alignment with industry standards
  • Monitor emerging risks, industry trends, and regulatory changes, adjusting strategies as needed to address potential threats

Physical Audits

  • Continue and optimize a system of identifying the highest risks data centers where physical audits of critical infrastructure and its operations will have to be performed

Process Improvement

  • Continuously evaluate and enhance problem and risk management processes to improve efficiency, effectiveness, and responsiveness
  • Develop and maintain key performance indicators (KPIs), metrics, dashboards, and reports to monitor performance and drive accountability
  • Lead post-incident reviews and drive cross-functional initiatives to prevent recurrence of issues and mitigate risks proactively

Cross-functional Collaboration

  • Collaborate closely with Incident-, Change- and Asset management, the overall company risk department, Operational Excellence, the regional Field Ops teams, the Compliance departments and other key stakeholders to ensure problems and risks are managed effectively
  • Facilitate communication and coordination among teams to minimize downtime, manage risks, and ensure seamless operations
  • Lead cross-functional task forces during major incidents or risk events, ensuring swift and effective resolution and mitigation

Compliance & Governance

  • Ensure adherence to regulatory requirements, industry standards, and internal policies related to risk management and problem resolution
  • Implement governance processes to track and manage risks, incidents, and problems, ensuring compliance with relevant frameworks (e.g. ITIL)
  • Provide regular reports to senior leadership on the status of problem and risk management activities, including key trends, metrics, and action plans

Stakeholder Communication

  • Serve as the point of escalation for complex or high-impact problems and risks, ensuring timely resolution and clear communication with stakeholders
  • Provide executive leadership with regular updates on risk exposure, problem resolution progress, and key initiatives
  • Build and maintain strong relationships with internal and external stakeholders, ensuring transparency and trust in problem and risk management efforts

Team Leadership

  • Manages a global team of subject matter experts motivating them around a clear, shared vision
  • Shape a collaborative, transparent, and entrepreneurial culture, in tandem with the extended global operations leadership and the corporate leadership team

Qualifications

Education

  • Strong intellect ideally with a bachelor’s or master’s degree or equivalent experience in engineering or related field

Experience

  • Substantial experience in engineering in data centers or a related field such as mission critical, oil and gas, chemicals, aerospace or transportation with a core focus on problem management and risk management
  • Demonstrable leadership experience as a manager of leaders (directors), steering similar-sized cross-functional teams (c20) in a complex, fast-paced environment
  • Proven experience in implementing and managing problem and risk management processes aligned with industry standards (e.g., ITIL)

Skills

  • Strong technical background with deep knowledge of critical facility infrastructure, data center operations, risk management and operational environments
  • Exceptional problem-solving and analytical skills, with the ability to assess complex issues and risks and drive effective solutions
  • Excellent communication and interpersonal skills, with the ability to influence and build relationships at all levels of the organization
  • Experience with risk assessment methodologies, root cause analysis (RCA), and incident management tools
  • Familiarity with relevant tools and technologies for monitoring, logging, managing incidents/problems, and assessing risks

Attributes

  • Consistent record in seeing the ‘bigger long-term picture’ and thinking strategically while achieving short-term results
  • Tight-knit collaboration skills and confirmed ability to work cross-functionally with diverse business unit leaders
  • Outstanding ability to influence and cultivate deep relationships with a range of internal stakeholders (especially sales) to drive customer value
  • Demonstrated ability to communicate effectively and persuasively
  • Proactive, transparent and inclusive 'in-service' authentic leadership style able to work comfortably in a non-hierarchical, matrixed context comprising a broad range of collaborators
  • Inspirational leader adept at inspiring behavior change through motivating teams, planning initiatives, designating priorities, and being decisive when faced with ambiguity

Work Environment

  • Able and willing to travel occasionally (6-10 times / year) to various company locations and partner sites
  • The Senior Director of Engineering, Problem & Risk Management, will work in a collaborative environment with a mix of on-site and remote work arrangements
  • Fluency in English is essential

Translated Version

Résumé du poste

Le directeur principal de l'ingénierie, gestion des problèmes et des risques, sera chargé de diriger la fonction de gestion des problèmes et des risques au sein du département de l'ingénierie. Ce rôle est essentiel pour assurer la résilience opérationnelle, la stabilité, la fiabilité et la disponibilité de nos plateformes technologiques en identifiant, analysant et atténuant les risques de manière proactive, ainsi qu'en identifiant et en résolvant les problèmes techniques (récurrents).

Le directeur principal travaillera en étroite collaboration avec des équipes interfonctionnelles, notamment la gestion des incidents, des changements et des actifs, l'excellence opérationnelle (centre de données), le risque d'entreprise d'Equinix à l'échelle de l'entreprise, la conformité et les équipes des opérations sur le terrain dans les trois régions, afin de favoriser l'amélioration continue et de protéger les actifs critiques des installations de l'organisation.

Responsabilités

Leadership et stratégie

  • Élaborer et mettre en œuvre la vision stratégique des fonctions de gestion des problèmes et des risques au sein du département « Ingénierie »
  • Diriger et encadrer une équipe de gestionnaires de problèmes, de gestionnaires de risques et d'ingénieurs, en favorisant une culture de la responsabilité, de l'innovation et de l'amélioration continue
  • Collaborer avec la direction pour garantir l'alignement des stratégies de gestion des problèmes et des risques sur les objectifs généraux de l'entreprise

Gestion des problèmes

  • Superviser l'identification, l'analyse et la résolution des problèmes (récurrents) dans les installations critiques de tous nos centres de données
  • S'assurer qu'une analyse approfondie des causes profondes (RCA), utilisant des méthodologies structurées (par exemple 5-Whys, Ishikawa), est menée pour les incidents et l'identification des problèmes systémiques, et que des actions correctives permanentes sont mises en œuvre efficacement
  • Gérer l'ensemble du cycle de vie des problèmes, depuis la détection et la hiérarchisation jusqu'à la documentation et la résolution, en minimisant l'impact sur les activités de l'entreprise

Gestion des risques

  • Identifier, évaluer et atténuer les risques liés à la technologie et aux opérations, en veillant à la protection des actifs et des opérations de l'organisation
  • Élaborer et mettre en œuvre des cadres, des politiques et des procédures de gestion des risques conformes aux normes du secteur
  • Surveiller les risques émergents, les tendances du secteur et les changements réglementaires, et adapter les stratégies en fonction des besoins pour faire face aux menaces potentielles

Audits physiques

  • Poursuivre et optimiser un système d'identification des centres de données présentant les risques les plus élevés, où des audits physiques de l'infrastructure critique et de ses opérations devront être réalisés

Amélioration des processus

  • Évaluer et améliorer en permanence les processus de gestion des problèmes et des risques afin d'accroître l'efficience, l'efficacité et la réactivité
  • Élaborer et tenir à jour des indicateurs de performance clés, des mesures, des tableaux de bord et des rapports afin de contrôler les performances et de favoriser la responsabilisation
  • Diriger les examens post-incidents et mener des initiatives interfonctionnelles afin d'éviter que les problèmes ne se reproduisent et d'atténuer les risques de manière proactive

Collaboration interfonctionnelle

  • Collaborer étroitement avec la gestion des incidents, des changements et des actifs, le département des risques de l'entreprise, l'excellence opérationnelle, les équipes régionales d'opérations sur le terrain, les départements chargés de la conformité et d'autres parties prenantes clés afin de garantir une gestion efficace des problèmes et des risques
  • Faciliter la communication et la coordination entre les équipes afin de minimiser les temps d'arrêt, de gérer les risques et d'assurer la continuité des opérations
  • Diriger des groupes de travail interfonctionnels lors d'incidents majeurs ou d'événements à risque, en veillant à ce que les problèmes soient résolus et atténués rapidement et efficacement

Conformité et gouvernance

  • Garantir le respect des exigences réglementaires, des normes industrielles et des politiques internes relatives à la gestion des risques et à la résolution des problèmes
  • Mettre en œuvre des processus de gouvernance pour suivre et gérer les risques, les incidents et les problèmes, en veillant à la conformité avec les cadres pertinents (par exemple, ITIL)
  • Fournir des rapports réguliers à la direction générale sur l'état des activités de gestion des problèmes et des risques, y compris les principales tendances, les mesures et les plans d'action

Communication avec les parties prenantes

  • Servir de point d'escalade pour les problèmes et les risques complexes ou à fort impact, en veillant à une résolution rapide et à une communication claire avec les parties prenantes
  • Fournir à la direction générale des mises à jour régulières sur l'exposition aux risques, l'avancement de la résolution des problèmes et les initiatives clés
  • Établir et maintenir des relations solides avec les parties prenantes internes et externes, en assurant la transparence et la confiance dans les efforts de gestion des problèmes et des risques

Direction d'équipe

  • Gérer une équipe mondiale d'experts en la matière en les motivant autour d'une vision claire et partagée
  • Façonner une culture de collaboration, de transparence et d'entreprise, en tandem avec la direction élargie des opérations mondiales et l'équipe de direction de l'entreprise

Qualifications

Formation

  • Idéalement, une licence ou un master ou une expérience équivalente en ingénierie ou dans un domaine connexe

Expérience

  • Expérience substantielle en ingénierie dans les centres de données ou dans un domaine connexe tel que les missions critiques, le pétrole et le gaz, les produits chimiques, l'aérospatiale ou les transports, avec un accent particulier sur la gestion des problèmes et la gestion des risques
  • Expérience démontrée en matière de leadership en tant que responsable de dirigeants (directeurs), dirigeant des équipes interfonctionnelles de taille similaire (c20) dans un environnement complexe et en évolution rapide
  • Expérience avérée de la mise en œuvre et de la gestion de processus de gestion des problèmes et des risques alignés sur les normes industrielles (par exemple, ITIL)

Compétences

  • Solide expérience technique avec une connaissance approfondie de l'infrastructure des installations critiques, des opérations des centres de données, de la gestion des risques et des environnements opérationnels
  • Compétences exceptionnelles en matière de résolution de problèmes et d'analyse, avec la capacité d'évaluer des problèmes et des risques complexes et de trouver des solutions efficaces
  • Excellentes compétences en matière de communication et de relations interpersonnelles, avec la capacité d'influencer et d'établir des relations à tous les niveaux de l'organisation
  • Expérience des méthodologies d'évaluation des risques, de l'analyse des causes profondes (RCA) et des outils de gestion des incidents
  • Connaissance des outils et technologies pertinents pour la surveillance, l'enregistrement, la gestion des incidents/problèmes et l'évaluation des risques

Attributs

  • Capacité constante à avoir une vision globale à long terme et à penser de manière stratégique tout en obtenant des résultats à court terme
  • Aptitude à collaborer étroitement et capacité confirmée à travailler de manière transversale avec divers responsables d'unités opérationnelles
  • Capacité exceptionnelle à influencer et à cultiver des relations profondes avec une série de parties prenantes internes (en particulier les ventes) afin de créer de la valeur pour le client
  • Capacité avérée à communiquer de manière efficace et convaincante
  • Style de leadership authentique, proactif, transparent et inclusif, capable de travailler confortablement dans un contexte matriciel non hiérarchique comprenant un large éventail de collaborateurs
  • Leader inspirant, capable de susciter des changements de comportement en motivant les équipes, en planifiant des initiatives, en définissant des priorités et en faisant preuve de détermination face à l'ambiguïté

Environnement de travail

  • Capable et désireux de voyager occasionnellement (6 à 10 fois par an) sur les différents sites de l'entreprise et de ses partenaires
  • Le directeur principal de l'ingénierie, de la gestion des problèmes et des risques, travaillera dans un environnement collaboratif avec une combinaison de travail sur site et à distance

The United States targeted pay range for this position in the following location is / locations are:

  • San Francisco, CA / Bay Area: $179,000 to $304,000 per year
  • California (Non-SF/Bay Area), Connecticut, Maryland, New York, New Jersey, Washington state: $172,000 to $293,000 per year
  • Colorado, Nevada, Rhode Island: $159,000 to $271,000 per year

Our pay ranges reflect the minimum and maximum target for new hire pay for the full-time position determined by role, level, and location. Individual pay is based on additional factors including job-related skills, experience, and relevant education and/or training.

This position may be offered in other locations. Your recruiter can share more about the specific pay range for your preferred location during the hiring process.

The targeted pay range listed reflects the base pay only and does not include bonus, equity, or benefits. Employees are eligible for bonus, and equity may be offered depending on the position.

As an employee, you become important to Equinix’s success. Details about our company benefits can be found at the following link:

USA Benefits eBook

Equinix is committed to ensuring that our employment process is open to all individuals, including those with a disability. If you are a qualified candidate and need assistance or an accommodation, please let us know by completing this form.

Equinix is an Equal Employment Opportunity and, in the U.S., an Affirmative Action employer. All qualified applicants will receive consideration for employment without regard to unlawful consideration of race, color, religion, creed, national or ethnic origin, ancestry, place of birth, citizenship, sex, pregnancy / childbirth or related medical conditions, sexual orientation, gender identity or expression, marital or domestic partnership status, age, veteran or military status, physical or mental disability, medical condition, genetic information, political / organizational affiliation, status as a victim or family member of a victim of crime or abuse, or any other status protected by applicable law.

The United States targeted pay range for this position in the following location is / locations are:

  • San Francisco, CA / Bay Area: $179,000 to $304,000 per year
  • California (Non-SF/Bay Area), Connecticut, Maryland, New York, New Jersey, Washington state: $172,000 to $293,000 per year
  • Colorado, Nevada, Rhode Island: $159,000 to $271,000 per year

Our pay ranges reflect the minimum and maximum target for new hire pay for the full-time position determined by role, level, and location. Individual pay is based on additional factors including job-related skills, experience, and relevant education and/or training.

This position may be offered in other locations. Your recruiter can share more about the specific pay range for your preferred location during the hiring process.

The targeted pay range listed reflects the base pay only and does not include bonus, equity, or benefits. Employees are eligible for bonus, and equity may be offered depending on the position.

As an employee, you become important to Equinix’s success. Details about our company benefits can be found at the following link:

USA Benefits eBook
  • Seniority level

    Director
  • Employment type

    Full-time
  • Job function

    Other
  • Industries

    Internet Publishing

Referrals increase your chances of interviewing at Equinix by 2x

See who you know

Get notified about new Senior Director of Operations jobs in Sunnyvale, CA.

Sign in to create job alert

Similar jobs

People also viewed

Similar Searches

Explore collaborative articles

We’re unlocking community knowledge in a new way. Experts add insights directly into each article, started with the help of AI.

Explore More