Categories: NewsNewsletter

Incident Management vs Problem Management: qual è la differenza?

ITIL (Information Technology Infrastructure Library) è un insieme dettagliato di linee guida per i servizi IT ispirate alle Best Practice. Nonostante sia attivo fin dagli anni ’80 c’è ancora molta confusione circa la differenza tra la gestione degli incident e la gestione dei problem, come pure quando si ferma uno e inizia e l’altro. (Ulteriori informazioni su ITIL premere qui).

Non avere familiarità con le differenze tra questi due processi può avere un impatto negativo non solo sull’infrastruttura ma anche sul tuo business.

Che cosa è un incident?
Secondo ITIL, “un incident è un’interruzione imprevista di un servizio o il fallimento di un componente di un servizio che non ha ancora influenzato il servizio”. Per essere considerato un incident, deve causare un fermo nel servizio e deve essere imprevisto. I server che si bloccano dopo l’orario di lavoro e la manutenzione programmata, quindi, non vengono classificati come incident in quanto non interrompono direttamente il processo aziendale. Gli incident devono essere risolti immediatamente con una correzione permanente, un workaround o una correzione temporanea.

Che cosa è un problem?
Secondo ITIL, “un problem è la causa di uno o più incidenti”. Questo problem è inizialmente sconosciuto e risulta da una serie di incident che sono correlati e che hanno problemi comuni. Mentre i problem non sono classificati come incident, gli incident possono sollevare problem, soprattutto se si verificano ripetutamente. Per fare riferimento all’esempio precedente, la situazione del server che viene utilizzato solo durante il giorno,  l’arresto dopo l’orario d’ufficio è un problem perché, anche se non sta attualmente causando una disfunzione nel servizio, potrebbe accadere di nuovo e diventare un incident.

Che cosa è l’incident management?
L’obiettivo principale della gestione degli incident è quello di risolvere il più presto possibile il disagio al fine di ripristinare il servizio. A causa del fatto che anche le minori interruzioni del servizio possono avere un enorme impatto sull’organizzazione, è necessario risolvere immediatamente gli incident. Il processo di gestione degli incident di solito include la registrazione dei dettagli dell’incident e la risoluzione.

La gestione degli incident spesso coinvolge il livello uno di servizio, che include:

  • Identificazione dell’incident
  • Registrazione dell’incident
  • Classificazione dell’incident
  • Priorità dell’incident
  • Diagnosi iniziale
  • Escalation, se necessario, al livello 2 di supporto
  • Risoluzione dell’incident
  • Chiusura dell’incident
  • Comunicazione con gli utenti durante tutta la vita dell’incident

Che cosa è il problem management?
L’obiettivo della gestione dei problem è quello di identificare la causa principale degli incident e cercare di impedire loro di accadere di nuovo. Ci possono essere più incident prima che la gestione dei problem possa avere dati sufficienti per analizzare cosa sta andando male ma, se eseguita correttamente, aiuterà il problem a diventare un “errore noto” e si possono mettere in atto attività per correggerlo. Mentre gli incident come un mouse malfunzionante potrebbero non causare un problem, quelli come le ripetute interruzioni di rete necessitano di approfondimenti. A volte la gestione dei problem viene definita come un processo reattivo che inizia solo dopo che si sono verificati incident. In realtà, la gestione dei problem dovrebbe essere considerata come un processo proattivo perché il suo obiettivo finale è identificare il problem, risolverlo e impedire di ripetersi. Quindi, si potrebbe dire che l’obiettivo principale della gestione dei problem è identificare il problem, risolverlo, documentare il problem e le cause, e poi risolverlo definitivamente.

La gestione dei problem ha una portata molto limitata e comprende le seguenti attività:

  • Rilevazione del problem
  • Registrazione del problem
  • Classificazione del problem
  • Priorità del problem
  • Ricerca e diagnosi del problem
  • Creazione di un record di errori noti
  • Risoluzione del problem e chiusura
  • Revisione approfondita del problem

Vediamo un’analogia che confronta la gestione degli incident e la gestione dei problem.
La gestione degli incident è come un vigile del fuoco nell’incedio di casa: entra, risolve immediatamente il problema e salva la giornata. I vigili del fuoco vengono sulla scena, notano il problema e lavorano velocemente per spegnere il fuoco il più velocemente possibile senza fermarsi a mettere in discussione come è iniziato. Questa è una situazione simile per la gestione degli incident.  E’ necessario che la gestione degli incident fornisca risultati veloci e risolva i problem all’interno dell’infrastruttura, ma non ci aiuta a scoprire cosa è andato storto e perché ci fosse un problema. È qui che entra in gioco la gestione dei problem.

La gestione dei problem è come il detective che arriva dopo il fatto. Non era lì per spegnere le fiamme, ma può indagare su cosa non ha funzionato, scoprire come il fuoco è iniziato e aiutare ad educare le persone a prendere misure preventive, in modo che qualcosa di simile non accada più. La gestione dei problem è un pezzo vitale del puzzle in quanto affronta la causa principale degli incident e, proattivamente, impedisce loro di ripetersi e causare potenzialmente problemi importanti in futuro. E’ necessario dedicare del tempo ad esaminare incident e risolvere problem, altrimenti continueranno ad accadere e potenzialmente ad aumentare di importanza.

Conclusione
Comprendere la differenza tra la gestione degli incident e la gestione dei problem, e avere manager dedicati per ogni scenario separato, assicura che non devi spegnere incendi tutto il giorno. Mentre risolvi immediatamente i problemi nell’infrastruttura con la gestione degli incident, fornisci solo un sollievo temporaneo che presto esaurirà le risorse senza trovare la radice del problema. La gestione dei problem aiuta a indagare la causa degli incident e mette in atto i passi necessari in modo che non continuino a verificarsi. Avere un responsabile o un team specifico per questo processo ti porterà a ridurre i tassi di incidenti nell’organizzazione e prevenire gravi interruzioni del servizio.

Risorse di BMC
BMC fornisce sia una Guida per la gestione dei problem ITIL che una Guida ITIL per la gestione degli incident per tenervi informati dell’ultima versione di ITIL e dei suoi elementi importanti in modo da poter comprendere rapidamente le principali modifiche e concetti. Entrambi questi opuscoli includono anche commenti ed esempi di esperti di BMC.

Fonte: BMC Software

Alessandra Bellotti

Comments are closed.

Recent Posts

L’Agentic AI arriva sui dispositivi mobili dei dipendenti

I team di Compliance necessitano di piena visibilità. L'Agentic Artificial Intelligence sta evolvendo a un ritmo vertiginoso, e con essa…

24 ore ago

Xurrent – Un nuovo modo di mettere le persone in contatto con il supporto di cui hanno bisogno

Phil Christianson lavora nel product management da oltre 20 anni e ha provato praticamente ogni sistema ITSM immaginabile. Conosce alla…

3 giorni ago

Keeper protegge le password di un’azienda tecnologica di livello mondiale

Un fornitore globale di servizi tecnologici con sede nel Regno Unito, con oltre 11.000 dipendenti, è cresciuto rapidamente servendo clienti…

1 settimana ago

Come posso usare Lansweeper per monitorare le informazioni sulle garanzie?

Se il tuo ruolo prevede il monitoraggio delle garanzie hardware, sai quanto facilmente le date di scadenza, i contratti con…

1 settimana ago

Il team Atlassian Williams F1 garantisce la sicurezza degli accessi privilegiati in tutto il mondo con KeeperPAM®

La Formula 1 è uno sport caratterizzato da velocità, precisione e dati. Per l’Atlassian Williams F1 Team, una squadra con risultati…

1 mese ago

Come Lansweeper supporta il tuo percorso verso la conformità NIS2

È passato ormai più di un anno da quando l’Unione Europea ha messo in atto la Direttiva NIS2. L’applicazione della…

1 mese ago