Incident Management vs Problem Management: qual è la differenza?

Incident Management vs Problem Management: qual è la differenza?

Incident Management vs Problem Management: qual è la differenza?

ITIL (Information Technology Infrastructure Library) è un insieme dettagliato di linee guida per i servizi IT ispirate alle Best Practice. Nonostante sia attivo fin dagli anni ’80 c’è ancora molta confusione circa la differenza tra la gestione degli incident e la gestione dei problem, come pure quando si ferma uno e inizia e l’altro. (Ulteriori informazioni su ITIL premere qui).

Non avere familiarità con le differenze tra questi due processi può avere un impatto negativo non solo sull’infrastruttura ma anche sul tuo business.

Che cosa è un incident?
Secondo ITIL, “un incident è un’interruzione imprevista di un servizio o il fallimento di un componente di un servizio che non ha ancora influenzato il servizio”. Per essere considerato un incident, deve causare un fermo nel servizio e deve essere imprevisto. I server che si bloccano dopo l’orario di lavoro e la manutenzione programmata, quindi, non vengono classificati come incident in quanto non interrompono direttamente il processo aziendale. Gli incident devono essere risolti immediatamente con una correzione permanente, un workaround o una correzione temporanea.

Che cosa è un problem?
Secondo ITIL, “un problem è la causa di uno o più incidenti”. Questo problem è inizialmente sconosciuto e risulta da una serie di incident che sono correlati e che hanno problemi comuni. Mentre i problem non sono classificati come incident, gli incident possono sollevare problem, soprattutto se si verificano ripetutamente. Per fare riferimento all’esempio precedente, la situazione del server che viene utilizzato solo durante il giorno,  l’arresto dopo l’orario d’ufficio è un problem perché, anche se non sta attualmente causando una disfunzione nel servizio, potrebbe accadere di nuovo e diventare un incident.

Che cosa è l’incident management?
L’obiettivo principale della gestione degli incident è quello di risolvere il più presto possibile il disagio al fine di ripristinare il servizio. A causa del fatto che anche le minori interruzioni del servizio possono avere un enorme impatto sull’organizzazione, è necessario risolvere immediatamente gli incident. Il processo di gestione degli incident di solito include la registrazione dei dettagli dell’incident e la risoluzione.

La gestione degli incident spesso coinvolge il livello uno di servizio, che include:

  • Identificazione dell’incident
  • Registrazione dell’incident
  • Classificazione dell’incident
  • Priorità dell’incident
  • Diagnosi iniziale
  • Escalation, se necessario, al livello 2 di supporto
  • Risoluzione dell’incident
  • Chiusura dell’incident
  • Comunicazione con gli utenti durante tutta la vita dell’incident

Che cosa è il problem management?
L’obiettivo della gestione dei problem è quello di identificare la causa principale degli incident e cercare di impedire loro di accadere di nuovo. Ci possono essere più incident prima che la gestione dei problem possa avere dati sufficienti per analizzare cosa sta andando male ma, se eseguita correttamente, aiuterà il problem a diventare un “errore noto” e si possono mettere in atto attività per correggerlo. Mentre gli incident come un mouse malfunzionante potrebbero non causare un problem, quelli come le ripetute interruzioni di rete necessitano di approfondimenti. A volte la gestione dei problem viene definita come un processo reattivo che inizia solo dopo che si sono verificati incident. In realtà, la gestione dei problem dovrebbe essere considerata come un processo proattivo perché il suo obiettivo finale è identificare il problem, risolverlo e impedire di ripetersi. Quindi, si potrebbe dire che l’obiettivo principale della gestione dei problem è identificare il problem, risolverlo, documentare il problem e le cause, e poi risolverlo definitivamente.

La gestione dei problem ha una portata molto limitata e comprende le seguenti attività:

  • Rilevazione del problem
  • Registrazione del problem
  • Classificazione del problem
  • Priorità del problem
  • Ricerca e diagnosi del problem
  • Creazione di un record di errori noti
  • Risoluzione del problem e chiusura
  • Revisione approfondita del problem

Vediamo un’analogia che confronta la gestione degli incident e la gestione dei problem.
La gestione degli incident è come un vigile del fuoco nell’incedio di casa: entra, risolve immediatamente il problema e salva la giornata. I vigili del fuoco vengono sulla scena, notano il problema e lavorano velocemente per spegnere il fuoco il più velocemente possibile senza fermarsi a mettere in discussione come è iniziato. Questa è una situazione simile per la gestione degli incident.  E’ necessario che la gestione degli incident fornisca risultati veloci e risolva i problem all’interno dell’infrastruttura, ma non ci aiuta a scoprire cosa è andato storto e perché ci fosse un problema. È qui che entra in gioco la gestione dei problem.

La gestione dei problem è come il detective che arriva dopo il fatto. Non era lì per spegnere le fiamme, ma può indagare su cosa non ha funzionato, scoprire come il fuoco è iniziato e aiutare ad educare le persone a prendere misure preventive, in modo che qualcosa di simile non accada più. La gestione dei problem è un pezzo vitale del puzzle in quanto affronta la causa principale degli incident e, proattivamente, impedisce loro di ripetersi e causare potenzialmente problemi importanti in futuro. E’ necessario dedicare del tempo ad esaminare incident e risolvere problem, altrimenti continueranno ad accadere e potenzialmente ad aumentare di importanza.

Conclusione
Comprendere la differenza tra la gestione degli incident e la gestione dei problem, e avere manager dedicati per ogni scenario separato, assicura che non devi spegnere incendi tutto il giorno. Mentre risolvi immediatamente i problemi nell’infrastruttura con la gestione degli incident, fornisci solo un sollievo temporaneo che presto esaurirà le risorse senza trovare la radice del problema. La gestione dei problem aiuta a indagare la causa degli incident e mette in atto i passi necessari in modo che non continuino a verificarsi. Avere un responsabile o un team specifico per questo processo ti porterà a ridurre i tassi di incidenti nell’organizzazione e prevenire gravi interruzioni del servizio.

Risorse di BMC
BMC fornisce sia una Guida per la gestione dei problem ITIL che una Guida ITIL per la gestione degli incident per tenervi informati dell’ultima versione di ITIL e dei suoi elementi importanti in modo da poter comprendere rapidamente le principali modifiche e concetti. Entrambi questi opuscoli includono anche commenti ed esempi di esperti di BMC.

Fonte: BMC Software