Unormale kan identifiseres grafisk ved å visuelt inspisere et plott av dataene. De kan også identifiseres numerisk ved å beregne et mål på statistisk avvik, for eksempel z-score eller standardisert residual.
Tilstedeværelsen av unormale i et datasett kan ha en innvirkning på resultatene av statistisk analyse, og det er viktig å vurdere deres potensielle innvirkning når du utfører dataanalyse. I noen tilfeller kan det være nødvendig å fjerne unormale fra datasettet før analyse, mens de i andre tilfeller kan beholdes som verdifulle informasjonspunkter.
Her er noen vanlige eksempler på unormale:
* I et datasett med studenttestresultater kan en unormalt høy poengsum skyldes juks, mens en unormalt lav poengsum kan indikere en student som ikke var forberedt på testen.
* I et datasett med salgstall kan et unormalt høyt salg skyldes en spesialkampanje eller et engangssalg, mens et unormalt lavt salg kan indikere en butikk som sliter.
* I et datasett med medisinske data kan en unormalt høy eller lav avlesning indikere en medisinsk tilstand som krever ytterligere undersøkelse.
Det er viktig å merke seg at ikke alle unormale er et resultat av feil eller uvanlige observasjoner. I noen tilfeller kan abnormiteter være forårsaket av legitime endringer i den underliggende befolkningen. For eksempel, i et datasett med aksjekurser, kan en unormalt høy kurs skyldes en positiv resultatrapport, mens en unormalt lav kurs kan skyldes dårlige nyheter.
Derfor er det viktig å undersøke unormalt nøye før du trekker noen konklusjoner om deres betydning.