Sumišimo matrica mašininiame mokyme su PAVYZDŽIU

Kas yra painiavos matrica?

Sumišimo matrica yra našumo matavimo technika, skirta mašininio mokymosi klasifikacijai. Tai yra tam tikra lentelė, kuri padeda sužinoti klasifikavimo modelio našumą atliekant bandymų duomenų rinkinį, kad būtų žinomos tikrosios vertės. Pats terminas „painiavos matrica“ yra labai paprastas, tačiau su juo susijusi terminologija gali šiek tiek gluminti. Čia pateikiamas paprastas šios technikos paaiškinimas.

Šioje pamokoje sužinosite,

  • Kas yra sumišimo matrica?
  • Keturi painiavos matricos rezultatai
  • Sumišimo matricos pavyzdys:
  • Kaip apskaičiuoti painiavos matricą
  • Kiti svarbūs terminai naudojant painiavos matricą
  • Kodėl jums reikalinga painiavos matrica?

Keturi painiavos matricos rezultatai

Sumišimo matrica vizualizuoja klasifikatoriaus tikslumą, lyginant faktines ir numatomas klases. Dvejetainę painiavos matricą sudaro kvadratai:

Painiavos lentelė
  • TP: tikras teigiamas: numatomos vertės teisingai prognozuojamos kaip teigiamos
  • FP: numatomos vertės neteisingai numatė faktinį teigiamą. ty, neigiamos reikšmės prognozuojamos kaip teigiamos
  • FN: klaidingas neigiamas: teigiamos vertės numatomos kaip neigiamos
  • TN: tikras neigiamas: numatomos vertės teisingai numatytos kaip faktinis neigiamas

Tikslumo testą galite apskaičiuoti iš painiavos matricos:

Painiavos matricos pavyzdys:

„Confusion Matrix“ yra naudingas mašininio mokymosi metodas, leidžiantis išmatuoti atšaukimo, tikslumo, tikslumo ir AUC-ROC kreivę. Žemiau pateiktas pavyzdys, kaip žinoti tikrąsias teigiamas, tikras neigiamas, klaidingas neigiamas ir tikrąsias neigiamas sąvokas.

Tikras teigiamas:

Jūs suprojektavote teigiamą dalyką ir jis pasirodė teisingas. Pavyzdžiui, jūs numatėte, kad Prancūzija laimės pasaulio taurę, ir ji laimėjo.

Tikras neigiamas:

Kai jūs numatėte neigiamą, tai tiesa. Jūs buvote numatę, kad Anglija nelaimės ir ji pralaimėjo.

Klaidingai teigiamas:

Jūsų prognozė yra teigiama ir klaidinga.

Jūs buvote numatęs, kad Anglija laimės, bet ji pralaimėjo.

Klaidingas neigiamas:

Jūsų prognozė yra neigiama, o rezultatas taip pat melagingas.

Jūs buvote numatę, kad Prancūzija nelaimės, bet laimėjo.

Turėtumėte nepamiršti, kad nuspėjamas vertes apibūdiname kaip teisingas arba klaidingas, arba teigiamas ir neigiamas.

Kaip apskaičiuoti painiavos matricą

Čia žingsnis po žingsnio apskaičiuojamas painiavos matrica duomenų gavyboje

  • 1 žingsnis. Pirmiausia turite išbandyti duomenų rinkinį su jo laukiamomis rezultatų vertėmis.
  • 2 žingsnis) Numatykite visas bandomojo duomenų rinkinio eilutes.
  • 3 žingsnis. Apskaičiuokite numatomas prognozes ir rezultatus:
  1. Iš viso teisingų kiekvienos klasės prognozių.
  2. Neteisingų kiekvienos klasės prognozių skaičius.

Po to šie skaičiai yra suskirstyti pagal toliau nurodytus metodus:

  • Kiekviena matricos eilutė susieja su numatoma klase.
  • Kiekvienas matricos stulpelis atitinka tikrąją klasę.
  • Į lentelę įrašomi visi teisingo ir neteisingo klasifikavimo skaičiai.
  • Teisingų klasės prognozių suma eina į numatomą tos klasės vertės stulpelį ir laukiamą eilutę.
  • Neteisingų klasės prognozių suma patenka į laukiamą tos klasės vertės eilutę ir numatomą tos konkrečios klasės vertės stulpelį.

Kiti svarbūs terminai naudojant painiavos matricą

  • Teigiama nuspėjamoji vertė (PVV): tai labai arti tikslumo. Vienas reikšmingas dviejų laikotarpių skirtumas yra tas, kad PVV atsižvelgia į paplitimą. Esant situacijai, kai klasės yra visiškai subalansuotos, teigiama nuspėjamoji vertė yra tokia pati kaip tikslumas.
  • Null klaidų dažnis: Šis terminas naudojamas apibrėžti, kiek kartų jūsų prognozė būtų neteisinga, jei galite numatyti daugumos klasę. Galite laikyti tai pagrindine metrika palyginti savo klasifikatorių.
  • F balas: F1 balas yra vidutinis svertinis tikrojo teigiamo (atšaukimo) ir tikslumo balas.
  • Roc kreivė: Roc kreivė rodo tikrąsias teigiamas normas, palyginti su klaidingai teigiama norma įvairiuose pjūvio taškuose. Tai taip pat parodo kompromisą tarp jautrumo (atšaukimo ir specifiškumo arba tikrojo neigiamo rodiklio).
  • Tikslumas: tikslumo metrika rodo teigiamos klasės tikslumą. Jis matuoja, kiek tikėtina teigiamos klasės prognozė yra teisinga.

Maksimalus balas yra 1, kai klasifikatorius puikiai klasifikuoja visas teigiamas vertes. Vien tikslumas nėra labai naudingas, nes jis ignoruoja neigiamą klasę. Metrika paprastai derinama su metrika Recall. Atsišaukimas dar vadinamas jautrumu arba tikruoju teigiamu rodikliu.

  • Jautrumas : jautrumas apskaičiuoja teisingai nustatytų teigiamų klasių santykį. Ši metrika rodo, kaip gerai modelis atpažįsta teigiamą klasę.

Kodėl jums reikalinga painiavos matrica?

Čia yra painiavos matricos naudojimo privalumai / privalumai.

  • Tai parodo, kaip bet koks klasifikavimo modelis yra supainiotas, kai jis teikia prognozes.
  • Painiavos matrica suteikia ne tik supratimą apie klaidas, kurias daro jūsų klasifikatorius, bet ir daromų klaidų tipus.
  • Šis suskirstymas padeda jums įveikti tik klasifikavimo tikslumo naudojimo apribojimus.
  • Kiekvienas painiavos matricos stulpelis atspindi tos numatomos klasės egzempliorius.
  • Kiekviena painiavos matricos eilutė atspindi tikrosios klasės egzempliorius.
  • Tai suteikia įžvalgų ne tik klasifikatoriaus padarytoms klaidoms, bet ir daromoms klaidoms.

Įdomios straipsniai...