Todennäköisyydet tai frekvenssit
Erota arvot pilkulla, välilyönnillä tai rivinvaihdolla. Voit antaa todennäköisyydet (summa 1) tai lukumäärät, jotka muunnetaan todennäköisyyksiksi. Esimerkiksi: 0.5, 0.25, 0.25
Laske jakauman Shannonin entropia eli keskimääräinen informaatiosisältö – syötä todennäköisyydet tai frekvenssit.
Erota arvot pilkulla, välilyönnillä tai rivinvaihdolla. Voit antaa todennäköisyydet (summa 1) tai lukumäärät, jotka muunnetaan todennäköisyyksiksi. Esimerkiksi: 0.5, 0.25, 0.25
Shannonin entropia on informaatioteorian keskeinen tunnusluku. Se mittaa, kuinka paljon epävarmuutta todennäköisyysjakaumaan liittyy, eli kuinka paljon informaatiota tuloksen havaitseminen keskimäärin tuottaa. Tämä laskuri laskee entropian valitsemassasi yksikössä sekä enimmäisentropian ja normalisoidun entropian.
Jos yksi tulos on lähes varma, sen havaitseminen ei tuo juuri uutta tietoa ja entropia on pieni. Jos kaikki vaihtoehdot ovat yhtä todennäköisiä, tulosta on vaikein ennustaa ja entropia on suurin mahdollinen. Entropia kuvaa siis jakauman tasaisuutta ja ennustettavuutta yhdellä luvulla.
Shannonin entropia lasketaan kaavalla:
H = −Σ pᵢ × log_b(pᵢ)
Summa käy läpi kaikki tulokset, ja pᵢ on kunkin tuloksen todennäköisyys. Logaritmin kanta b määrää yksikön: 2 antaa bitit, e antaa natit ja 10 antaa ditit. Miinusmerkki tekee tuloksesta positiivisen, koska log_b(pᵢ) on negatiivinen alle ykkösen oleville todennäköisyyksille. Nollatodennäköisyydet jätetään summasta pois.
Tarkastellaan kolmea tulosta todennäköisyyksillä 0,5, 0,25 ja 0,25 (bitit, kanta 2).
Suurin mahdollinen entropia saavutetaan, kun kaikki k vaihtoehtoa ovat yhtä todennäköisiä:
H_max = log_b(k)
Normalisoitu entropia eli tasaisuus on todellisen entropian suhde enimmäisentropiaan:
tasaisuus = H ÷ H_max
Tasaisuus on välillä 0–1: arvo 1 tarkoittaa täysin tasaista jakaumaa ja arvo lähellä nollaa hyvin ennustettavaa jakaumaa.
Yksikkö riippuu vain logaritmin kannasta. Bitit (kanta 2) ovat yleisin valinta tietotekniikassa. Natit (luonnollinen logaritmi) esiintyvät usein matematiikassa ja koneoppimisessa, ja ditit (kanta 10) ovat harvinaisempia. Arvot muuntuvat toisikseen vakiokertoimella, esimerkiksi 1 nat ≈ 1,4427 bittiä.