Datacompressie

Wat is datacompressie?
Afbeeldingen en geluidsbestanden kunnen veel opslag in beslag nemen. Dat betekent dus dat de harde schijf sneller vol is en dat het meer tijd kost om de afbeeldingen en geluidsbestanden te downloaden. Een databundel gaat dan snel leeg. Hiervoor is de opslossing datacompressie bedacht.

Datacompressie is het proces waarbij informatie wordt gecodeerd met minder bits dan de oorspronkelijke representatie.Er zijn twee compressies:Lossless en lossy compression. Lossless compressie vermindert bits door statistische redundantie te identificeren en te verwijderen. Er gaat geen informatie verloren bij lossless compressie. Compressie met verlies vermindert het aantal bits door onnodige of minder belangrijke informatie te verwijderen.
Normaal gesproken wordt een apparaat dat datacompressie uitvoert een encoder genoemd, en een apparaat dat de omkering van het proces (decompressie) uitvoert als een decoder.

Lossles compressie
Lossless datacompressie maakt meestal gebruik van statistische redundantie om gegevens weer te geven zonder informatie te verliezen. Hierdoor is het proces omkeerbaar. Compressie zonder verlies is mogelijk omdat de meeste gegevens uit de echte wereld statistische redundantie vertonen. Een afbeelding kan bijvoorbeeld kleurgebieden hebben die over meerdere pixels niet veranderen; in plaats van "rode pixel, rode pixel, ..." te coderen, kan dat worden gecodeerd als "279 rode pixels". Dit is een voorbeeld van runlengtecodering; er zijn veel schema's om de bestandsgrootte te verkleinen door redundantie te verwijderen.
Eind jaren tachtig werden digitale afbeeldingen steeds populairder en ontstonden er standaarden voor lossless beeldcompressie.

Lossy compressie
Begin jaren negentig werden compressiemethoden met verlies vaker gebruikt. In deze schema's wordt enig verlies van informatie geaccepteerd, omdat het weglaten van niet-belangrijke details opslagruimte kan besparen. Er is een overeenkomstige afweging tussen het behouden van informatie en het verkleinen ervan. Gegevenscompressiesystemen met verlies zijn ontworpen door onderzoek naar hoe mensen de gegevens waarnemen. Het menselijk oog is bijvoorbeeld gevoeliger voor subtiele variaties in helderheid dan voor kleurvariaties. JPEG-beeldcompressie werkt gedeeltelijk door niet-belangrijke stukjes informatie af te ronden. Een aantal populaire compressieformaten maken gebruik van deze verschillen, waaronder psychoakoestiek voor geluid en psychovisuals voor afbeeldingen en video. De meeste vormen van compressie met verlies zijn gebaseerd op transformatiecodering. Het werd voor het eerst voorgesteld in 1972 door Nasir Ahmed, die vervolgens in 1973 samen met T. Natarajan en KR Rao die het ontwikkelde, voordat hij het in januari 1974 introduceerde. DCT is de meest gebruikte compressiemethode met verlies en wordt gebruikt in multimediaformaten voor afbeeldingen (zoals JPEG en HEIF), video (zoals MPEG, AVC en HEVC) en audio (zoals MP3, AAC en Vorbis) . Lossy beeldcompressie wordt gebruikt in digitale camera's om zo min mogelijk opslagruimte te gebruiken. Op dezelfde manier gebruiken dvd's, Blu-ray en streaming video lossy videocoderingsformaten. Compressie met verlies wordt vaal gebruikt in video's. Bij lossy audiocompressie worden methoden uit de psychoakoestiek gebruikt om niet-hoorbare (of minder hoorbare) geluiden van het audiosignaal te verwijderen. Compressie van menselijke spraak wordt vaak uitgevoerd met nog meer gespecialiseerde technieken; spraakcodering onderscheidt zich als een aparte discipline van audiocompressie. Spraakcodering wordt gebruikt bij internettelefonie. Audiocompressie wordt bijvoorbeeld gebruikt voor het leeghalen van cd's en wordt gedecodeerd door de audiospelers. Compressie met verlies kan generatieverlies veroorzaken.