Chroma subsampling innebär komprimering av färginformation i videofilmer för att minska den totala lagringsstorleken och bithastigheten för videofiler. Det är en metod som används över flera videocodec, och hur mycket komprimering som sker uttrycks ofta som en uppsättning siffror som 4:2:2. Istället för att servera dig nummersoppa, låt oss se till att du har en förklaring av vad det betyder. Oavsett om det är 4:4:4 eller 4:2:0 kan den här specifikationen ha en djupgående inverkan på en video, särskilt under efterproduktion.
Pixlar:Videobyggstenarna
För att förstå chroma subsampling är det viktigt att förstå hur en bild skapas i en videoram. I de enklaste termerna består en videobild av pixlar - ensamma punkter som är raderade i rader över skärmen. Varje pixel har en specifik luminans och krominans, båda bestäms av data som definierar den pixeln. Luminans hänvisar till hur ljus en pixel är, den skapar kontrast och detaljer i den övergripande bilden. Om luminansinformationen är isolerad, utan färginformationen, blir den resulterande bilden i svartvitt. Tekniskt sett skulle det vara gråskala, eftersom det finns varierande kontrastdjup mellan rent svart och rent vitt.
Krominans är färginformationen för en pixel, den avgör om en pixel är röd, grön, blå eller någonstans däremellan. Det finns flera färgrymder genom vilka färg återges, oavsett vilka, är den grundläggande metoden för subsampling av kroma densamma. Medan luminans kan återge en svartvit bild när den är isolerad, gör krominans svart när den är isolerad. Det är beroende av luminansen för att skapa en bild. Krominansen är data som definierar färgen och hur mycket av den färgen som representeras i varje pixel. Chroma subsampling är en reduktion av färginformation. Det uppnås genom att dela data för en pixel över ett urval av flera pixlar, färre än de som utgör hela bilden.
Det mänskliga ögat
Chroma subsampling är effektiv och framgångsrik, inte bara på grund av videons anatomi, utan på grund av det mänskliga ögat och hur det ser färg och tolkar bilder. Det mänskliga ögat är en anmärkningsvärd del av det centrala nervsystemet. Den kan fånga och fokusera ljus på sina fotoreceptorer och leverera data från den visuella input till hjärnan. Fotoreceptorer är de celler som kantar baksidan av ögat i näthinnan, där ljuset fokuseras. Det finns två grundläggande typer av fotoreceptorceller:stavar och kottar. Stavar är mycket känsliga för ljus och är akromatiska, vilket innebär att de inte ser färg. Kotterna är mindre känsliga för ljus men är kromatiska, kan uppfatta färg.
Det finns 100 eller fler miljoner fotoreceptorceller, och mindre än 20 procent av dem är kottar jämfört med stavar. Det är därför det mänskliga ögat är mer känsligt för luminansen, ljusstyrkan och kontrastdelen av en bild och mindre känslig för färginformationen i en bild. När luminans- och krominansdelarna kombineras för att skapa den övergripande bilden är en försämrad eller komprimerad mängd färginformation inte särskilt märkbar. Det mänskliga ögat ser den övergripande bilden, där bildens skärpa definieras av luminansen och krominansinformationen som är sammansatt inuti. Det faktum att det finns mindre detaljerad information i krominansen förbises av ögat och hela bilden uppfattas.
Hur fungerar chroma subsampling?
För att chroma-subsampling ska fungera och datastorleken på en bild ska reduceras, har ingenjörer hittat ut ett sätt att dela chroma-information över en rad pixlar samtidigt som en annan mängd luminansinformation för samma pixelintervall bibehålls. Valet av information från en del av en bild kallas sampling. Delsampling är urvalet av specifika pixlar, men inte varje pixel, för att bestämma färginformationen som används som representativ för alla pixlar. Delsampling är en del, eller bråkdel, av den totala krominanssamplingen i en bild.
Chroma subsampling uttrycks som en numerisk formel som representerar förhållandet mellan pixlar som används i subsamplingen av det klippet. Detta förhållande representeras av tre tal, åtskilda med kolon. Utskrivet ser det ut som J:a:b, detta är ett förhållande mellan pixelbredden för en samplingsregion jämfört med antalet pixlar som samplades från varje rad i det samplingsområdet. "J" är representativt totalt antal pixlar i det horisontella samplingsområdet. I de flesta fall är "J" lika med fyra.
De följande två siffrorna i förhållandet, "a" och "b" siffrorna, hänvisar till den vertikala upplösningen som samplas över "J" samplingsområdet. Den andra siffran i förhållandet, "a"-positionen, är antalet pixlar som samplades bland den första raden med pixlar enligt definitionen "J". "b"-positionen för förhållandet är antalet pixlar som samplades bland den andra raden av pixlar i "J"-området. Det finns codecs som noterar en fjärde position i förhållandet, det representerar samplingen av pixlar för en alfakanal.
Common Chroma Subsampling Ratios
4:4:4
Detta är den högsta kvaliteten och den har faktiskt ingen delsampling. Varje pixel representeras och behåller sina egna luminans- och kromavärden. De bästa videokamerorna kommer att ha förmågan att mata ut 4:4:4 chroma. Dessa är verktyg av professionell kvalitet och de är prissatta därefter.
4:2:2
4:2:2 färgsamplingen samplar två pixlar från både den övre och nedre raden. Detta minskar färginformationen till 50 procent av den okomprimerade källkroman. Detta är en av de mer populära samplingarna och finns i codecs som AVC-Intra 100, Digital Betacam, Panasonic DVCPRO HD, Apple ProRes 422 och XDCAM HD422.
4:2:0
Den mer reducerade 4:2:0-samplingen tar två färgprover från den översta "a"-raden med pixlar och ingen från den nedre "b"-raden. Istället delar den nedre raden choma-information från den översta radens sampling. Detta minskar den totala färginformationen till cirka 25 procent av den okomprimerade färgen. Konfigurationen av 4:2:0-sampling är vanlig i HDV-material, AVCHD, Apple Intermediate Codec och i många av de MPEG-kodade videoformat som används av DSLR-kameror.
4:1:1
En kroma-sampling på 4:1:1 minskar också mängden kromainformation till 25 procent. Den tar ett prov från den översta "a"-raden med pixlar och ett prov från den nedre "b"-raden med pixlar. En sampling på 4:1:1 är samplingsförhållandet som finns i DVCPRO, DVCAM och i NTSC DV.
Vad betyder det hela?
En videoproducents estetiska beslut begränsas av de tekniska gränserna för deras film. Det är därför det är viktigt att ha en förståelse för chroma subsampling och vad det gör med film. Chroma keying och färggradering är två efterproduktionsprocesser som påverkas av chroma subsampling.
Filmer som i hög grad förlitar sig på chroma-subsampling kommer att ge dåliga resultat vid chromakeying. Programvara för videokompositering kan skapa transparens genom att välja en viss färg, eller färgintervall i ett klipp, och tillämpa det valet på en alfakanal. Alfakanalen skapar transparens i bilden. Kvaliteten på färginformationen i bilden är huvudfaktorn för att dra en ren nyckel från gröna skärmbilder. Ojämn belysning eller färgkonsistens gör det svårare att skapa rena områden med genomskinlighet. Chroma-subsampling blir uppenbar i kanterna av nycklarad film eftersom nyckeln är baserad på den delade färginformationen över block av pixlar. Filmer med en chroma subsampling ekvivalent på 4:1:1, eller mindre, kommer att resultera i blockkantade artefakter längs tangentens kant. Även bilder med ett förhållande på 4:2:2 kommer att innehålla några blockartefakter. De renaste tangenterna kommer från bilder med ett okomprimerat förhållande på 4:4:4.
Färggradering är efterproduktionsprocessen för att ändra dynamiken i färgen i bilder för att uppnå ett estetiskt mål. Ibland är färggraderingen subtil med förändringar som inte märks. Andra gånger är färggraderna drastiska med betydande förändringar i färgen och det dynamiska omfånget i en bild. När färginformationen reduceras på grund av subsampling av färg kan dynamisk färggradering avslöja digitala artefakter i bilder. Detta ses oftast i bandningen som uppstår över färggradienter. Istället för en mjuk övergång från en färg till nästa visas färgband som graderade steg mellan de två färgerna.
Anledningen till detta är enkel - chroma subsampling minskar mängden färginformation mellan två områden i en bild. När dessa färger ändras genom färggradering, blir färgstegen mellan dem - undersamplingen av kroma, mer påtagliga. Det är som om de sträcktes ut. Detta är ytterligare en anledning till att producenter som arbetar med kommersiella projekt, sådana som kräver intensiva färggraderingar, väljer att arbeta med film av högsta kvalitet som deras budget tillåter.
Åtkomst till 4:4:4-utgång
Chroma subsampling hjälper till att komprimera den totala storleken på videofiler, men dessa filer kan vara svårare att arbeta med i efterproduktion. Detta är något att vara medveten om när den här filmen används för grönt skärmarbete, visuella effekter och seriös färggradering. Det finns mer utrymme för vad som kan göras med film i efterproduktion när det finns en större mängd färginformation i bilden. Det bästa alternativet för alla inspelade och bearbetade videor är att ha okomprimerad video med en chroma subsampling på 4:4:4.
Problemet ligger i det faktum att de flesta kameror spelar in internt till solid state media, vilket kräver komprimerad video med chroma subsampling på 4:2:2 eller mindre. De flesta videokameror och DSLR:er har en videoutgång, som SDI eller HDMI. Beroende på kamerans bildsensor, såväl som dess bildprocessor, kan den ha kapacitet att mata ut video med 4:4:4 chroma subsampling. När denna videoutgång är kopplad till en extern inspelningsenhet eller en dator utrustad med ett avancerad videoinspelningskort och motsvarande programvara, blir det ett kraftfullt verktyg.
Om kameran kan mata ut 4:4:4 färgvideo och en extern inspelningsenhet som kan spela in signalen är ansluten, kommer den resulterande videon att vara bättre lämpad för efterproduktionsprocesser. Det är därför som det finns en stor kamerarigg som är kopplad till en dator på många fotograferingar av visuella effekter i studion, till exempel grön skärmdump. En kamerans tekniska manual är det bästa stället att ta reda på om den kan mata ut 4:4:4 färg. Onlineforum dedikerade till de bästa videokamerorna kommer att ha djupgående diskussioner om de bästa sätten att mata ut okomprimerad video.
Vet vad som finns under huden
En producent måste känna till de tekniska begränsningarna för sina filmer och vad de kan göra med det. Det finns många fotograferingssituationer när det är fördelaktigt att ta bilder som är starkt beroende av chroma subsampling för att komprimera bilden, spara utrymme och minska kostnaderna. Det finns också situationer då det är avgörande att skaffa filmer som har högsta möjliga upplösning, filmer som är okomprimerade utan chroma subsampling.
Chroma subsampling är en del av videons dolda anatomi, som arbetar inom dess värdkropp. Genom att ha en gedigen kunskap om vad chroma subsampling är, är producenterna bättre förberedda att manipulera sin video och få de resultat de önskar.
Chris "Ace" Gates är en Emmy-belönt författare och innehållsproducent.