FMUSER Wirless Overfør video og lyd enklere!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albansk
ar.fmuser.org -> arabisk
hy.fmuser.org -> armensk
az.fmuser.org -> aserbajdsjansk
eu.fmuser.org -> baskisk
be.fmuser.org -> hviterussisk
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> katalansk
zh-CN.fmuser.org -> Kinesisk (forenklet)
zh-TW.fmuser.org -> Kinesisk (tradisjonell)
hr.fmuser.org -> Kroatisk
cs.fmuser.org -> tsjekkisk
da.fmuser.org -> dansk
nl.fmuser.org -> Nederlandsk
et.fmuser.org -> estisk
tl.fmuser.org -> filippinsk
fi.fmuser.org -> finsk
fr.fmuser.org -> French
gl.fmuser.org -> galisisk
ka.fmuser.org -> Georgisk
de.fmuser.org -> tysk
el.fmuser.org -> gresk
ht.fmuser.org -> haitisk kreolsk
iw.fmuser.org -> hebraisk
hi.fmuser.org -> hindi
hu.fmuser.org -> Ungarsk
is.fmuser.org -> islandsk
id.fmuser.org -> indonesisk
ga.fmuser.org -> Irsk
it.fmuser.org -> Italiensk
ja.fmuser.org -> japansk
ko.fmuser.org -> koreansk
lv.fmuser.org -> lettisk
lt.fmuser.org -> litauisk
mk.fmuser.org -> makedonsk
ms.fmuser.org -> malaysisk
mt.fmuser.org -> maltesisk
no.fmuser.org -> norsk
fa.fmuser.org -> persisk
pl.fmuser.org -> polsk
pt.fmuser.org -> portugisisk
ro.fmuser.org -> rumensk
ru.fmuser.org -> russisk
sr.fmuser.org -> serbisk
sk.fmuser.org -> Slovakisk
sl.fmuser.org -> Slovenian
es.fmuser.org -> spansk
sw.fmuser.org -> Swahili
sv.fmuser.org -> svensk
th.fmuser.org -> Thai
tr.fmuser.org -> tyrkisk
uk.fmuser.org -> ukrainsk
ur.fmuser.org -> urdu
vi.fmuser.org -> Vietnamesisk
cy.fmuser.org -> walisisk
yi.fmuser.org -> Yiddish
(1) Overflødig informasjon om videosignal
Tar YUV-komponentformatet for opptak av digital video som et eksempel, representerer YUV henholdsvis lysstyrke og to fargeforskjellsignaler. For eksempel, for eksisterende pal TV-system, er samplingsfrekvensen til luminanssignalet 13.5 mhz; frekvensbåndet til kromsignal er vanligvis halvparten eller mindre av lysstyrkesignalet, som er 6.75 mhz eller 3.375 mhz. Tar vi samplingsfrekvensen 4: 2: 2 som et eksempel, vedtar Y-signalet 13.5 mhz, chromasignalet U og V samples med 6.75 mhz, og samplingssignalet kvantiseres med 8 bit, så kan kodehastigheten til digital video beregnes som følger:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216Mbit / s
Hvis en så stor datamengde lagres eller overføres direkte, vil det være vanskelig å bruke komprimeringsteknologi for å redusere bithastigheten. Det digitale videosignalet kan komprimeres i henhold til to grunnleggende forhold:
L. data redundans. For eksempel romlig redundans, tidsredundans, strukturredundans, informasjonsentropi-redundans, etc., det vil si at det er en sterk korrelasjon mellom bildepiksler. Å eliminere disse overflødighetene fører ikke til tap av informasjon, og det er tapsfri komprimering.
L. visuell redundans. Noen kjennetegn ved menneskelige øyne, for eksempel terskel ved lysdiskriminering, visuell terskel, er forskjellige i lysfølsomhet og kroma, noe som gjør det umulig å innføre passende feil i kodingen og vil ikke bli oppdaget. De visuelle egenskapene til menneskelige øyne kan brukes til å bytte mot datakomprimering med viss objektiv forvrengning. Denne komprimeringen er tapsfri.
Komprimering av digitalt videosignal er basert på de to ovennevnte forholdene, noe som gjør videodataene sterkt komprimert, noe som bidrar til overføring og lagring. De vanlige metodene for digital videokomprimering er blandet koding, som er å kombinere transformeringskoding, bevegelsesestimering og bevegelseskompensasjon, og entropikoding for å komprimere koding. Vanligvis brukes transformeringskoding for å eliminere bildets redundans i bildet, og bevegelsesestimering og bevegelseskompensasjon brukes til å fjerne inter-frame-redundansen i bildet, og entropikoding brukes til å forbedre kompresjonseffektiviteten ytterligere. Følgende tre kompresjonskodemetoder introduseres kort.
(a) Kompresjonskodemetode
(b) Transform koding
Funksjonen til transformeringskoding er å transformere bildesignalet som er beskrevet i romdomenet til frekvensdomenet, og deretter kode de transformerte koeffisientene. Generelt sett har bildet sterk korrelasjon i rommet, og transformasjonen til frekvensdomenet kan realisere dekorrelasjon og energikonsentrasjon. Den vanlige ortogonale transformasjonen inkluderer diskret Fourier-transform, diskret cosinustransformasjon og så videre. Diskret cosinustransformasjon er mye brukt i digital videokomprimering.
Diskret cosinustransformasjon er referert til som DCT-transformasjon. Det kan transformere bildeblokken til L * l fra romdomene til frekvensdomener. Derfor, i prosessen med bildekomprimering og koding basert på DCT, må bildet deles i ikke-overlappende bildeblokker. Anta at størrelsen på et bilde er 1280 * 720, det er delt inn i 160 * 90 bildeblokker med 8 * 8 størrelse uten overlapping i form av rutenett. Deretter kan DCT-transformasjon utføres for hver bildeblokk.
Etter at blokken er delt, blir hver 8 * 8-punkts bildeblokk sendt til DCT-koderen, og 8 * 8-bildeblokken transformeres fra det romlige domenet til frekvensdomenet. Figuren nedenfor viser et eksempel på en bildeblokk på 8 * 8 der tallet representerer lysstyrkeverdien til hver piksel. Det kan sees fra figuren at lysstyrkeverdiene til hver piksel i denne bildeblokken er relativt jevn, spesielt lysstyrkeverdien til tilstøtende piksler er ikke veldig stor, noe som indikerer at bildesignalet har en sterk korrelasjon.
En faktisk 8 * 8 bildeblokk
Følgende figur viser resultatene av DCT-transformasjon av bildeblokken i figuren ovenfor. Det kan sees fra figuren at etter DCT-transformasjon konsentrerer lavfrekvenskoeffisienten i øvre venstre hjørne mye energi, mens energien på høyfrekvenskoeffisienten i nedre høyre hjørne er veldig liten.
Koeffisientene for bildeblokkering etter DCT-transformasjon
Signalet må kvantifiseres etter DCT-transformasjon. Fordi menneskelige øyne er følsomme for bilder med lav frekvens, for eksempel den generelle lysstyrken til objekter, og ikke for høyfrekvensdetaljene i bildet, kan høyfrekvent informasjon i overføringsprosessen overføres mindre eller ikke, bare den lavfrekvente delen. Kvantiseringsprosessen reduserer informasjonsoverføringen ved å kvantifisere koeffisientene for lavfrekvent region og grov kvantisering av koeffisientene i høyfrekvent region, som fjerner høyfrekvent informasjon som ikke er følsom for menneskelige øyne. Derfor er kvantisering en tapsfri kompresjonsprosess og hovedårsaken til kvalitetsskaden i videokompresjonskoding.
Kvantifiseringsprosessen kan uttrykkes med følgende formel:
Blant dem representerer FQ (U, V) DCT-koeffisienten etter kvantisering; f (U, V) representerer DCT-koeffisient før kvantisering; Q (U, V) representerer kvantiseringsvektende matrise; q er kvantiseringstrinn; runde refererer til konsolidering, og verdien som skal sendes blir tatt som nærmeste heltall.
Velg kvantiseringskoeffisienten rimelig, og resultatet etter kvantisering av den transformerte bildeblokken vises i figuren.
DCT-koeffisient etter kvantifisering
De fleste av DCT-koeffisientene endres til 0 etter kvantisering, mens bare noen få koeffisienter ikke er nullverdier. For øyeblikket er det bare disse verdiene som ikke er null, som må komprimeres og kodes.
(b) Entropikoding
Entropy-koding er oppkalt fordi den gjennomsnittlige kodelengden etter koding er nær entropiverdien til kilden. Entropy-koding er implementert av VLC (koding med variabel lengde). Det grunnleggende prinsippet er å gi kort kode til symbolet med høy sannsynlighet i kilden, og å gi lang kode til symbolet med liten sannsynlighet for forekomst, for å oppnå den kortere gjennomsnittlige kodelengden statistisk. Kodning med variabel lengde inkluderer vanligvis Hoffman-kode, aritmetisk kode, kjørekode osv. Kjørelengdekoding er en veldig enkel komprimeringsmetode, dens kompresjonseffektivitet er ikke høy, men kodings- og dekodingshastigheten er rask, og den brukes fortsatt mye, spesielt etter transformasjonen av kodingen, ved hjelp av kjørelengdekoding, har en god effekt.
Først skal vekselstrømskoeffisienten umiddelbart etter kvantiseringsutgangens likestrømskoeffisient skannes i Z-type (som vist i pilelinjen). Z-skanningen forvandler den todimensjonale kvantiseringskoeffisienten til en-dimensjonal sekvens, og fortsetter deretter kodelengden. Til slutt brukes en annen kode med variabel lengde for å kode dataene etter kjøringskodingen, for eksempel Hoffman-koding. Gjennom denne typen koding med variabel lengde forbedres kodingseffektiviteten ytterligere.
(c) Bevegelsesestimering og bevegelseskompensasjon
Bevegelsesestimering og bevegelseskompensasjon er effektive metoder for å eliminere korrelasjonen av bildesekvensers tidsretning. DCT-transformerings-, kvantiserings- og entropikodingsmetodene beskrevet ovenfor er basert på ett rammebilde. Gjennom disse metodene kan den romlige korrelasjonen mellom piksler i bildet elimineres. I tillegg til romlig korrelasjon har bildesignal tidsmessig korrelasjon. For eksempel, for digital video med bakgrunnstatisk som nyhetssending og liten bevegelse av hovedbildet, er forskjellen mellom hvert bilde veldig liten, og korrelasjonen mellom bilder er veldig stor. I dette tilfellet trenger vi ikke å kode hvert rammebilde separat, men kan bare kode de endrede delene av tilstøtende videorammer, for ytterligere å redusere datamengden. Dette arbeidet realiseres ved bevegelsesestimering og bevegelseskompensasjon.
Bevegelsesestimeringsteknologi deler vanligvis gjeldende inngangsbilde i flere små bildeblokkblokker som ikke overlapper hverandre, for eksempel er størrelsen på et rammebilde 1280 * 720. For det første er det delt inn i 40 * 45 bildeblokker med 16 * 16 størrelse som ikke overlapper hverandre i form av rutenett, og deretter innenfor rammen av et søkevindu for forrige bilde eller sistnevnte bilde, finne en blokk for hver bildeblokk for å finne en bildeblokk innenfor rammen av en søkevindu Den mest lignende bildeblokken. Søkeprosessen kalles bevegelsesestimering. Ved å beregne posisjonsinformasjonen mellom den mest like bildeblokken og bildeblokken, kan en bevegelsesvektor oppnås. På denne måten kan den nåværende bildeblokken trekkes fra den mest like bildeblokken pekt av referansebildets bevegelsesvektor, og en gjenværende bildeblokk kan oppnås. Fordi hver pikselverdi i restbildeblokken er veldig liten, kan et høyere kompresjonsforhold oppnås ved kompresjonskoding. Denne subtraksjonsprosessen kalles bevegelseskompensasjon.
Fordi det er behov for referansebilde for å bli brukt til bevegelsesestimering og bevegelseskompensasjon i kodeprosessen, er det veldig viktig å velge referansebilde. Generelt deler koderen hvert rammebildeinngang i tre forskjellige typer i henhold til de forskjellige referansebildene: I (intra) ramme, B (veiledningsprognose) ramme og P (prediksjon) ramme. Som vist på figuren.
Typisk I, B, P rammestruktursekvens
Som vist i figuren bruker jeg bare dataene i rammen for koding, og den trenger ikke bevegelsesestimering og bevegelseskompensasjon under kodingsprosessen. Åpenbart, siden jeg rammer ikke eliminerer korrelasjonen av tidsretning, er kompresjonsforholdet relativt lavt. I prosessen med koding bruker P-ramme en front I-ramme eller P-ramme som referansebilde for bevegelseskompensasjon, faktisk koder den forskjellen mellom det nåværende bildet og referansebildet. Kodingsmodusen til B-rammen er lik P-rammen, den eneste forskjellen er at den trenger å bruke en front I-ramme eller P-ramme og en senere I-ramme eller P-ramme for å forutsi under kodingsprosessen. Dermed må hver P-rammekoding bruke ett rammebilde som referansebilde, mens ramme B trenger to rammer som referanse. Derimot har B-ramme et høyere kompresjonsforhold enn P-ramme.
(d) Blandet koding
Papiret introduserer flere viktige metoder innen videokomprimering og koding. I praktisk anvendelse skilles ikke disse metodene, og de kombineres vanligvis for å oppnå den beste kompresjonseffekten. Følgende figur viser modellen for hybrid koding (dvs. transformeringskoding + bevegelsesestimering og bevegelseskompensasjon + entropikoding). Modellen er mye brukt i MPEG1, MPEG2, H.264 og andre standarder. Fra figuren kan vi se at det nåværende inngangsbildet må deles inn i blokker først, blokken til bildet som er oppnådd av blokken skal trekkes fra forutsagt bilde etter bevegelseskompensasjon for å oppnå differansebildet x, og deretter utføres DCT-transformasjon og kvantisering for differensbildeblokken. De kvantiserte utdataene har to forskjellige steder: den ene er å sende den til entropikoderen for koding, og den kodede kodestrømmen sendes ut til en cache Lagre i enheten og vent på overføring. En annen applikasjon er å motvirke kvantifisering og reversere endring til signal x ', som legger til bildeblokkutgangen med bevegelseskompensasjon for å oppnå et nytt prediksjonsbildesignal, og sender en ny prediksjonsbildeblokk til rammeminnet.
|
Skriv inn e-post for å få en overraskelse
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albansk
ar.fmuser.org -> arabisk
hy.fmuser.org -> armensk
az.fmuser.org -> aserbajdsjansk
eu.fmuser.org -> baskisk
be.fmuser.org -> hviterussisk
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> katalansk
zh-CN.fmuser.org -> Kinesisk (forenklet)
zh-TW.fmuser.org -> Kinesisk (tradisjonell)
hr.fmuser.org -> Kroatisk
cs.fmuser.org -> tsjekkisk
da.fmuser.org -> dansk
nl.fmuser.org -> Nederlandsk
et.fmuser.org -> estisk
tl.fmuser.org -> filippinsk
fi.fmuser.org -> finsk
fr.fmuser.org -> French
gl.fmuser.org -> galisisk
ka.fmuser.org -> Georgisk
de.fmuser.org -> tysk
el.fmuser.org -> gresk
ht.fmuser.org -> haitisk kreolsk
iw.fmuser.org -> hebraisk
hi.fmuser.org -> hindi
hu.fmuser.org -> Ungarsk
is.fmuser.org -> islandsk
id.fmuser.org -> indonesisk
ga.fmuser.org -> Irsk
it.fmuser.org -> Italiensk
ja.fmuser.org -> japansk
ko.fmuser.org -> koreansk
lv.fmuser.org -> lettisk
lt.fmuser.org -> litauisk
mk.fmuser.org -> makedonsk
ms.fmuser.org -> malaysisk
mt.fmuser.org -> maltesisk
no.fmuser.org -> norsk
fa.fmuser.org -> persisk
pl.fmuser.org -> polsk
pt.fmuser.org -> portugisisk
ro.fmuser.org -> rumensk
ru.fmuser.org -> russisk
sr.fmuser.org -> serbisk
sk.fmuser.org -> Slovakisk
sl.fmuser.org -> Slovenian
es.fmuser.org -> spansk
sw.fmuser.org -> Swahili
sv.fmuser.org -> svensk
th.fmuser.org -> Thai
tr.fmuser.org -> tyrkisk
uk.fmuser.org -> ukrainsk
ur.fmuser.org -> urdu
vi.fmuser.org -> Vietnamesisk
cy.fmuser.org -> walisisk
yi.fmuser.org -> Yiddish
FMUSER Wirless Overfør video og lyd enklere!
Kontakt
Adresse:
No.305 Room HuiLan Building No.273 Huanpu Road Guangzhou Kina 510620
Type kategori
Nyhetsbrev