H264 grunnleggende prinsipper

Forord
H264-videokomprimeringsalgoritmen er nå utvilsomt den mest brukte og mest populære av alle videokomprimeringsteknikker. Med introduksjonen av biblioteker med åpen kildekode som x264 / openh264 og ffmpeg, trenger de fleste brukere ikke lenger å gjøre for mye forskning på detaljene i H264, noe som i stor grad reduserer kostnadene for folk som bruker H264.

Men for å kunne bruke H264 godt, må vi fremdeles finne ut de grunnleggende prinsippene til H264. I dag skal vi se på de grunnleggende prinsippene til H264.

H264-komprimeringsteknologi bruker hovedsakelig følgende metoder for å komprimere videodata. inkludere:

Prediksjonskomprimering innen rammen løser problemet med romlig dataredundans.
Inter-frame prediction compression (bevegelsesestimering og kompensasjon) løser problemet med tidsdomene dataredundans.
Integer Discrete Cosine Transform (DCT), som forvandler den romlige korrelasjonen til irrelevante data i frekvensdomenet og deretter kvantiserer det.
CABAC-komprimering.
Den komprimerte rammen er delt inn i: I-ramme, P-ramme og B-ramme:

I frame: nøkkelramme, ved hjelp av komprimeringsteknologi innenfor rammen.
P-ramme: fremover referanseramme, når du komprimerer, refererer du bare til den tidligere behandlede rammen. Bruk rammelydkomprimeringsteknologi.
B-ramme: En toveis referanseramme. Under komprimering refererer den til forrige ramme og følgende ramme. Bruker komprimeringsteknologi mellom rammer.
I tillegg til I / P / B-rammer, er det også bildesekvenser GOP.

GOP: Mellom to I-rammer er en bildesekvens, og det er bare en I-ramme i en bildesekvens. Som vist under:

H264 komprimeringsteknologi
Det grunnleggende prinsippet til H264 er faktisk veldig enkelt, la oss kort beskrive prosessen med H264-komprimering av data. Videorammene fanget av kameraet (beregnet til 30 bilder per sekund) sendes til bufferen til H264-koderen. Koderen må først dele makroblokker for hvert bilde.

Partisjon makroblokk
H264 bruker et 16X16-område som en makroblokk som standard, og det kan også deles inn i 8X8-størrelse.

Analogt, beregnes pikselverdien til hver makroblokk i et bilde, og alle makroblokkene behandles som følger.

Underblokk
H264 bruker 16X16 makroblokker for relativt flate bilder. For å oppnå høyere kompresjonshastighet kan mindre delblokker imidlertid også deles inn i 16X16 makroblokker. Størrelsen på underblokken kan være 8X16, 16X8, 8X8, 4X8, 8X4, 4X4, som er veldig fleksibel.

På bildet ovenfor har de fleste 16X16 makroblokkene i den røde rammen blå bakgrunn, og en del av bildet av de tre ørnene er tegnet i denne makroblokken. For å bedre behandle de delvise bildene av de tre ørnene, er H264 flere underblokker delt inn i 16X16 makroblokker.

På denne måten, etter intra-frame komprimering, kan mer effektive data oppnås. Figuren nedenfor er resultatet av komprimering av de ovennevnte makroblokkene ved å bruke henholdsvis mpeg-2 og H264. Den venstre halvdelen er et resultat av komprimering etter MPEG-2-deleblokkdelingen, og den høyre halvdelen er et resultat av H264-underblokkkomprimering. Det kan sees at H264-divisjonsmetoden har flere fordeler.

Rammegruppering
For videodata er det hovedsakelig to typer dataredundans, den ene er dataredundans i tid, og den andre er dataredundans i rommet. Blant dem er dataredundansen i tid den største. La oss først snakke om redundansproblemet med videodatatiden.

Hvorfor er tidsredundansen størst? Forutsatt at kameraet tar 30 bilder per sekund, er dataene til disse 30 bildene stort sett relatert. Det er også mulig at mer enn 30 bilderammer, titalls bilder eller hundrevis av bilderammer er spesielt nært beslektede.

For disse veldig nært beslektede rammene trenger vi faktisk bare å lagre en dataramme, og andre bilder kan forutsies fra denne rammen i henhold til visse regler, slik at videodataene har mest tidsredundans.

For å oppnå at de aktuelle bildene komprimerer data gjennom prediksjonsmetoden, er det nødvendig å gruppere videorammene. Så hvordan kan du bestemme at visse rammer er nært beslektede og kan grupperes sammen? La oss se på et eksempel. Nedenfor er en fanget videoramme av en gruppe biljardkuler i bevegelse. Biljardkulene ruller fra øvre høyre hjørne til nedre venstre hjørne.

H264-koderen tar ut to tilstøtende rammer hver gang for å sammenligne makroblokkene for å beregne likheten til de to rammene. Som vist under:

Gjennom makroblokk-skanning og makroblokk-søk kan det bli funnet at korrelasjonen mellom de to rammene er veldig høy. Videre er det funnet at korrelasjonsgraden til denne gruppen rammer er veldig høy. Derfor kan de ovennevnte rammene deles inn i en gruppe. Algoritmen er: i de tilstøtende bildene er pikslene som vanligvis er forskjellige bare innenfor 10%, lysstyrkeforskjellen overstiger ikke 2%, og kromatisitetsforskjellen endres bare innen 1%. Vi tror dette Grafene kan grupperes sammen.

I en slik gruppe rammer, etter koding, beholder vi bare fullstendige data for det første innlegget, og andre rammer blir beregnet ved å referere til forrige ramme. Vi kaller den første rammen IDR / I-ramme, og andre rammer kaller vi P / B-rammen, så vi kaller den kodede datarammegruppen GOP.

Beregning av bevegelse og kompensasjon
Etter at rammene er gruppert i H264-koderen, er det nødvendig å beregne bevegelsesvektorene til objektene i rammegruppen. Tar vi den ovennevnte bevegelige biljardvideoen som et eksempel, la oss ta en titt på hvordan den beregner bevegelsesvektoren.

H264-koderen tar først ut to bilder av videodata fra bufferoverskriften i rekkefølge, og utfører deretter makroblokkskanning. Når et objekt blir funnet på et av bildene, blir søket utført i nærheten av det andre bildet (i søkevinduet). Hvis objektet er funnet i et annet bilde på dette tidspunktet, kan objektets bevegelsesvektor beregnes. Følgende bilde viser posisjonen til biljardballen etter søk.

Gjennom forskjellen mellom posisjonene til biljardkulene i bildet ovenfor, kan retning og avstand på bordbildet beregnes. H264 registrerer avstanden og retningen til ballbevegelsen i hver ramme etter tur, og det blir følgende.

Etter at bevegelsesvektoren er beregnet, trekkes den samme delen (det vil si den grønne delen) for å få kompensasjonsdataene. Til slutt trenger vi bare å komprimere og lagre kompensasjonsdataene, og deretter kan originalbildet gjenopprettes ved dekoding. De komprimerte dataene trenger bare å registrere en liten mengde data. Som følger:

Vi kaller bevegelsesvektor og kompensasjon som komprimeringsteknologi mellom rammer, som løser dataredundansen til videorammer i tide. I tillegg til komprimering mellom rammer, må også datakomprimering utføres innenfor rammen. Datakomprimering innen rammen løser overflødig dataredundans. Nå skal vi introdusere komprimeringsteknologien innen rammen.

Intra spådom
Det menneskelige øye har en viss gjenkjenning av bildet, det er veldig følsomt for lysstyrken på lav frekvens, og er ikke veldig følsom for lysstyrken på høy frekvens. Basert på noen undersøkelser kan data som ikke er følsomme for menneskelige øyne, fjernes fra et bilde. På denne måten foreslås teknologi for intra-prediksjon.

In-frame komprimering av H264 er veldig lik JPEG. Etter at et bilde er delt inn i makroblokker, kan hver makroblokk forutsies i 9 moduser. Finn prediksjonsmodusen som er nærmest originalbildet.

Sammenligningen mellom bildet etter intra-prediksjon og originalbildet er som følger:

Deretter trekkes originalbildet og det intra-predikerte bildet for å oppnå en restverdi.

Lagre deretter informasjonen om prediksjonsmodus vi fikk før, slik at vi kan gjenopprette det opprinnelige bildet når vi dekoder. Effekten er som følger:

Etter komprimering mellom bilder og bilder, selv om dataene er kraftig redusert, er det fortsatt rom for optimalisering.

Gjør DCT på gjenværende data
Resterende data kan bli utsatt for heltall diskret cosinustransformasjon for å fjerne korrelasjonen av dataene og ytterligere komprimere dataene. Som vist i figuren nedenfor, er venstre side makroblokken til de opprinnelige dataene, og høyre side er makroblokken til de beregnede restdataene.

Etter at de tilknyttede dataene er fjernet, kan vi se at dataene komprimeres ytterligere.

Etter at DCT er ferdig, er det ikke nok, og CABAC er nødvendig for tapsfri komprimering.

CABAC
Ovennevnte intra-ramme komprimering er en lossy komprimeringsteknikk. Med andre ord, etter at bildet er komprimert, kan det ikke gjenopprettes helt. CABAC er en tapsfri komprimeringsteknologi.

Tapsfri komprimeringsteknologi kan være den mest kjente for alle er Huffman-koding, en kort kode for høyfrekvente ord, en lang kode for lavfrekvente ord for å oppnå formålet med datakomprimering. VLC brukt i MPEG-2 er denne typen algoritme, vi tar AZ som et eksempel, A tilhører høyfrekvente data, og Z tilhører lavfrekvente data. Se hvordan det gjøres.

CABAC er også en kort kode for høyfrekvente data og en lang kode for lavfrekvente data. Samtidig vil den komprimere basert på kontekst, som er mye mer effektiv enn VLC. Effekten er som følger:

Det er åpenbart fra bildet ovenfor at det tapsfrie kompresjonsopplegget ved bruk av CACBA er mye mer effektivt enn VLC.

sammendrag
På dette punktet er vi ferdig med H264-kodingsprinsippet. Denne artikkelen snakker hovedsakelig om følgende punkter:
1. Jianyin introduserte noen grunnleggende konsepter i H264. Slik som I / P / B-ramme, GOP.
2. Forklarte de grunnleggende prinsippene for H264-koding i detalj, inkludert:

Makroblokk divisjon
Bildegruppering
Intra-frame komprimeringsteknologiprinsipp
Prinsippet om komprimeringsteknologi mellom rammer.
DCT
CABAC kompresjonsprinsipp.

Hvor langt (lang) senderen dekke?

Rekkevidden avhenger av mange faktorer. Den virkelige avstand er basert på antennen installeres høyde, antenneforsterkning, ved hjelp miljø som bygning og andre hindringer, følsomheten til mottakeren, antennen til mottakeren. Installere antennen mer høy og bruke på landsbygda, avstanden vil mye mer langt.

Eksempel 5W FM-sender bruke i byen og hjemby:

Jeg har en USA kundens bruk 5W FM-sender med GP-antenne i hjembyen, og han teste den med en bil, det dekker 10km (6.21mile).

Jeg teste 5W FM-sender med GP-antenne i hjembyen min, det dekker ca 2km (1.24mile).

Jeg teste 5W FM-sender med GP-antenne i byen Guangzhou, det dekker omtrent bare 300meter (984ft).

Nedenfor er det tilnærmede område av forskjellige kraft FM-sendere. (Utvalget er diameter)

0.1W ~ 5W FM-sender: 100M ~ 1KM

5W ~ 15W FM Ttransmitter: 1KM ~ 3KM

15W ~ 80W FM-sender: 3KM ~ 10KM

80W ~ 500W FM-sender: 10KM ~ 30KM

500W ~ 1000W FM-sender: 30KM ~ 50KM

1KW ~ 2KW FM-sender: 50KM ~ 100KM

2KW ~ 5KW FM-sender: 100KM ~ 150KM

5KW ~ 10KW FM-sender: 150KM ~ 200KM

Hvordan kontakte oss for senderen?

Ring meg + 8618078869184 ELLER
Email meg [e-postbeskyttet]
1.How langt du ønsker å dekke i diameter?
2.How høyt av dere Tower?
3.Where er du fra?
Og vi vil gi deg mer faglige råd.

Om Oss

FMUSER.ORG er et systemintegrasjonsfirma som fokuserer på RF trådløs overføring / studio video lydutstyr / streaming og databehandling. Vi leverer alt fra råd og rådgivning gjennom rackintegrasjon til installasjon, igangkjøring og opplæring.

Vi tilbyr FM-sender, Analog TV-sender, Digital-TV-sender, VHF UHF-sender, Antenner, Koaksialkabelkontakter, STL, On Air-behandling, Broadcast-produkter for Studio, RF Signal Monitoring, RDS-kodere, Lydprosessorer og Remote Site Control Units, IPTV-produkter, Video / Audio Encoder / dekoder, designet for å møte behovene til både store internasjonale kringkastingsnettverk og små private stasjoner.

Vår løsning har FM-radiostasjon / Analog TV-stasjon / Digital TV-stasjon / Audio Video Studio-utstyr / Studio Transmitter Link / Transmitter Telemetry System / Hotel TV System / IPTV Live Broadcasting / Streaming Live Broadcast / Video Conference / CATV Broadcasting system.

Vi bruker avanserte teknologiprodukter til alle systemene, fordi vi vet at høy pålitelighet og høy ytelse er så viktige for systemet og løsningen. Samtidig må vi også sørge for at vårt produktsystem har en svært rimelig pris.

Vi har kunder fra offentlige og kommersielle kringkastingstjenester, telekomoperatører og reguleringsmyndigheter, og vi tilbyr også løsninger og produkter til mange hundre mindre, lokale og lokale kringkastere.

FMUSER.ORG har eksportert mer enn 15 år og har kunder over hele verden. Med 13 års erfaring innen dette feltet har vi et profesjonelt team for å løse kundens alle slags problemer. Vi er dedikert til å levere den ekstremt rimelige prisen på profesjonelle produkter og tjenester. Kontakt Epost : [e-postbeskyttet]

vår fabrikk

Vi har modernisering av fabrikken. Du er velkommen til å besøke vår fabrikk når du kommer til Kina.

I dag er det allerede 1095 kunder hele verden besøkt våre Guangzhou Tianhe kontor. Hvis du kommer til Kina, er du velkommen til å besøke oss.

på Fair

Dette er vår deltakelse i 2012 Global Sources Hong Kong Electronics Fair . Kunder fra hele verden endelig har en sjanse til å komme sammen.

Hvor er Fmuser?

Du kan søke i disse tallene " 23.127460034623816,113.33224654197693 "på google map, så finner du vårt fmuser-kontor.

FMUSER Guangzhou Kontoret ligger i Tianhe District, som er den midten av Canton . Veldig nær til Canton Fair , Guangzhou jernbanestasjon, Xiaobei veien og dashatou , Trenger bare 10 minutter hvis ta TAXI . Velkommen venner over hele verden til å besøke og forhandle.

Kontakt: Sky Blå
Mobil: + 8618078869184
WhatsApp: + 8618078869184
Wechat: + 8618078869184
E-post: [e-postbeskyttet]
QQ: 727926717
Skype: sky198710021
Adresse: No.305 Room Huilan Building No.273 Huanpu Road Guangzhou Kina Postnummer: 510620

Engelsk: Vi aksepterer alle betalinger, for eksempel PayPal, kredittkort, Western Union, Alipay, Money Bookers, T / T, LC, DP, DA, OA, Payoneer. Hvis du har spørsmål, kan du kontakte meg [e-postbeskyttet] eller WhatsApp + 8618078869184

PayPal.  www.paypal.com

Vi anbefaler at du bruker Paypal til å kjøpe våre produkter, er The Paypal en sikker måte å kjøpe på internett.

Hver av våre element liste siden bunnen på toppen har en paypal logo for å betale.

Kredittkort.Hvis du ikke har paypal, men du har kredittkort, kan du også klikke Yellow PayPal knappen for å betale med kredittkort.

-------------------------------------------------- -------------------

Men hvis du ikke har et kredittkort og ikke har en PayPal-konto eller vanskelig å fikk en paypal Kontoinnstillinger, kan du bruke følgende:
Western Union.  www.westernunion.com

Betal med Western Union til meg:

Fornavn / Fornavn: Yingfeng
Etternavn / etternavn / etternavn: Zhang
Fullt navn: Yingfeng Zhang
Land: Kina
By: Guangzhou

-------------------------------------------------- -------------------

T / T.  betal med T / T (wire transfer / telegrafisk overføring / Bank Transfer)
Første BANKINFORMASJON (SELSKAPSKONTO):

SWIFT BIC: BKCHHKHHXXX
Bank navn: BANK OF CHINA (HONG KONG) LIMITED, HONG KONG
Bankadresse: BANKEN AV KINA TOREN, 1 GARDEN ROAD, CENTRAL, HONG KONG
BANK KODE: 012
Kontonavn: FMUSER INTERNATIONAL GROUP LIMITED
Kontonr. : 012-676-2-007855-0

-------------------------------------------------- -------------------
Andre BANKINFORMASJON (SELSKAPSKONTO):
Mottaker: Fmuser International Group Inc.
Kontonummer: 44050158090900000337
Mottakerens bank: China Construction Bank Guangdong Branch
SWIFT-kode: PCBCCNBJGDX
Adresse: NO.553 Tianhe Road, Guangzhou, Guangdong, Tianhe District, Kina
** Merk: Når du overfører penger til bankkontoen vår, vennligst IKKE skriv noe i kommentarområdet, ellers vil vi ikke kunne motta betalingen på grunn av myndighetens policy for internasjonal handel.

* Det vil bli sendt i 1-2 arbeidsdager når betaling klart.

* Vi vil sende den til din paypal adresse. Hvis du ønsker å endre adresse, send riktig adresse og telefonnummer til min e-post [e-postbeskyttet]

* Hvis pakkene er under 2kg, vil vi bli sendt via post luftpost, vil det ta ca 15-25days til hånden din.

Hvis pakken er mer enn 2kg, vil vi sende via EMS, DHL, UPS, Fedex rask ekspresslevering, vil det ta ca 7 ~ 15days til hånden din.

Hvis pakken mer enn 100kg, vil vi sende via DHL eller flyfrakt. Det vil ta om 3 ~ 7days til hånden din.

Alle pakkene er skjema Kina Guangzhou.

* Pakken sendes som en "gave" og avvises så lite som mulig, kjøper trenger ikke betale for "TAX".

* Etter skip, vil vi sende deg en e-post og gi deg sporingsnummeret.

For garanti.
Kontakt oss --- >> Returner varen til oss --- >> Motta og send en ny erstatning.

Navn: Liu Xiaoxia
Adresse: 305Fang HuiLanGe HuangPuDaDaoXi 273Hao TianHeQu Guangzhou Kina.
ZIP: 510620
Telefon: + 8618078869184

Vennligst gå tilbake til denne adressen og skriv din paypal adresse, navn, problem på merknad: