Kapittel 9 · Datakommunikasjon

Multimedia Networking

Hvordan lyd og video reiser over et nett som egentlig bare lover «best effort» — og hva som skjer når pakkene ikke kommer frem i tide.

Det store bildet

En live-konsert gjennom postsystemet

Internett ble designet for data som tåler forsinkelse. Multimedia krever noe helt annet — og hele kapittelet handler om hvordan vi fikser det gapet.

Tenk deg at du skal holde en live-konsert, men musikerne sitter spredt rundt i Norge — og den eneste måten å kommunisere på er postsystemet. Hvert noteark du sender kommer frem, men noen brev bruker én dag, andre bruker fem. For vanlig korrespondanse er det uproblematisk. Men for musikerne er det katastrofe: hvis trommenoten ankommer tre takter for sent, høres hele stykket forferdelig ut. Det er problemet med multimedia over Internett. Nettet garanterer bare «best effort» — pakkene kommer nok frem til slutt, men ingen lover når. For e-post og nettsider spiller det ingen rolle. For video og tale er timing alt.

Løsningen er overraskende elegant: vi kan ikke fikse nettverket (det vil alltid ha variabel forsinkelse), men vi kan bygge smarte mekanismer i endepunktene. Den viktigste idéen er playout-bufferen — en mellomlager hos mottakeren som samler opp pakker og spiller dem av med jevn rate, selv om de ankom med ujevne mellomrom. Det er som om konsertdirigenten venter med å starte stykket til tilstrekkelig mange noteark har kommet frem, slik at musikerne alltid har neste note klar.

Kilde (kamera/mikrofon) Encoder MPEG / PCM Internett variabel delay jitter Playout- buffer jevn rate ut Skjerm / høyttaler Bufferen absorberer jitter: ujevne pakker inn → jevn avspilling ut
Multimedia-pipeline: kilden koder lyd/video, nettverket tilfører variabel forsinkelse (jitter), og playout-bufferen hos mottakeren jevner ut variasjonen slik at avspillingen blir jevn.
Hvorfor Netflix plutselig blir pixlete

Når du ser Netflix og bildet plutselig blir pikselete, er det fordi DASH (Dynamic Adaptive Streaming over HTTP) har byttet til lavere kvalitet fordi nettverket ble tregere. Klienten din ber om videosegmenter i den oppløsningen den tror nettverket klarer akkurat nå. Blir det bedre igjen? Da bytter den tilbake til HD. Alt dette skjer automatisk, uten at du trykker på noe — og det er et direkte resultat av teknikkene i dette kapittelet.

Kapittelet dekker hele spekteret: fra hvordan analog lyd og video blir til en bitstrøm (sampling, komprimering, CBR vs. VBR), via streaming-arkitekturer (HTTP/TCP mot UDP, DASH), til de spesielle utfordringene med sanntidssamtaler (VoIP). Der lærer vi at forsinkelse over 400 ms ødelegger en telefonsamtale, at jitter er farligere enn gjennomsnittlig forsinkelse, og at smarte teknikker som FEC (Forward Error Correction) og interleaving lar oss gjenopprette tapte pakker uten å vente på retransmisjon. Til slutt møter vi RTP — protokollen som gir multimedia-pakker det UDP mangler: tidsstempler, sekvensnummer og type-identifikasjon.

Test deg selv

Sjekk om du har forstått de viktigste konseptene fra dette kapittelet.

Spørsmål 1 · Lett
Hva beskriver best forskjellen mellom streaming og full nedlasting?
Riktig. Streaming starter avspilling før hele filen er mottatt ved å bruke fortløpende buffring.
Spørsmål 2 · Middels
Hvilken påstand er mest korrekt om playout-bufferens rolle i praksis?
Riktig. Playout-buffer glatter ut ujevn pakkeankomst slik at avspilling blir jevnere.
Spørsmål 3 · Vanskelig
I et større nettverk, hvilken vurdering om tradeoff ved større buffer er faglig best?
Riktig. Større buffer tåler mer jitter, men øker opplevd ende-til-ende-forsinkelse.
Spørsmål 4 · Middels
Hvilken påstand er mest korrekt om hva jitter betyr i praksis?
Riktig. Jitter er variasjon i pakkeforsinkelse, ikke nødvendigvis høy gjennomsnittsforsinkelse.
Spørsmål 5 · Lett
Hva beskriver best DASH-klientens bitratevalg?
Riktig. DASH-klienten velger segmentkvalitet dynamisk basert på nettmålinger og bufferfylling.
Spørsmål 6 · Vanskelig
I et større nettverk, hvilken vurdering om segmentlengde i adaptiv video er faglig best?
Riktig. Kortere segmenter gir raskere tilpasning, men høyere protokoll- og request-overhead.
Spørsmål 7 · Middels
Hvilken påstand er mest korrekt om CDN for multimedia i praksis?
Riktig. CDN reduserer forsinkelse og backbone-belastning ved å servere media fra nære edge-noder.
Spørsmål 8 · Vanskelig
I et større nettverk, hvilken vurdering om RTP-sekvensnummer er faglig best?
Riktig. RTP-sekvensnumre brukes til å oppdage tap og håndtere omrekkefølge i mottakeren.
Spørsmål 9 · Lett
Hva beskriver best RTP-tidsstempel?
Riktig. RTP-tidsstempel hjelper mottakeren å plassere mediedata riktig i tidslinjen.
Spørsmål 10 · Vanskelig
I et større nettverk, hvilken vurdering om RTCP-tilbakemelding er faglig best?
Riktig. RTCP rapporterer kvalitetsmål som tap og jitter for adaptiv styring av strømmen.
Spørsmål 11 · Middels
Hvilken påstand er mest korrekt om forsinkelsesgrense for naturlig tale i praksis?
Riktig. Rundt under 150 ms oppleves samtale som naturlig; større forsinkelse gjør dialog vanskeligere.
Spørsmål 12 · Vanskelig
I et større nettverk, hvilken vurdering om hva som skjer over 400 ms taleforsinkelse er faglig best?
Riktig. Ved svært høy forsinkelse begynner deltakere å snakke i munnen på hverandre og opplever dårlig flyt.
Spørsmål 13 · Lett
Hva beskriver best hvorfor UDP ofte brukes for sanntidsmedia?
Riktig. UDP unngår retransmisjonslatens og lar applikasjonen styre taps- og tidsstrategi direkte.
Spørsmål 14 · Middels
Hvilken påstand er mest korrekt om ulempe med TCP for live media i praksis?
Riktig. TCP-retransmisjoner og head-of-line blocking kan øke latenstid uakseptabelt for liveinnhold.
Spørsmål 15 · Vanskelig
I et større nettverk, hvilken vurdering om FEC i mediestrømmer er faglig best?
Riktig. FEC legger til redundans slik at mottaker kan rekonstruere tapte pakker uten retransmisjon.
Spørsmål 16 · Middels
Hvilken påstand er mest korrekt om interleaving i praksis?
Riktig. Interleaving sprer bursttap over tid slik at feil blir mindre hørbare/synlige.
Spørsmål 17 · Lett
Hva beskriver best QoE-faktorer i video?
Riktig. Oppstartstid, rebuffering, bildekvalitet og kvalitetsbytter påvirker brukeropplevelse mest.
Spørsmål 18 · Vanskelig
I et større nettverk, hvilken vurdering om adaptiv bitrate ved dårlig nett er faglig best?
Riktig. Ved redusert kapasitet bør klienten senke bitrate tidlig for å unngå avspillingsstopp.
Spørsmål 19 · Middels
Hvilken påstand er mest korrekt om lavlatens live-streaming i praksis?
Riktig. Lavlatensoppsett bruker mindre buffere og kortere segmenter, men tåler mindre nettverksvariasjon.
Spørsmål 20 · Vanskelig
I et større nettverk, hvilken vurdering om I/P/B-rammer i videokoding er faglig best?
Riktig. I-rammer gir referansepunkter, mens P/B-rammer øker komprimering ved prediksjon over tid.
Spørsmål 21 · Middels
Hvilken påstand er mest korrekt om keyframe-intervall i praksis?
Riktig. Kortere keyframe-intervall forbedrer seek og robusthet, men krever mer bitrate.
Spørsmål 22 · Vanskelig
I et større nettverk, hvilken vurdering om lip-sync er faglig best?
Riktig. Lyd og bilde må synkroniseres med tidsstempler og klokkehåndtering for naturlig avspilling.
Spørsmål 23 · Lett
Hva beskriver best multicast i distribusjonsnett?
Riktig. Multicast kan skalere én-til-mange effektivt der infrastrukturen støtter det.
Spørsmål 24 · Middels
Hvilken påstand er mest korrekt om hvorfor OTT ofte bruker unicast i praksis?
Riktig. Unicast fungerer over dagens internett uten global multicast-støtte i mellomnett.
Spørsmål 25 · Vanskelig
I et større nettverk, hvilken vurdering om pacing og køkontroll i medieavspilling er faglig best?
Riktig. Jevn utsending og købevisst styring reduserer burst, tap og varians i mottak.