Noua normalitate a întâlnirilor virtuale aparent nesfâr?ite schimba rapid normele sociale ?i provoaca un nou interes pentru tehnologia care ne conecteaza. De?i au existat platforme de videoconferin?a disponibile de ani de zile, acestea nu au fost concepute pentru a înlocui interac?iunea în persoana. Dupa un an în care a trecut prin „Oboseala zoom”, este timpul sa aruncam o privire noua asupra caracteristicilor ?i atributelor care îi fac pe utilizatori sa se simta conecta?i ?i cum pot fi îmbunata?i?i. Un aspect important este sunetul. De fapt, daca fiecare persoana implicata într-o conversa?ie poate auzi, s-ar putea argumenta ca este cea mai importanta caracteristica a interac?iunii în persoana.
Sunetul bun ne permite nu numai sa în?elegem cuvintele dintr-o conversa?ie, ci ?i sa percepem starea de spirit provocata de intona?ia vocala ?i sunetele ambientale. Sunetul rau, pe de alta parte, ne lasa frustra?i. În chat-urile video cu mai mult de doua persoane - destul de frecvente pentru happy hour virtuale, întâlniri de echipa ?i sesiuni de colaborare - vorbitorii concuren?i se îneaca inevitabil unul pe altul. Cele mai populare platforme de chat video de astazi nu sunt compatibile cu dialogul rapid.
Dar zilele conversa?iilor video nu se duc nicaieri, având în vedere câte companii continua politicile WFH. A?adar, pentru a face întâlnirile ?i alte adunari mai productive (?i mai distractive), este important sa în?elegem de ce experien?a este atât de slaba - ?i sa ?tim ca solu?ii pentru dezvoltatorii de platforme video exista într-adevar în lumea jocurilor video ?i a muzicii.
De ce sunetul videoconferin?ei este îngrozitor
La cel mai elementar nivel, nivelurile microfonului variaza între individ, ceea ce face dificila compilarea undelor sonore ale fiecarei persoane într-un singur flux audio. Pe unele platforme, acest lucru poate duce la partinirea difuzorului în care persoana cea mai tare câ?tiga; pe altele, doar fluxul audio al prezentatorului activ are prioritate. Întreruperea dialogului, repeti?ia ?i confuzia pe care o experimentam îi determina pe oameni sa interac?ioneze diferit în chat-ul video decât ar face-o în mod normal. Aceasta este o problema tehnica ?i totul se întoarce la ceea ce se nume?te „faza” dintre undele sonore combinate.
Iata cum func?ioneaza: doua unde sonore cu aceea?i frecven?a care sunt perfect aliniate au o diferen?a de faza de 0, pe care o numim „în faza”. Când undele care sunt în faza se combina, cum ar fi doi oameni care spun exact acela?i lucru, în acela?i timp, produc un sunet care este de doua ori mai puternic. Problema apare atunci când doua unde sonore în intervale de frecven?a similare sunt „defazate”. Când valurile nu se potrivesc, încep sa se anuleze reciproc, pâna la punctul în care doua valuri care sunt exact opuse se vor anula complet reciproc. Ca?tile cu anulare a zgomotului func?ioneaza facând acest lucru inten?ionat.
În majoritatea apelurilor video, problemele legate de faza provoaca probleme cu posibilitatea de a auzi ceea ce spun al?i oameni. Atunci când undele sonore de dialog sunt combinate, rezulta ca diferite por?iuni ale undelor sunt anulate, puncte de amplificare aleatoare a sunetului ?i o frecven?a mai zgomotoasa stabilita între punctele în faza ?i defazat în ciclul undei.
Exista o problema suplimentara: videoconferin?a a fost creata pentru întâlniri la birou, unde va pute?i a?tepta la un mediu lini?tit (de?i chiar ?i într-un cadru ideal majoritatea serviciilor au puncte slabe). Ce se întâmpla când vrem sa luam cafea, sa socializam, sa participam la un curs de dans ?i la toate celelalte lucruri pe care le facem în mod normal în afara serviciului? Platformele filtreaza de obicei sunetul pentru a reduce volumul frecven?elor atunci când oamenii nu vorbesc; agravat cu problemele de etapa men?ionate mai sus, aceasta înseamna ca sunetul ambiental nu poate fi introdus în chat-urile video de astazi fara a diminua (sau a anula complet) inteligibilitatea dialogului. A?adar, sunetele de trafic din ora?, hip-hop-ul tau preferat din anii 90 în fundal la cafenea sau o melodie pop cu ritm înalt care provoaca starea de spirit este rezervata IRL. Acest lucru este dezamagitor. Fara zgomot ambiental, suferim de o tacere care ucide starea de spirit atunci când luam o pauza de la vorbire.
Cu toate acestea, nu trebuie sa acceptam aceasta limitare. În timp ce tehnologia de chat video introduce provocari în jurul caden?ei dialogului natural ?i al starii de spirit a mediului, în alte spa?ii, cum ar fi muzica ?i jocurile, ingineria audio a fost un punct focal al progresului de ceva timp.
What Video Chat Companies Can Learn from Music and Gaming.
When you hop into a virtual environment, say Call of Duty multiplayer mode, you’re immersed into a first-person point of view in which you can spend hours effortlessly. It’s not by chance that gamers get less fatigued than users of a platform like Zoom. The visual experience is paired with the ability to have complete audio clarity with respect to ambient sound, action sound effects, virtual teammate dialogue, and more. While an explosion might be happening in front of you, you can hear crickets in your peripheral and your teammates voices center stage right, all within your headphones. Simply put, this is possible because of audio mapping (or mixing). By working to place things a certain distance and direction from the user, sound waves are being compiled with signal processing that works to alleviate the challenges of phasing and noise.
Ce pot înva?a companiile de chat video din muzica ?i jocuri
Când intri într-un mediu virtual, sa spunem modul multiplayer Call of Duty, e?ti cufundat într-un punct de vedere la persoana întâi în care po?i petrece ore întregi fara efort. Nu întâmplator jucatorii devin mai pu?in obosi?i decât utilizatorii unei platforme precum Zoom. Experien?a vizuala este asociata cu capacitatea de a avea o claritate audio completa în ceea ce prive?te sunetul ambiental, efectele sonore de ac?iune, dialogul virtual cu colegii de echipa ?i multe altele. De?i s-ar putea sa aiba loc o explozie în fa?a ta, po?i auzi greierii în periferic ?i vocile colegilor tai în centrul scenei, toate în ca?ti. Pur ?i simplu, acest lucru este posibil datorita maparii audio (sau mixarii). Lucrând pentru a plasa lucrurile la o anumita distan?a ?i direc?ie de utilizator, undele sonore sunt compilate cu procesare a semnalului care func?ioneaza pentru a atenua provocarile legate de fazare ?i zgomot.
Acest analog duce ?i la muzica. De?i poate nu va da?i seama, muzica a necesitat amestecare de când am început sa adaugam o multitudine de sunete pentru a crea o experien?a singulara. În muzica, producatorii nu numai ca îmbina vocea pentru cântare?ii principali ?i de fundal, ci ?i adauga perfect corzi, cornuri, bas ?i alte instrumente pentru a oferi melodii de succes. Inginerii audio se asigura ca instrumentele nu se ciocnesc, volumul melodiei este adecvat ?i ca emo?ia de baza a unei melodii apare prin punerea în scena (filtrare, comprimare ?i multe altele) a sunetelor compozi?iei.
Daca compara?i sunetul din muzica (sau jocuri video), ve?i vedea cât de departe trebuie sa ajunga conferin?a video. Încearca sa ascul?i una dintre melodiile tale preferate cu ochii închi?i - auzi unde se afla vocea pe scena sonora în compara?ie cu alte instrumente care conduc melodia. Apoi, data viitoare când sunte?i într-un chat Google cu alte doua persoane de pe desktop, asculta?i de unde vin toate vocile. Ve?i observa în chatul video ca scena sonora nu este folosita în masura în care ar trebui sa fie.
Dezvoltatorii de chat video pot urma inginerii audio din industria muzicala, care au fost responsabili pentru furnizarea unei experien?e de sunet aproape perfecte de zeci de ani. Lua?i în considerare modul în care acest lucru s-ar putea alinia cu sunetul unei întâlniri virtuale de colaborare. Imagina?i-va ca auzi?i o persoana mai mult din stânga, altul mai mult din dreapta, în timp ce în incinta exterioara a scenei de sunet se cânta muzica ambientala. Acum ave?i o interac?iune mai naturala ?i, oferind scenei de sunet mai mult spa?iu pentru a conduce experien?a de chat video, creierul utilizatorului va mapa mai bine sunetul dialogului cu sursa de pe ecran. Aceasta abordare se preteaza la o mai buna orientare a utilizatorului, rezultând în cele din urma la reducerea oboselii Zoom.
Construirea unui chat video mai bun
Odata cu sunetul în prim plan ca parte cheie a experien?ei de chat video, companii precum Pilotly (unde sunt CEO) ?i BlueJeans au luat masuri pentru a se îndrepta catre viitorul conversiei virtuale. Lucrând cu lideri în spa?iul de procesare audio, ambele companii au aplicat algoritmi chat-urilor video care au creat mai multa claritate în jurul dialogului prin mixare audio robusta.
BlueJeans, recent achizi?ionat de Verizon, a fost unul dintre primii care a lucrat cu un partener – Dolby – pentru a-?i îmbunata?i experien?a utilizatorului. Pentru a pune un dialog clar în prim-planul propunerii lor de valoare, au introdus Dolby Voice, un sistem care ar putea normaliza nivelurile audio, optimiza pentru o anumita la?ime de banda a vocii, reduce zgomotul ?i poate face unele mixari în cloud pentru a preveni anularile atunci când mai multe par?i vorbesc. o întâlnire.
Alte companii pot urma exemplul. Dolby lucreaza în prezent pentru a facilita aplica?iilor sa î?i îmbunata?easca capacita?ile audio. Paul Boustead, arhitectul ?ef al Dolby’s Communications Business Group, spune ca extinderea utilizarii acestor tehnologii este o prioritate pentru companie. „M-am specializat în comunica?ii vocale ?i video de peste 20 de ani, ca cercetator, inginer ?i arhitect”, spune el. „Am facut eforturi pentru ca comunicarea online sa fie cât mai naturala posibil.”
Platforma de ???????chat video a lui Pilotly, Reelchat, se concentreaza pe crearea unui mediu virtual care va fi asemanator cu o experien?a de joc. Prima aplica?ie a Reelchat au fost grupurile de focalizare virtuale, în care este important sa ave?i conversa?ii rapide ?i libere, în care pute?i auzi mai multe persoane la un moment dat, la fel ca într-o întâlnire sau într-un happy hour. Acesta este unul dintre motivele pentru care am prioritizat maparea audio pentru a crea un confort maxim ?i intui?ie pentru participan?ii la conversa?ie. Credem ca cheia pentru ca interac?iunile umane virtuale sa func?ioneze este mutarea utilizatorului într-un spa?iu în care sunetul exista mai natural.
Ajustarea ?i accelerarea ratei de progres în tehnologia chat-ului video va fi esen?iala pentru succesul afacerilor, al înva?amântului superior ?i al conexiunii sociale, deoarece continuam sa suportam limitari extreme în jurul interac?iunii IRL în timpul unei pandemii. Audio, ignorat de mult ca factor central în experien?a publicului pentru vizual, este viitorul interac?iunii. Jocurile ?i muzica în?eleg acest lucru, iar urmatoarea evolu?ie a platformelor de colaborare ?i întâlnire ar face bine sa emuleze acela?i tip de amestecare muzicala în experien?ele utilizatorilor.