Hoje em dia a qualidade de áudio é muito importante. Os ouvidos dos seres humanos têm grande capacidade de discernimento, mas também se pode ver que audibilidade e clareza de diálogo são um desafio.

Doutor Carlos Pantsios Markhauser *

Nos últimos anos uma nova tecnologia na televisão entrou no mercado mundial conhecido como Ultra High Definition Television (UHDTV), que tem 4 vezes mais pixels por imagem na tela (8.3 Mpix) do que a televisão HDTV, 1080p (2Mpix). A tecnologia de televisão UHDTV também possui outros recursos excepcionais, como:

- Publicidade -

1) uma faixa dinâmica significativamente maior,
2) uma melhor reprodução temporal das imagens (por meio de uma freqüência temporal maior),
3) uma reprodução de cor substancialmente maior (graças a um espaço de cor expandido) e,
4) mais detalhes (resolução) nas imagens reproduzidas.

Apesar das grandes vantagens mencionadas no vídeo, quase não há consciência do fato de que há também uma mudança significativa no sistema de som que acompanha o vídeo UHDTV.

Uma nova experiência em som está presente na UHDTV
Em primeiro lugar, é importante destacar aqui a diferença com que o ser humano percebe o áudio e o vídeo, ou seja, a diferença entre a experiência produzida pelo áudio e o vídeo. Por exemplo, é possível, na prática, observar perfeitamente duas ou mais imagens na mesma tela de televisão simultaneamente. As imagens de televisão são limitadas por natureza e geralmente bidimensionais.

A presença de intervalos com perda de informação, devido a erros de transmissão ou processamento do vídeo, não complica completamente o entendimento das imagens distorcidas pelo usuário. No entanto, essas perdas são, sem dúvida, irritantes para ele espectador. Em comparação com o acima, é realmente complicado entender vários áudios que aparecem simultaneamente ao usuário.

O áudio estéreo é uma experiência ilimitada (se o usuário estiver sentado no lugar certo) e a presença de intervalos com perda de informações no áudio reduz rapidamente a capacidade do usuário de entender o que acontece.

Além disso, se o áudio estiver distorcido, pode causar dor física na pessoa.

Fatores que melhoram a experiência de áudio
As diferenças de percepção mencionadas mostram que um número significativo de fatores deve ser considerado para melhorar significativamente a experiência de áudio. A seguir estão três áreas que devem ser consideradas aqui:

Área 1: Sabe-se que a capacidade de interagir é amplamente valorizada positivamente pelo público, mas o áudio equivalente a uma segunda tela não funciona. Então, como é feito para criar uma interação mais completa, além do controle de volume de áudio convencional?

Área 2: O áudio é hoje do tipo "Immersive", mas seria interessante saber se esta experiência pode ser melhorado?, É possível que uma verdadeira experiência de áudio em 3D pode funcionar com sucesso mesmo quando stereographs imagens em 3D não pode?

Igualmente importante é perguntar a si mesmo: é possível oferecer uma experiência mais imersiva sem sobrecarregar o trabalho de produção e o processo de distribuição dos programas acabados com muita complexidade e custo? Por fim, será possível fazer o que foi mencionado de uma forma que também seja acessível para aqueles usuários que escutam programas em mono, estéreo ou com fones de ouvido?

Área 3: Hoje em dia a qualidade de áudio é muito importante. Os ouvidos dos seres humanos têm grande capacidade de discernimento, mas também se pode ver que audibilidade e clareza de diálogo são um desafio. Uma questão importante aqui é como a experiência de áudio pode ser adaptada e personalizada para que ela funcione bem para diferentes preferências, para uma variedade de tecnologias e para uma variedade de ambientes de escuta.

Grandes esforços estão sendo feitos atualmente para encontrar diferentes técnicas que nos permitam cumprir satisfatoriamente as três áreas importantes a seguir:
1) interatividade,
2) imersão e
3) adaptação (também conhecida como personalização).

A tecnologia que mostrou os melhores resultados até o momento, oferecendo compatibilidade retroativa com as tecnologias atuais baseadas em canal, é o áudio baseado em objetos (objetos de áudio).

No mundo convencional, o conteúdo de áudio de um programa é representado usando o formato baseado em canal. Aqui, vários sinais armazenados em um arquivo são distribuídos em fluxos e cada um corresponde a um programa. A tecnologia conhecida como Broadcasting Wave Format (BWF) não define atualmente o que cada fluxo representa no arquivo, nem a tecnologia Wave Format da Microsoft, na qual se baseia.

O arranjo dos alto-falantes é assumido a partir do número de canais disponíveis, e as posições dos alto-falantes também são baseadas no número do canal. Por exemplo, um programa com dois canais de áudio implica em um formato estéreo; os sinais correspondem aos alto-falantes esquerdo e direito, que devem ser colocados em 60 graus de separação. Com este sistema, os problemas ocorrem rapidamente quando há mais de dois canais.

Para o conteúdo no formato 5.1, existem diferentes métodos que permitem o ordenamento de canais e não há nenhuma maneira confiável de saber, apenas a partir do arquivo, qual convenção foi usada. O F64 é um formato BWF multicanal compatível, que usa uma máscara de canal para mapear canais para matrizes de alto-falantes usando um rótulo descritivo, por exemplo. ALTO-FALANTE - FRENTE À ESQUERDA. Isso permite que as posições dos alto-falantes sejam determinadas, mas os identificadores de ordem dos canais e os metadados armazenados em um arquivo XML são aqueles usados ​​para descrever os canais. Um conjunto de metadados chamado EBUCore permite maior precisão na definição de conteúdo dentro de um determinado arquivo.

Por muitos anos, os pesquisadores estavam trabalhando em formatos de áudio independentes da configuração do alto-falante. Um deles é o formato baseado em objeto, que descreve os componentes em uma cena com metadados variáveis ​​ao longo do tempo, oferecendo flexibilidade máxima. Para a emissora, essa solução é muito atraente, pois os programas podem ser produzidos apenas uma vez e distribuídos em diferentes formatos, gerados automaticamente. Este novo BWF permite a representação da cena e dos audio-objects, o que possibilita aos broadcasters transportar e trocar programas gerados nesses formatos.

Esta tecnologia de áudio vem evoluindo rapidamente nos últimos tempos, dando origem a novos padrões. O áudio baseado em áudio descreve uma apresentação geral do áudio, estruturada em valores individuais (ou objetos), cada um com seus metadados, que descreve suas relações, comportamento e associações. Os metadados informam a um "montador", no sistema AV, como montar da melhor maneira possível os objetos de áudio na apresentação desejada, com a disposição dos alto-falantes disponíveis.

Conceitualmente, essa abordagem tecnológica é muito poderosa e flexível, mas, para obter uma implementação prática, é necessário saber em quais problemas você deseja se concentrar primeiro para a solução correspondente.

Propondo conceitos e soluções
Um dos conceitos mais importantes da tecnologia baseada em objeto de áudio é o "renderizador". Isso é definido no chamado Fórum para Advanced Media na Europa (FAME), uma organização que lida com pesquisa e desenvolvimento em Ultra Alta Definição (UHD), Realidade Virtual (RV) e de outras novas tecnologias.

Muito provavelmente, na vida real, é necessário transcodificar entre diferentes apresentações baseadas em objetos. O exposto acima se deve ao fato de que produções dramáticas de alto nível exigirão trabalhar com um número muito grande de objetos (possivelmente centenas deles ou mais). Os fluxos reais de trabalho geralmente operam com subconjuntos de menos objetos, e as limitações de largura de banda forçarão o uso de menos objetos para a entrega adequada e econômica de saídas para as residências.

Da mesma forma, também é necessário ser capaz de avaliar a qualidade das diferentes renderizações de áudio correspondentes às diferentes implementações. Até o momento, não há técnica para avaliar a qualidade das diferentes representações correspondentes às implementações implementadas. Técnicas conhecidas como os chamados múltiplos estímulos Com Invisível Referência e Anchor (Mushra) não trabalho aqui, porque agora você está interessado em avaliar o material "inmersiveness" produção ao invés de erros que podem aparecer na mesma.

A definição anterior também deixa claro que, para que o renderizador execute a renderização, o áudio e os metadados são necessários.

A verdadeira natureza de tal aproximação de flexibilidade reside no fato de que os renderizadores podem ser desenvolvidos para escolher uma versão publicada simples e implementá-la da melhor maneira possível para um grupo de plataformas, dispositivos e situações. Se este for o caso, então há um novo desafio, pois, como resultado, o grupo de trabalho criativo terá uma ideia muito remota sobre como o programa de áudio soará em casa.

Isso levanta a questão de se os fornecedores de benchmark e os arranjos de monitoramento são necessários para permitir uma avaliação representativa, que se aplica à produção em questão. Para coroar a reprodução de áudio baseado em objetos em alto-falantes configurados profissionalmente, foi também adicionado, pelo designer do renderizador, o desafio ainda mais difícil de como produzir um ótimo som quando apresentado no arranjo assimétrico comumente usado em a casa

Atualmente você pode ver implementações no mercado consumidor da nova geração de televisores em 4k (UHDTV) que continuam a ser equipados com tecnologia de áudio convencional para transmissão. No entanto, as soluções de áudio mais recentes não estão associadas à tecnologia UHDTV e podem ser aplicáveis ​​a receptores de TV padrão, bem como a discos ópticos padrão.

Como resultado, tecnologias baseadas em objetos de áudio estão surgindo, emergindo em muitos lugares. Por exemplo, a Dolby possui objetos no coração de sua solução ATMOS para cinema (incluindo home theater) e está introduzindo sua tecnologia baseada em objetos como parte do padrão AC4. A DTS lançou seu formato de áudio multidimensional (MDA). A Farelight implementou as ferramentas ATMOS e MDA em suas ferramentas de áudio 3DAW.

A BBC recentemente demonstrou vários exemplos de desenvolvimentos imersivos, personalização e interação, baseados em objetos de áudio na exposição 2014 do IBC, e o MPEG-H foi construído para ser "objeto pronto" para a entrega não apenas do áudio em 3D para transmissão, mas também para videogames e videoconferências.

Grandes mudanças nos aguardam na parte de áudio em um futuro próximo e, para isso, devemos nos preparar adequadamente.

* Carlos Pantsios Markhauser é Engenheiro de Telecomunicações e Mestre em Comunicações pela Universidade Simón Bolivar, com especialização em Telecomunicações em satélite e redes, Universidade George Washington - Escola de Engenharia e Ciências Aplicadas, Especialização em Telecomunicações Digitais pela Universidade do Colorado Boulder. Ele trabalha como professor de pós-graduação nas escolas de telecomunicações da Universidade Simón Bolivar e da Universidade Católica Andrés Bello. Além de consultor profissional em projetos de TV baseados na Argentina.

Richard Santa, RAVT
Autor: Richard Santa, RAVT
editor
Jornalista da Universidade de Antioquia (2010), com experiência em tecnologia e economia. Editor das revistas TVyVideo + Radio e AVI Latin America. Coordenadora Acadêmica da TecnoTelevisión & Radio.

PATROCINADORES














OUTRAS NOTÍCIAS

article thumbnailHoje em dia a qualidade de áudio é muito importante. Os ouvidos dos seres humanos têm grande capacidade de discernimento, mas você também pode ver isso ...
article thumbnailGerenciar o conhecimento organizacional necessário para a sustentabilidade das empresas, é um dos principais desafios que surgem no ...
article thumbnailA televisão como a conhecemos será praticamente para eventos ao vivo e plataformas que não as têm exclusivamente, devem mudar para ...
article thumbnailCom uma indústria em processo de transformação em todos os seus aspectos e em busca de definições, é imprescindível ter o ...
article thumbnailTodos estes elementos, todos revestidos de uma importância essencial para o sucesso de qualquer iniciativa de produção de vídeo ao vivo via ...
article thumbnailComo mencionado na parcela anterior, a partir do final dos anos noventa até o presente, com o advento e posterior consolidação da ...
article thumbnailHistoricamente, o México se destacou na indústria de transmissão regional por estar na vanguarda da produção de tecnologia e audiovisual, tanto em ...
article thumbnailO fato de poder consertar uma fibra no campo em menos de um minuto faz com que ele ganhe muitos amigos, especialmente nas emergências audiovisuais ....
article thumbnailOs dispositivos conectados à rede podem servir como um pool de recursos para compartilhar eficientemente esses recursos, por exemplo, permitindo ...
article thumbnailEsta primeira parte destina-se a entender como o modelo de negócios da Netflix e outras plataformas de distribuição de conteúdo funcionam ...