Nossos olhos, câmeras e lentes - parte 1

 

Por Eng. Claudio de Almeida

 

Esta é a primeira parte de um artigo sobre a visão e como ela se processa. Seja a nossa ou a das câmeras de CFTV.

 

Câmeras e lentes são os equivalentes artificiais mais próximos da maravilhosa máquina que é a nossa visão.

 

Então, para poder entendê-las e aproveitá-las melhor, temos que primeiramente entender como a visão humana se processa. Afinal, é ela que usamos para visualizar as imagens capturadas pelas câmeras de CFTV.

 

Uma visão geral

Nossos olhos ainda são muito melhores do que a melhor e mais cara câmera de CFTV existente. Do tamanho de uma bola de pingue-pongue, podem cuidar de cerca de um milhão e meio de mensagens simultâneas.

 

Dos conhecimentos que absorvemos diariamente através dos nossos 5 sentidos (tato, paladar, olfato, audição e visão), 80% são absorvidos pela nossa visão. Portanto, somos máquinas essencialmente visuais, como as câmeras de CFTV...

O cristalino

O equivalente à lente de uma câmera de CFTV é o nosso cristalino, que está cercado por um anel de pequenos músculos, chamados de ciliares. Quando estão relaxados, o cristalino se achata; é quando enxergamos bem de longe. Para podermos enxergar de perto, esses músculos se contraem, inchando o cristalino.

 

Sendo assim, nossos olhos estão relaxados quando estamos enxergando coisas mais distantes.

 

E essa era sua função primordial, pois nossos antepassados somente precisavam visualizar as coisas a certa distância — distante o suficiente para dar tempo de perceber e fugir de perigos ou próximo o suficiente para ter uma certa precisão na hora de caçar.

E essa distância ideal de trabalho para os nossos olhos é de cerca de 6 metros.

 

Mas, desde a invenção da escrita, nossos olhos vêm tendo problemas, pois estão sendo utilizados diariamente para operar à distâncias mais curtas: Livros e revistas, telas de computadores, smartphones, etc. , o que obriga nossos músculos ciliares a estarem contraídos a maior parte do tempo — e acabam se cansando.

 

Por isso é importante interromper nosso trabalho periodicamente e passar alguns minutos olhando pela janela, para longe.

 

O cristalino funciona da mesma forma que uma lente zoom com autofoco, sendo que o "teclado de controle" é o nosso cérebro.

A pupila

A pupila fica na frente do cristalino e faz o papel de uma lente auto íris, controlando a passagem da luz que chega ao cristalino. Com muita luz, ela se retrai; com pouca luz, se abre, variando de 3 a 8 mm de diâmetro.

 

Se estamos em um lugar escuro que de repente fica iluminado, nossa pupila leva cerca de 5 segundos para se adaptar.

Porém, se estamos em um local iluminado que de repente fica escuro, nossa pupila levará cerca de 300 segundos para se adaptar.

 

As lentes auto íris fazem um processo equivalente à nossa pupila; para isso têm um cabo de controle ligado à câmera, por onde elas recebem os sinais de controle de abertura ou fechamento da íris da lente.

Quando vamos ao oftalmologista e temos que dilatar a pupila, é como se ele "desligasse nosso cabo de controle" fazendo com que nossa pupila fique totalmente aberta por algumas horas. Isso explica por que não conseguimos suportar luz forte e precisamos usar óculos escuros até que o efeito passe.

A retina

Assim como o cristalino e a pupila são equivalentes às lentes das câmeras de CFTV, nossa retina é o equivalente aos sensores de imagem.

 

Com mais ou menos 5 cm2, ela contém dois tipos de células receptoras, denominadas cones e bastonetes.

Os cones

Responsáveis por enxergarmos em cores, são cerca de 6 a 7 milhões em cada olho e estão bastante concentrados na região central do olho, conhecida como mácula. No centro da mácula existe a fóvea, com 0,3 mm de diâmetro onde existe uma altíssima concentração de cones e nenhum bastonete.

São divididos em 3 tipos diferentes: os cones vermelhos (64%), os cones verdes (32%) e os cones azuis, que representam apenas 2%.

 

Se você notou alguma semelhança com o padrão de cores RGB (vermelho, verde e azul) utilizado no sistema de vídeo colorido, não é mera coincidência...

 

Os cones vermelhos e verdes estão mais concentrados na fóvea, enquanto os cones azuis estão mais encontrados fora da fóvea.

Os cones também são responsáveis pela nossa visão em alta resolução (percepção de detalhes) e têm um tempo de resposta melhor que os bastonetes, sendo assim também responsáveis pela nossa percepção a mudanças rápidas na imagem.

Os bastonetes

Em quantidade bem maior, cerca de 125 milhões em cada olho, são bem mais sensíveis à luz do que os cones (cerca de 100 vezes mais), sendo responsáveis pelo contraste em preto e branco do que enxergamos e pela nossa visão noturna.

 

Sim, é isso mesmo: Sob baixa iluminação enxergamos em preto e branco (como uma câmera day-night...) pois, nessas condições, somente os bastonetes estão captando a luz.

 

Isso explica porque conseguimos nos movimentar em lugares pouco iluminados, mas não ler; porque os cones, responsáveis pela nossa visão em detalhes, não estão operantes. Já os bastonetes ainda conseguem captar luz suficiente para enxergarmos o caminho.

 

Um fato interessante: A cor que causa a menor sensação de intensidade luminosa aos bastonetes é o vermelho. Por esse motivo os instrumentos do painel de um carro (de um DVR também) são normalmente na cor vermelha, senão não conseguiríamos enxergá-los bem à noite, com todo o carro no escuro.

 

Qualquer outra cor "estouraria" a sensibilidade dos nossos bastonetes, tornando-a incômoda de ser visualizada nessas condições.

Distribuição dos cones e bastonetes

Os cones estão mais concentrados no centro do nosso olho, a um angulo de 20 graus à esquerda e 20 graus à direita.

 

Ou seja, nossa visão colorida e nossa percepção a detalhes funcionam melhor quando focalizamos objetos a um angulo máximo de 40° de abertura.

 

Já os bastonetes estão mais concentrados fora da fóvea, trabalhando mais com nossa visão periférica.

 

Por isso fazem o papel de sensores de movimento, alertando-nos sobre algo se movimentando à nossa esquerda ou direita.

É a chamada "visão de canto de olho".

O angulo de visão dos nossos olhos

Cada olho individualmente consegue visualizar um ângulo de abertura de 120 a 200°. Como trabalham em conjunto, a região de intersecção é em torno de 130°.

 

Mas, por razões evolutivas, nossa visão periférica é útil somente para detectar movimento e grandes objetos (como um leão vindo para cima de você...).

 

Nosso ângulo de visão central é em torno de 40 a 60°, o que corresponde ao ângulo em que você consegue visualizar objetos sem mover seus olhos.

 

Esse é o mesmo ângulo de visão obtido por uma lente de 8 mm instalada em uma câmera fixa com sensor de 1/3".

A visão feminina

Por alguma armadilha do destino, você foi parar em uma loja de cosméticos com sua esposa e está aguardando, "pacientemente", enquanto ela escolhe um esmalte de unhas.

 

Alguns intermináveis minutos depois — nunca menos do que dez — ela se aproxima com 4 vidros de esmalte, que você jura serem idênticos, e lhe pergunta:

 

— Qual você acha que é o mais bonito?

 

Você analisa cuidadosamente os quatro esmaltes e conclui que são mesmo idênticos — Até repara que alguém se enganou, colocando rótulos com nomes diferentes neles — e, suando frio, pensa: — Ai, ai, ai, e agora? O que responder?

 

Você pode ser honesto e dizer: — Sei lá, para mim são todos iguais...

 

Ela vai te chamar de cego, insensível, etc. e você vai acabar passando a noite no sofá.

 

Pressentindo que isso pode acontecer, você resolve fingir que eles são diferentes e escolhe qualquer um dos quatro. Porém, se você tiver o azar de não escolher o mesmo esmalte que ela já escolheu — sim, ela já fez sua escolha e não está interessada em sua opinião, só quer que você confirme a excelente escolha dela —, você será chamado de cego, insensível, etc. e vai acabar passando a noite no sofá.

 

Tirando a brincadeira de lado, por que isso acontece?

 

Devido às diferenças cromossômicas (XX e XY), os homens têm maior sensibilidade para detalhes e percepção de movimentos rápidos. Já as mulheres são melhores para descrever diferenças entre as cores.

 

Isso explica aqueles nomes estranhos de cores que elas costumam usar. Como Fúcsia, por exemplo. Que raio de cor é essa, afinal?

 

Fica bastante claro que, na época das cavernas, a percepção de movimentos rápidos era muito útil para o homem caçar — e escapar de perigos.

 

Já o fato das mulheres reconhecerem mais nuances de cores as tornavam mais aptas que os homens a proteger seus filhos, percebendo melhor predadores escondidos nas sombras ou camuflados para se confundirem com o ambiente.

 

Essa informação é útil para determinar o sexo do vigilante mais adequado para monitorar cada situação: ambiente com muita movimentação ou com muitas áreas onde invasores podem se esconder.

A visão dos animais

Dizem que cães e gatos enxergam em preto e branco. Não é verdade, eles simplesmente não enxergam todas as cores como nós, pois têm apenas dois dos três cones de cores e em uma porcentagem bem menor que nós, cerca de 10%.

 

Porém, seus bastonetes conseguem amplificar a luz até 130 vezes mais do que nós humanos e também possuem pupilas maiores, para poder captar mais luz.

 

Já os predadores de animais de sangue quente que caçam à noite, como a cobra, a coruja e os felinos em geral, conseguem enxergar o espectro de infravermelho (como as câmeras IR).

 

Isso é bastante útil para enxergar suas presas, que aparecem para eles destacadas do resto do ambiente, já que seu corpo está em uma temperatura mais alta (como em uma câmera térmica).

O sensor de imagem

Como já mencionei, o sensor de imagem das câmeras de CFTV é equivalente à nossa retina.

 

Sendo assim, para poder captar todas as cores, ele também tem 3 tipos diferentes de pixels, representando os 3 cones dos nossos olhos.

 

Ao lado, um sensor de imagem, onde se percebe as mesmas 3 cores dos cones dos nossos olhos.

Mas, você notou que existe o dobro de pixels verdes?

Isso é necessário porque se as quantidades de pixels fossem iguais para cada cor, as cores das imagens capturadas por uma câmera ficariam totalmente fora da realidade, já que os cones existem em nossos olhos em proporções diferentes, como já vimos acima.

 

Repare, na figura ao lado, que a somatória da quantidade de luz absorvida por cada grupo de cones dá uma curva com um pico entre as cores verde e amarelo.

 

Sendo assim, para que o sensor de imagem apresente cores que nós humanos possamos enxergar como reais, ele tem que reproduzir esse "defeito", essa não linearidade dos nossos olhos.

É por isso que existem dois pixels verdes para cada pixel vermelho e azul.

 

Mas, e os bastonetes dos nossos olhos? Como estão representados no sensor de imagem?

 

Vimos que as cores são definidas por grupos de 4 pixels, em um arranjo 2x2, sendo que cada pixel é responsável por capturar a intensidade luminosa correspondente à cor que ele representa.

 

Sob pouca iluminação, quando a câmera entra no modo Night, as informações de cores são descartadas, cada um dos 4 pixels de cada grupo passa a capturar apenas a intensidade luminosa da cena.

 

Ou seja, tem-se uma área 4 vezes maior de captação, aumentando assim a sensibilidade do sensor de imagem em cerca de 10 vezes.

 

Por esse motivo é comum vermos especificações do tipo:

 

Sensibilidade: 0,1 Lux colorido, 0,01 Lux, P&B

 

Os sensores de imagem têm uma visão de espectro bem mais amplo que nossos olhos. Como os felinos, eles conseguem enxergar no espectro dos raios infravermelhos, o que poderia causar uma aberração cromática, afetando a fidelidade das cores.

 

Para  corrigir isso, é colocado sobre o sensor de imagem um filtro de luz visível para que, como nossos olhos, ele só enxergue o espectro de luz visível.

 

Já para as câmeras IR não se utiliza esse filtro, caso contrário o sensor não enxergaria a luz emitida pelo canhão de raios infravermelhos acoplado à câmera.

 

Assim, as câmeras IR são muito úteis para aplicações noturnas, mas podem apresentar distorções de cores durante o dia.

 

Por exemplo, como os raios do Sol têm grande quantidade de raios infravermelhos, uma câmera IR apontada para um piso claro pode apresentar imagens totalmente estouradas ao longo do dia, principalmente perto do meio dia.

 

Uma solução para esse problema são as câmeras chamadas de True Day, IR cut ou IRC filter, como as speed domes e as câmeras analógicas CMOS mais recentes.

 

Elas também possuem um filtro de luz visível que, sob baixas condições de iluminação, é retirado automaticamente da frente do sensor, permitindo que ele enxergue também os raios infravermelhos.

O processamento da imagem

Na verdade, não vemos com nossos olhos, vemos com o cérebro. É ele que processa as imagens recebidas.

 

Essa mesma função é feita nas câmeras de CFTV pelo DSP (Digital Signal Processor - Processador Digital de Sinais) que trata as imagens recebidas pelo sensor.

 

Apesar de os sensores de imagem já tentarem imitar nossos olhos, tendo o dobro de pixels verdes, isso ainda não seria suficiente para que as cores da imagem parecessem reais. Cabe ao DSP dar um último retoque na imagem.

A faixa dinâmica (o WDR) dos nossos olhos

Uma boa câmera com WDR consegue visualizar uma faixa dinâmica em torno de 60 a 75 dB, um nível de contraste que varia de 1:1.800 a 1:5.600 entre o ponto mais claro e o ponto mais escuro de uma cena.

 

Nossos olhos conseguem enxergar um nível de contraste de até 1:10.000 para cenas iluminadas. Em baixa luminosidade, como quando olhamos para as estrelas em um local pouco iluminado, esse nível de contraste pode chegar a 1:1.000.000!

Conclusão da parte 1

Conforme vimos até aqui, nós seres humanos não inventamos as câmeras de CFTV, apenas copiamos e adaptamos o funcionamento da visão humana e dos animais.

 

Você sabe quantos megapixels de resolução tem a nossa visão? Descubra na segunda parte deste artigo. Vou explicar também como aproveitar todo o conhecimento adquirido sobre nossos olhos no projeto de sistemas de CFTV mais eficientes e ergonômicos.

Mar/2015

Dez/2016

Quer saber quando novos artigos serão publicados?

Enviando formulário…

O servidor encontrou um erro.

Formulário recebido.

Gostou deste artigo? Deixe um comentário!

comments powered by Disqus

Copyright ©2014 Instituto CFTV - Todos os direitos reservados

Conforme a Lei 9.610/98, é proibida a reprodução total ou parcial deste site por qualquer meio e para qualquer fim, sem autorização prévia do autor.