0

Sistema visual e a capacidade de procurar uma agulha num palheiro

 

Desde 1959 quando Wiesel e Hubel publicaram um artigo sobre a atividade elétrica de neurônios no córtex visual de gatos sabe-se que células nessa região respondem a estímulos visuais com orientações específicas. Por esta descoberta e pelos experimentos sobre córtex visual que se seguiram, eles ganharam o prêmio Nobel em 1981. Graças a eles sabe-se, por exemplo, que quando visualizamos uma barra movendo-se da direita para a esquerda, o grupo de neurônios corticais que dispara é diferente do grupo de neurônios ativos quando vemos a barra mover-se de cima para baixo. Dá uma olhada neste vídeo aqui em que aparece o estímulo visual visto por um gato ao longo do experimento. O barulho que ouvimos corresponde aos disparos dos neurônios ativados no córtex do gato. Note que o barulho aumenta quando a luz passa em regiões específicas ou quando a barra se move em direções específicas. Dizemos portanto que o córtex visual forma mapas de orientação e mapas espaciais. E esses mapas são o conjunto de neurônios que dispara junto quando o estímulo visual obedece algum padrão.

No começo dos anos 2000,  Li Zhaoping, física e professora de neurociência computacional no Departamento de Computação da University College of London, desenvolveu uma teoria, que vem sendo extensivamente testada desde então, sobre o córtex visual primário (V1). Ela propôs que esta região do córtex facilita a atração automática da nossa atenção quando percebemos uma saliência em um certo padrão. Em outras palavras, ela propôs que a nossa capacidade de detectar rapidamente uma imagem que foge ao padrão, como por exemplo uma barra inclinada para esquerda em meio a várias outras barras inclinadas para a direita (veja Figura 1) está relacionada a mapas de saliência que se formam em V1. Segundo a teoria de Li,  a região cortical V1 é que nos ajuda a encontrar uma agulha num palheiro, especialmente se a agulha apresentar alguma característica que se destaque em meio às palhas.

9_barras

Figura modificada da Ref. [1]. Imagens utilizadas em experimentos comportamentais e de imageamento cerebral em que devemos identificar a única barra inclinada com orientação diferente das demais.

Ou seja, isso quer dizer que esta região do córtex não apenas possui grupos de neurônios que disparam preferencialmente sob um estímulo inclinado em uma certa uma direção (formando os mapas de orientação), mas também possui grupos de neurônios que formam mapas para detectar um comportamento diferente em meio a um certo padrão, chamados mapas de saliência.
Li utilizou dois argumentos bem simplificados mas bastante interessantes para explicar como chegou a essa ideia:
1) A região do córtex visual primário V1 parecia proporcionalmente grande quando comparada a outras regiões corticais (e portanto consumidora de mais energia) para servir apenas para os mapas de orientação e espaço.
2) A grande maioria da informação que estamos detectando com nossa retina não chega a regiões mais profundas do cérebro nem no nível do consciente. Ou seja, descartamos boa parte da informação que chega aos nossos olhos. Portanto, em algum lugar do nosso cérebro, de maneira inconsciente, escolhemos quais são as informações mais importantes que devem ser guardadas (e utilizadas) e quais podem ser descartadas.

Sendo assim, parece razoável supor a existência um mecanismo que nos ajuda a detectar coisas fora do padrão. Essas tais coisas fora do padrão podem ser mais importantes do que coisas repetitivas. Por exemplo, precisamos encontrar uma fruta no meio das folhagens para nos alimentarmos mas não precisamos enxergar cada uma das centenas de folhas da árvore. Então se temos 21 ou 22 barras inclinadas para direita não precisamos guardar toda essa informação. Basta guardar a informação “muitas barras inclinadas”. Mas se em meio a essas barras temos uma inclinada pro lado contrário pode ser importante que nossa atenção se dirija a esta barra.
Esse ano Li e seus colaboradores publicaram mais um experimento baseado nessa teoria, comparando resultados comportamentais e a atividade elétrica em V1. Macacos foram treinados para olhar para imagens como as da Figura 1 e moverem seus olhos para identificar a única barra com orientação diferente, enquanto a atividade elétrica de grupos de neurônios em V1 era registrada. Os resultados comportamentais de respostas corretas e tempos de reação em função da inclinação da barra diferente ao longo dos dias de treino estão mostrados na Figura 2. Quanto maior a diferença na inclinação entre todas as barras e a única diferente, maior a taxa de acerto e menor o tempo de reação do animal (ou seja, mais fácil a tarefa)

 

9_comportamento

Figura 2: modificada da Ref.[1]. Resultado comportamental do experimento realizado com os macacos MA e MD enquanto eles observavam imagens como as da figura 1. No topo, proporção de respostas  corretas em função da diferença de inclinação entre a única barra diferente e as demais. Na base, o tempo de reação até a identificação da barra diferente como função da diferença na inclinação., Note que quanto maior a diferença na inclinação maior a taxa de acerto e menor o tempo de reação, indicando que a identificação da barra inclinada é mais fácil quando o ângulo entre ela e as outras é maior.

No que diz respeito à atividade eletrofisiológica, o grupo verificou dois picos na atividade de elética de V1 (veja Figura 3A e 3B). O primeiro pico está associado à atividade que vem da retina devido ao estímulo visual externo (bottom-up). Enquanto que o segundo pico está associado a uma resposta mais complexas devido às conexões neuronais em V1 e à retroalimentação vinda de regiões mais profundas do córtex (top-down de V2, V4…)

Eles também mostraram que uma maior atividade elétrica na região de V1 durante a observação da imagem está associada a um menor tempo de resposta do animal.
Além disso eles compararam a diferença entre a atividade do melhor trial e do pior trial (acertos e erros) nos primeiros dias (chamada melhor-pior / better-worse na Figura 3C e 3D) com a diferença melhor-pior depois de muitos dias de treino. O resultado é que a diferença melhor-pior aumentou com o treino para o primeiro pico em V1 mas diminuiu para o segundo pico. Os autores sugerem que essa diferença pode ser explicada se o treino aumenta a relevância do mapa de saliência (que depende do estímulo externo bottom-up) e se garante que a tarefa fica menos dependente dos efeitos de retroalimentação (feedback) de regiões mais profundas do córtex (V2,V4 reenviando informação para V1).

9_resultados

Figura 3: Modificada da Ref. [1]. Resultados do imageamento cerebral. A e B: atividade cerebral como função do tempo desde o momento em que a imagem aparece  na tela. C e D: diferença na atividade entre os trials em que ocorreram os melhores e os piores desempenhos.

Estes resultados corroboram a teoria de Li dos mapas de saliência em V1. Ou seja, mais uma evidência de que V1 é a região cortical que nos ajuda a detectar elementos que fogem de algum padrão. E nós ficamos aqui, agradecendo a V1 todas as vezes em que foi importante para nossa evolução e/ou sobrevivência perceber uma diferença/saliência um algum padrão. Por exemplo, para não pisar num buraco em meio a folhagem, para não comer uma minhoca nas folhas de alface, ou para identificar uma barata no canto da sala…

 

Referência:
[1]Yan, Yin, Li Zhaoping, and Wu Li. “Bottom-up saliency and top-down learning in the primary visual cortex of monkeys.” Proceedings of the National Academy of Sciences 115.41 (2018): 10499-10504.