Pesquisadores da Duke University desenvolveram um algoritmo capaz de gerar imagens realistas em alta resolução, a partir de fotos de baixa resolução usando inteligência artificial. Mas como isto é possível?
Para começar, não é possível recuperar informação onde ela não existe, isto é, é impossível fazer uma imagem de baixa resolução aumentar sua qualidade revelando detalhes que não estavam na imagem original. Qual o truque então?
A ideia utilizada é a seguinte: Usando um método desenvolvido pela NVidia conhecido como StyleGAN, são geradas diversas fotos realistas criadas de maneira artificial, então o programa diminui a qualidade dessas fotos e procura uma que coincida com a imagem de baixa resolução fornecida.
As GANs, ou redes generativas adversariais são uma estratégia bastante inteligente que coloca duas redes de aprendizado de máquinas para competirem entre si. Imagine a seguinte situação, um falsificador de obras de arte produz imitações de quadros famosos, que no começo são bastante simples e sem muita complexidade. Um investigador começa a analisar as obras que aparecem no mercado e passa a identificar quais são falsas e quais são verdadeiras, fazendo as falsificações perderem valor. Para contornar a situação, o falsificador começa a aperfeiçoar as imitações, tentando chegar mais próximo das obras reais para enganar o investigador, que por sua vez precisa melhorar seus métodos para identificar obras falsas.
No caso de GANs, o falsificador e o investigador são redes neurais, chamadas respectivamente de gerador e discriminador. O papel do discriminador é receber uma imagem que pode ter vindo de um banco de dados real ou produzidas pelo gerador e tentar identificar a origem dessa imagem. Já o papel do gerador é tentar produzir uma imagem que engane o discriminador, de forma que ele acredite que a imagem veio do banco de dados. Fazendo essas redes competirem é possível treinar um gerador que produza imagens artificiais muito parecidas com as contidas no banco de dados!
Um problema neste tipo de estratégia é que o resultado é altamente depende do banco de dados disponível. Como apontado por algumas pessoas, o algoritmo dos pesquisadores da Duke University tem uma forte tendência de retornar imagens de pessoas caucasianas. Veja por exemplo essa imagem da atriz Lucy Liu:
Porém caso bem treinada, podemos usar redes deste tipo para diversas tarefas, não apenas para fotos de pessoas mas também para aplicações científicas como imagens médicas e de astronomia! É incrível o avanço em aprendizado de máquinas que ocorreu nos últimos anos, esperamos que este recurso seja usado em diversos tipos de tratamentos de dados.
Fonte:
Saiba Mais:
Comments