Inferência na borda com a FLIR Firefly®

Introdução

O aprendizado profundo é uma nova tecnologia que está revolucionando os aplicativos existentes e impulsionando o desenvolvimento de novas indústrias. A disponibilidade de ferramentas da Google, Amazon, Intel e Nvidia para criar e treinar redes neurais está tornando a tecnologia mais acessível e capacitando novos concorrentes a entrar em mercados estabelecidos com produtos competitivos.

O potencial de aprendizado profundo é amplamente reconhecido. Você pode trabalhar na alavancagem do aprendizado profundo para sua aplicação agora mesmo.Na FLIR, também pensamos em maneiras de permitir que os desenvolvedores de visão de máquina aproveitem essa tecnologia. O resultado é a nossa próxima câmera FLIR Firefly®, que fornece um caminho fácil para a implantação de redes treinadas no campo. A FLIR Firefly® une a visão de máquina com inferência de aprendizado profundo, integrando um sensor de imagem Sony Pregius de alta qualidade e a Unidade de Processamento de Visão (VPU) Intel Movidius Myriad 2 com conformidade com GenICam.

  

O que é uma VPU?

A Unidade de Processamento de Visão (VPU) Intel Movidius Myriad 2 no centro da FLIR Firefly® é uma nova classe de processador. Uma VPU combina filtros de processamento de imagem de hardware de alta velocidade, núcleos de CPU de uso geral e núcleos de processamento de vetores paralelos. Os núcleos vetoriais usados para acelerar a inferência na câmera são mais otimizados para a lógica de ramificação de redes neurais do que os núcleos de uso geral encontrados nas GPUs. Esse maior grau de otimização permite que a VPU atinja um alto nível de desempenho utilizando pouca energia.

 

O que é inferência?

Inferência é a aplicação de aprendizado profundo em dados reais recém-capturados e não rotulados. É o resultado de uma rede neural treinada que faz previsões baseadas em novos dados.

Fig. 1. Inferência é a aplicação de um modelo treinado com dados rotulados (A) em novos dados não rotulados (B).

Embora existam muitos tipos diferentes de redes que podem ser usados para inferência, as MobileNets são extremamente adequadas para a classificação de imagens. A MobileNet foi originalmente projetada pelo Google para realizar classificação e segmentação de imagens de alta precisão em dispositivos móveis. Ela fornece precisão semelhante a redes muito mais dispendiosas em termos computacionais, que exigem GPUs grandes e ávidas por energia.

 

Qual é a comparação entre uma câmera de inferência e uma “câmera inteligente”?

As câmeras inteligentes tradicionais combinam uma câmera de visão de máquina e um computador de placa única que executa software de processamento de imagens baseado em regras. Câmeras inteligentes são uma ótima solução para problemas simples, como ler códigos de barras ou responder a perguntas como "Nesta parte, o buraco está onde deveria estar?" Câmeras de inferência se destacam em questões mais complexas ou subjetivas, como "Essa é uma maçã para exportação?" Quando treinadas usando boas imagens conhecidas, as câmeras de inferência podem identificar facilmente defeitos inesperados que não seriam reconhecidos por sistemas de inspeção baseados em regras, tornando-os muito mais tolerantes à variabilidade.

Câmeras de inferência podem ser usadas para aumentar os aplicativos existentes com metadados ricos e descritivos. Usando os dados do bloco GenICam, a FLIR Firefly® pode usar inferência para marcar imagens que são passadas para um host que realiza o processamento tradicional de imagens baseado em regras. Dessa forma, os usuários podem expandir rapidamente os recursos de seus sistemas de visão existentes. Essa arquitetura de sistema híbrido também pode ser usada para acionar um sistema de visão tradicional.

O uso da FLIR Firefly® se traduz em uma economia significativa de espaço, já que o hardware de computação usado em câmeras inteligentes tradicionais é menos eficiente no consumo de energia e muito maior do que a VPU na Firefly. Com apenas 27 mm x 27 mm, a FLIR Firefly está pronta para integração em espaços apertados.

A FLIR Firefly® é uma plataforma aberta. Isso dá aos usuários a flexibilidade de aproveitar o ritmo acelerado de redes de aprendizagem profundas e o conjunto de ferramentas associado para seu treinamento e otimização. Por outro lado, as câmeras inteligentes são programadas usando ferramentas proprietárias que podem retardar os avanços mais recentes.

 

Quais são as vantagens de inferência na câmera?

Permitir a inferência na borda de um sistema de visão oferece melhorias na velocidade, confiabilidade, eficiência de energia e segurança do sistema.

  • Velocidade: Inferência na borda, como outras formas de computação de borda, move o processamento de imagens para longe de um servidor central e próximo à fonte de seus dados. Em vez de transmitir imagens inteiras para um servidor remoto, apenas dados descritivos precisam ser enviados. Isso reduz muito a quantidade de dados que um sistema deve transmitir, minimizando a largura de banda da rede e a latência do sistema.
  • Confiabilidade: Para certas aplicações, a FLIR Firefly® pode eliminar a dependência do servidor e da infraestrutura de rede, aumentando sua confiabilidade. Com sua VPU integrada, a Firefly opera como um sensor independente. Pode capturar imagens e tomar decisões com base nelas e depois disparar ações usando a sinalização GPIO.
  • Eficiência de energia:Disparar um sistema de visão somente quando necessário significa que mais tempo de processamento pode ser gasto em processamento e análise de imagens tradicionais baseadas em regras. A inferência de aprendizado profundo pode ser usada para acionar a análise de imagens de alta potência quando condições específicas são atendidas. A VPU Myriad 2 oferece economia de energia adicional ao suportar redes em cascata. Isso permite vários níveis de análise, com redes mais complexas e de maior potência sendo chamadas apenas se atenderem às condições da rede anterior.
  • Segurança:A pequena quantidade de dados que é transmitida é facilmente criptografada, melhorando a segurança do sistema.

 

Como eu começo?

A FLIR Firefly fornece um caminho fácil para levar o aprendizado profundo de P&D para o trabalho no seu aplicativo. Ela está pronto para funcionar como um sensor independente, capturando imagens e tomando decisões com base nelas que acionam ações do GPIO. A FLIR Firefly estará disponível em 2019, mas você pode começar a inferência hoje mesmo. A VPU Intel Myriad 2 no coração da próxima FLIR Firefly está disponível no Intel Neural Compute Stick.

Uma inferência completa no sistema de visão de borda pode ser construída por menos de US$ 1000 usando o Intel Neural Compute Stick. Juntamente com o kit de ferramentas Intel OpenVINO, os desenvolvedores de sistemas de visão podem otimizar e validar facilmente o desempenho de redes neurais na mesma VPU que aciona a inferência na câmera na FLIR Firefly®. Isso permite que os usuários avaliem com precisão o desempenho da inferência do Myriad 2 em paralelo aos algoritmos tradicionais usando as mesmas câmeras.

  

Fig. 2. Passando do treinamento da GPU para o desenvolvimento do Neural Compute Stick, para a implantação da FLIR Firefly®

 

Conclusão

A inferência de aprendizado profundo mudará fundamentalmente a forma como os sistemas de visão são projetados e programados. Permitirá que decisões complexas e subjetivas sejam tomadas com mais rapidez e precisão do que seria possível usando abordagens tradicionais baseadas em regras. A FLIR Firefly une visão de máquina com aprendizado profundo, combinando um sensor Sony Pregius, interface GenICam e uma VPU Intel Movidius Myriad 2. Essa nova classe de câmeras de inferência fornece o caminho ideal para implantar a inferência de aprendizagem profunda em aplicativos de visão de máquina. Você pode começar a desenvolver para a FLIR Firefly® hoje com o Intel Neural Compute Stick.

Artigos Relacionados