Campo DC | Valor | Idioma |
dc.contributor.advisor | Vidal, Flávio de Barros | - |
dc.contributor.author | Almeida, Ana Paula Gonçalves Soares de | - |
dc.date.accessioned | 2022-10-13T21:00:02Z | - |
dc.date.available | 2022-10-13T21:00:02Z | - |
dc.date.issued | 2022-10-13 | - |
dc.date.submitted | 2022-07-01 | - |
dc.identifier.citation | ALMEIDA, Ana Paula Gonçalves Soares de. An exploratory assessment of multistream deep neural network fusion: design and applications. 2022. xi, 106 f., il. Tese (Doutorado em Ciências Mecânicas) — Universidade de Brasília, Brasília, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.unb.br/handle/10482/45041 | - |
dc.description | Tese (doutorado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Mecânica, 2022. | pt_BR |
dc.description.abstract | Os métodos de aprendizado de máquina dependem muito de quão bom o extrator de
características selecionado pode representar os dados brutos de entrada. Atualmente, temos
mais dados e capacidade computacional para lidar com isso. Com as Redes Neurais Convolucionais temos uma rede que é mais fácil de treinar e generaliza muito melhor do que o
habitual. Há, no entanto, uma boa quantidade de características que são essenciais, mas são
descartadas nesse processo, mesmo quando se utiliza uma CNN poderosa. As Redes Neurais
Convolucionais Multistream podem processar mais de uma entrada usando fluxos separados
e são projetadas usando qualquer arquitetura CNN clássica como base. O uso de M-CNNs
gera mais informação de características e, assim, melhora o resultado geral. Este trabalho
explorou arquiteturas M-CNNs e como os sinais de fluxo se comportam durante o processamento, chegando a uma nova estratégia de fusão cruzada de M-CNNs. O novo módulo é
validado, inicialmente, com um conjunto de dados padrão, CIFAR-10, e comparado com as
redes correspondentes (single-stream CNN e late fusion M-CNN). Os primeiros resultados
neste cenário mostraram que nosso modelo adaptado superou todos os modelos mencionados
acima em pelo menos 28% em comparação com todos os modelos testados. Expandindo o
teste, usamos a base de antigas redes estado-da-arte na classificação de imagens e conjuntos
de dados adicionais para investigar se a técnica pode colocar essas estruturas de volta ao
jogo. No conjunto de dados NORB, mostramos que podemos aumentar a precisão em até
63, 21% quando comparado às estruturas básicas de M-CNNs. Variando nossas aplicações,
o mAP@75 do conjunto de dados de detecção e reconhecimento de objetos BDD100K melhorou em 50, 16% em comparação com sua versão não adaptada, mesmo quando treinado do
zero. A fusão proposta demonstrou robustez e estabilidade, mesmo quando distratores foram
usados como entradas. Embora nosso objetivo seja reutilizar arquiteturas estado-da-arte anteriores com poucas modificações, também expomos as desvantagens de nossa estratégia
explorada. | pt_BR |
dc.language.iso | Inglês | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | An exploratory assessment of multistream deep neural network fusion : design and applications | pt_BR |
dc.type | Tese | pt_BR |
dc.subject.keyword | Aprendizagem de máquina | pt_BR |
dc.subject.keyword | Redes neurais convolucionais | pt_BR |
dc.subject.keyword | Arquitetura de computador | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.description.abstract1 | Machine-learning methods depend heavily on how well the selected feature extractor can
represent the raw input data. Nowadays, we have more data and computational capacity to
deal with it. With Convolutional Neural Networks, we have a network that is easier to train
and generalizes much better than usual. However, a good amount of essential features are
discarded in this process, even when using a powerful CNN. Multistream Convolutional Neural Networks can process more than one input using separate streams and are designed using
any classical CNN architecture as a base. The use of M-CNNs generates more features and
thus, improves the overall outcome. This work explored M-CNNs architectures and how the
stream signals behave during the processing, coming up with a novel M-CNN cross-fusion
strategy. The new module is first validated with a standard dataset, CIFAR-10, and compared
with the corresponding networks (single-stream CNN and late fusion M-CNN). Early results
on this scenario showed that our adapted model outperformed all the abovementioned models
by at least 28% compared to all tested models. Expanding the test, we used the backbones of
former state-of-the-art networks on image classification and additional datasets to investigate
if the technique can put these designs back in the game. On the NORB dataset, we showed
that we could increase accuracy up to 63.21% compared to basic M-CNNs structures. Varying our applications, the mAP@75 of the BDD100K multi-object detection and recognition
dataset improved by 50.16% compared to its unadapted version, even when trained from
scratch. The proposed fusion demonstrated robustness and stability, even when distractors
were used as inputs. While our goal is to reuse previous state-of-the-art architectures with
few modifications, we also expose the disadvantages of our explored strategy. | pt_BR |
dc.contributor.email | anapaula.gsa@gmail.com | pt_BR |
dc.description.unidade | Faculdade de Tecnologia (FT) | pt_BR |
dc.description.unidade | Departamento de Engenharia Mecânica (FT ENM) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Ciências Mecânicas | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|